-
公开(公告)号:CN112070075A
公开(公告)日:2020-12-11
申请号:CN202011264121.9
申请日:2020-11-12
Applicant: 之江实验室
Abstract: 本发明公开一种基于协同回归的人体检测方法,该方法首先预训练深度卷积神经网络骨干模型;然后在模型的输出特征层分别预测人头中心点、人体中心点及对应人体宽高;同时在模型的输出特征层分别回归指向人体中心点的向量和指向人头中心点的向量;训练最小化损失函数,得到人体检测模型;最后将测试集图片输入训练好的模型,利用人头中心点、人体中心点预测值及两者互相指向的向量确定人体位置,结合人体宽高预测值得到人体检测结果。本发明通过充分考虑人群密集场景人体检出率低的问题,利用人群密集场景中人头相较于人体不易产生互相遮挡的特点,提出基于人头中心点、人体中心点协同回归的人体检测方法,在人群密集场景中的人体检出率高。
-
公开(公告)号:CN112069929A
公开(公告)日:2020-12-11
申请号:CN202010842782.9
申请日:2020-08-20
Applicant: 之江实验室
Abstract: 本发明公开了一种无监督行人重识别方法、装置、电子设备及存储介质,该方法包括:在带标签的源域数据集中预训练行人重识别模型;利用所述模型提取无标签目标域中训练集的训练特征;根据所述训练特征,基于自适应聚类的方法将目标域训练集分为若干簇,并分配对应的伪标签;将每个簇设定为一个原型,在原型中挑选出与原型中心的距离小于设定阈值的样本,并利用所述样本的训练特征和伪标签对所述模型进行再训练,得到更新参数后的行人重识别模型;将目标域的查询集和待选集输入到所述模型中,分别得到二者的测试特征,根据测试特征的相似度从待选集中选出符合查询图片要求的图片。本发明有效缓解了域间隔问题,提高了跨域行人重识别的准确度。
-
公开(公告)号:CN111626276B
公开(公告)日:2020-10-30
申请号:CN202010750662.6
申请日:2020-07-30
Applicant: 之江实验室
Abstract: 本发明公开了一种基于两级神经网络的工鞋穿戴检测方法及装置,包括:获取监控视频的图片数据集;对图片数据集中包含的鞋子目标和人体目标进行标注,得到标注数据集;构建两级神经网络模型,所述两级神经网络模型由一级人体检测网络模型和二级鞋子检测网络模型级联而成,二级鞋子检测网络模型的输入为一级人体检测网络模型的输出;将待检测的图片输入到所述两级神经网络模型中,输出人体框位置、鞋子位置相对人体框的偏移和穿戴工鞋的置信度;根据人体框位置、鞋子位置相对人体框的偏移,计算得到鞋子的位置,结合置信度判断是否穿戴工鞋。该方法克服了视频中工作人员的鞋子目标较小导致检测召回率低的问题,可用于工厂中工作人员工鞋穿戴检测。
-
公开(公告)号:CN111626276A
公开(公告)日:2020-09-04
申请号:CN202010750662.6
申请日:2020-07-30
Applicant: 之江实验室
Abstract: 本发明公开了一种基于两级神经网络的工鞋穿戴检测方法及装置,包括:获取监控视频的图片数据集;对图片数据集中包含的鞋子目标和人体目标进行标注,得到标注数据集;构建两级神经网络模型,所述两级神经网络模型由一级人体检测网络模型和二级鞋子检测网络模型级联而成,二级鞋子检测网络模型的输入为一级人体检测网络模型的输出;将待检测的图片输入到所述两级神经网络模型中,输出人体框位置、鞋子位置相对人体框的偏移和穿戴工鞋的置信度;根据人体框位置、鞋子位置相对人体框的偏移,计算得到鞋子的位置,结合置信度判断是否穿戴工鞋。该方法克服了视频中工作人员的鞋子目标较小导致检测召回率低的问题,可用于工厂中工作人员工鞋穿戴检测。
-
公开(公告)号:CN111598066A
公开(公告)日:2020-08-28
申请号:CN202010722851.2
申请日:2020-07-24
Applicant: 之江实验室
Abstract: 本发明公开了一种基于级联预测的安全帽佩戴识别方法,该方法将安全帽佩戴识别分为行人检测、目标跟踪和安全帽佩戴分类三个步骤。在行人检测时,通过基于深度卷积神经网络的检测算法来获取视频每一帧图像中行人目标框的位置;基于行人检测的结果,采用卡尔曼滤波和匈牙利算法进行轨迹关联以得到优化后的行人目标框;对于每一个目标框内的行人,通过一个基于深度卷积神经网络的二分类器来判断其是否佩戴安全帽。本发明采用三个模块级联预测的方式,实现方法简单,可移植性强,能够实现对监控摄像头拍摄的厂区、工地等作业场所中工作人员是否佩戴安全帽的精准识别。
-
公开(公告)号:CN119854461A
公开(公告)日:2025-04-18
申请号:CN202510323452.1
申请日:2025-03-19
Applicant: 之江实验室
IPC: H04N7/20 , H04N19/17 , H04N19/146 , H04N19/14 , G06T9/00
Abstract: 本公开提供一种遥感图像传输方法,所述方法包括:获取遥感图像;将遥感图像划分为多个设定大小的图像块,并根据图像块得到图像序列;将图像序列包含的各个图像块分别输入基于残差网络结构的卷积神经网络,得到卷积神经网络包含的多个阶段分别输出的相应语义层级的特征图;其中,各个语义层级的特征图对应不同的分辨率和通道数,且每个语义层级的特征图融合了不同尺度的空间特征;对各个语义层级的特征图形成的特征图队列进行信道编码,以在信道中传输编码结果。本公开实现仅传输对目标检测任务具有实际意义的数据,从而显著减少遥感图像传输时的数据传输量,解决遥感图像传输中的带宽限制问题,兼顾遥感图像传输效率和检测精度。
-
公开(公告)号:CN119474440A
公开(公告)日:2025-02-18
申请号:CN202510045978.8
申请日:2025-01-13
Applicant: 之江实验室
IPC: G06F16/583 , G06F16/53 , G06F16/54
Abstract: 本申请涉及一种面向遥感图像的视觉理解方法、装置、系统、设备和介质。包括:提取待理解遥感图像的结构化信息,并基于结构化信息生成与待理解遥感图像对应的图像信息数据库;获取针对待理解遥感图像的初始提示指令,基于初始提示指令确定待检索元素,基于待检索元素从图像信息数据库中进行检索,得到对应的目标结构化信息,根据目标结构化信息与初始提示指令,生成目标提示指令;将目标提示指令输入至训练完备的大语言模型中,得到对待理解遥感图像的理解结果。采用本方法能够提高对遥感图像理解的准确度。
-
公开(公告)号:CN118378592A
公开(公告)日:2024-07-23
申请号:CN202410803845.8
申请日:2024-06-20
Applicant: 之江实验室
IPC: G06F40/117 , G06N5/04 , G06F40/151
Abstract: 本说明书公开了一种基于公式学习的大模型微调方法、装置及存储介质,获取包含公式的原始文本中的公式和公式的候选变量。针对每个公式,根据该公式的上下文内容,确定目标文本并确定目标文本中的候选变量,在该公式中确定与候选变量一致的匹配变量,根据包含候选变量的语句确定解释文本。将目标文本的解释文本和匹配变量屏蔽,得到任务文本,根据公式和解释文本确定任务文本的标注。将任务文本和任务提示输入大模型得到预测文本,根据预测文本与标注的差异微调大模型。通过屏蔽目标文本的解释文本和匹配变量,对大模型进行微调,使大模型学习到公式中的变量与其解释之间的对应关系,从而在问答任务中提高大模型对涉及公式计算问题的回答准确率。
-
公开(公告)号:CN117252930B
公开(公告)日:2024-05-28
申请号:CN202311222096.1
申请日:2023-09-21
Applicant: 之江实验室
IPC: G06T7/80
Abstract: 本发明公开了一种大型展厅多相机监控系统内外参标定方法和系统,包括以下步骤:获取多相机视频数据作为标定数据;对标定数据进行预处理;进行单目相机标定得到相机内参初值;使用链式法进行相机外参初步估计得到每个相机相对于世界坐标系的位姿作为相机外参初值;进行标定板位姿初步估计得到每个特定姿态下的标定板位姿初值;构造总重投影误差作为目标函数并引入基于畸变参数的正则项;使用相机内参初值、相机外参初值和标定位板位姿初值,最小化带有正则项的目标函数以求解全局优化问题,得到最优相机内外参数。本发明能够减小人工成本和风险,提高相机内外参标定的准确性,适用于高空悬挂或处于开阔空间中的多相机系统内外参标定应用场景。
-
公开(公告)号:CN114022727B
公开(公告)日:2024-04-26
申请号:CN202111221950.3
申请日:2021-10-20
Applicant: 之江实验室
IPC: G06V10/774 , G06V10/82 , G06N3/0464 , G06N3/09
Abstract: 本发明公开了本发明公开一种基于图像知识回顾的深度卷积神经网络自蒸馏方法,该方法首先针对目标网络设置辅助网络,在目标网络的下采样层引出分支,采用知识回顾的思路依次融合和连接各个分支,在训练过程中,通过监督学习以及采用目标网络的下采样层向引出分支层进行学习的方式,达到自蒸馏的目的。本发明在深度卷积神经网络自蒸馏领域引入知识回顾的思路,提高了深度卷积神经网络的训练精度;采用辅助网络的形式进行自蒸馏,相对使用数据增强来拉进类内距离的自蒸馏方法,在实际应用中更加简洁方便。
-
-
-
-
-
-
-
-
-