单目标追踪方法、装置及系统

    公开(公告)号:CN110956131B

    公开(公告)日:2024-01-05

    申请号:CN201911196504.4

    申请日:2019-11-27

    发明人: 吴晶晶 邱熙

    摘要: 本发明提供了一种单目标追踪方法、装置及系统,涉及计算机视觉技术领域,该方法应用于配置有追踪网络的设备;追踪网络包括主干网络、STN和相似性度量层;该方法包括:获取待追踪的帧图像和包含有目标对象的模板图像;通过主干网络提取模板图像的模板特征图和帧图像的第一特征图;通过STN对第一特征图进行特征偏移,得到第二特征图;通过相似性度量层计算模板特征图和第二特征图之间的第一相似性得分图,并基于第一相似性得分图在帧图像中确定目标对象的回归框。本发明能够有效提升目标对象的回归框的准确性和目标追踪的准确性。

    模型训练方法、目标检测方法及对应装置

    公开(公告)号:CN113095133B

    公开(公告)日:2023-12-29

    申请号:CN202110243087.5

    申请日:2021-03-04

    发明人: 马宇宸 黎泽明

    摘要: 本申请涉及目标检测技术领域,提供一种模型训练方法、目标检测方法及对应装置。其中,模型训练方法包括:利用特征提取模块提取训练图像的特征图;利用密集预测模块针对特征图中的每个像素点预测对应的检测框及其类别分数;利用质量分布编码模块根据特征图以及训练图像中的真实框预测质量分布的分布参数;利用质量分布采样模块根据质量分布进行采样,确定多个采样点中的正样本点,并计算得到每个正样本点对应的检测框及其类别分数;计算并根据第一损失更新质量分布编码模块以及特征提取模块的参数;计算并根据第二损失更新密集预测模块以及特征提取模块的参数。该方法有利于提高目标检测模型的检测效果。

    视频中人物真伪的检测方法、装置、电子设备及存储介质

    公开(公告)号:CN111444873B

    公开(公告)日:2023-12-12

    申请号:CN202010255481.6

    申请日:2020-04-02

    IPC分类号: G06V20/40

    摘要: 本申请提供了一种视频中人物真伪检测方法、装置、电子设备及计算机存储介质,该方法包括:获取待检测视频;提取待检测视频中包含人物的视频关键帧和/或视频关键片段;基于视频关键帧和/或视频关键片段,采用至少两种真伪检测策略对待检测视频中的人物进行多模态信息的真伪检测,得到各检测策略对应的检测结果;基于各检测策略对应的检测结果,确定待检测视频中人物的真伪检测结果。在该方案中,从人物的语音信息、面部信息、肢体动作信息、以及至少两种真伪检测策略等多个维度进行人物真伪的检测,使得最终得到的真伪检测结果考虑了多个维度的因素对真伪检测结果的影响,进而使得真伪检测结果更准确。

    一种人脸图像增强方法、装置、系统及存储介质

    公开(公告)号:CN111008935B

    公开(公告)日:2023-12-12

    申请号:CN201911060534.2

    申请日:2019-11-01

    发明人: 杨骏锋

    IPC分类号: G06T5/00

    摘要: 本发明提供了一种人脸图像增强方法、装置、系统及存储介质,方法包括:对原始图像进行人脸检测得到人脸检测框;根据人脸检测框和三维人脸模型,确定人脸检测框中的人脸图像所对应的三维人脸信息;基于原始图像和人脸三维模型,对原始图像中的人脸图像进行处理,能充分利用人脸三维信息,提高图像处理的准确率,另外通过原始图像进行图像处理可大大减少人脸失真模糊,有利于提升图像处理效果。根据本发明的方法、装置、系统及存储介质,基于原始图像和人脸三维模型,对原始图像中的人脸图像进行处理,能充分利用人脸三维信息,提高图像处理的准确率,另外通过原始图像进行图像处理可大大减少人脸失真模糊,有利于提升图像处理效果。

    图文对话方法、电子设备、存储介质及程序产品

    公开(公告)号:CN117076624A

    公开(公告)日:2023-11-17

    申请号:CN202310954154.3

    申请日:2023-07-31

    摘要: 本申请提供了一种图文对话方法、电子设备、存储介质及程序产品,涉及图文对话技术领域。所述方法包括:获得第一对话信息;将所述第一对话信息输入目标图文对话模型,得到所述第一对话信息对应的第一对话响应信息;其中,所述第一对话响应信息包括图片信息、文字信息或者图文混杂信息中的任意一种,其中,所述目标图文对话模型是基于样本对话信息和对应的样本对话响应信息组成的样本对话信息对训练得到的,所述样本对话响应信息至少包括图文混杂的对话响应信息。本申请实施例中,目标图文对话模型具有图文交杂生成的能力,可以生成图像和文本交融的图文并茂的内容,从而丰富了人机交互内容。

    神经网络的训练方法、图像识别方法、装置及电子设备

    公开(公告)号:CN111291887B

    公开(公告)日:2023-11-10

    申请号:CN202010155120.4

    申请日:2020-03-06

    发明人: 廖望

    IPC分类号: G06N3/08 G06V10/46 G06V10/82

    摘要: 本发明提供了一种神经网络的训练方法、图像识别方法、装置及电子设备,涉及人工智能技术领域,包括:获取训练样本;其中,所述训练样本中包含多个负样本对,其中,每个负样本对包括目标带标签图像和其相对应的目标无标签图像,所述每个负样本对中的目标无标签图像所包含的第一对象和目标带标签图像所包含第二对象不相同,且所述第一对象和所述第二对象相似;基于所述训练样本对初始重识别网络进行训练,训练之后得到目标重识别网络,本申请缓解了传统的训练方法导致目标重识别网络对难负样本的判别能力不足的技术问题。

    仓储系统、用于仓储系统的穿梭车及其导航方法

    公开(公告)号:CN114030805B

    公开(公告)日:2023-11-03

    申请号:CN202111122441.5

    申请日:2021-09-24

    发明人: 徐磊

    IPC分类号: B65G1/137 B65G1/04

    摘要: 本发明的实施例提供了一种仓储系统、用于仓储系统的穿梭车及其导航方法。穿梭车设置有存储器、通信装置、定位传感器、摄像装置和控制器。存储器用于存储仓储系统的拓扑地图,其中拓扑地图的每个节点包括仓储系统内对应停车位的位置标识信息;通信装置用于接收行驶路线指令,行驶路线指令包括从出发点到目的地的行驶路线信息;定位传感器用于在穿梭车行驶过程中获取穿梭车的当前位置信息;摄像装置用于在穿梭车行驶过程中采集仓储系统的图像;控制器用于基于拓扑地图和行驶路线信息控制穿梭车从出发点行驶到目的地。由此,该穿梭车具有控制平滑、定位效率以及定位精度更高,便于大规模仓库使用等优点。

    神经网络模型训练方法及装置、图像识别方法及装置

    公开(公告)号:CN111401521B

    公开(公告)日:2023-10-31

    申请号:CN202010168707.9

    申请日:2020-03-11

    发明人: 李亮亮

    摘要: 本发明提供了一种神经网络模型训练方法及装置、图像识别方法及装置,涉及深度学习技术领域,该方法包括:从第一训练样本集获取目标样本,利用神经网络模型对目标样本进行特征提取,得到目标样本的个体特征,利用神经网络模型对第二训练样本集中的各样本进行特征提取,得到第二训练样本集对应的群体特征;群体特征包括第二训练样本集中每个样本的个体特征;基于目标样本的个体特征和群体特征确定目标样本对应的损失值;基于目标样本对应的损失值,对神经网络模型的参数进行迭代更新。本发明提升了训练后的神经网络模型的识别精度。

    图像处理方法、装置、电子设备及存储介质

    公开(公告)号:CN111915505B

    公开(公告)日:2023-10-27

    申请号:CN202010561242.3

    申请日:2020-06-18

    发明人: 王涛

    IPC分类号: G06T5/00 G06T5/50

    摘要: 本发明提供了一种图像处理方法、装置、电子设备及存储介质,该方法包括:根据预览图像确定当前曝光状态;分别获取与当前曝光状态对应的不同的第一曝光值的主摄图像,并获取与当前曝光状态对应的第二曝光值的副摄图像;对不同的第一曝光值的主摄图像进行HDR图像融合,得到HDR融合图像;将第一曝光值为第二曝光值的主摄图像和副摄图像分别进行多帧融合去噪,得到主副摄融合去噪图像;根据主副摄融合去噪图像分离出主摄融合去噪图像中的主体区域,并对HDR融合图像进行虚化处理,得到虚化HDR图像;将虚化HDR图像的主体区域替换为所述主摄融合去噪图像中的主体区域,得到目标图像。本发明可以提高夜景环境下的背景虚化的效果。