-
公开(公告)号:CN111967314B
公开(公告)日:2024-06-11
申请号:CN202010658452.4
申请日:2020-07-09
Applicant: 北京迈格威科技有限公司
IPC: G06V40/10 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本申请实施例提供了行人重识别方法、装置,该方法包括:获取待重识别的行人的可见光行人图像和红外光行人图像;将获取的待重识别的行人的可见光行人图像和该红外光行人图像输入到多模态融合识别网络,得到该行人的行人重识别结果,多模态融合识别网络被配置为:将从该可见光行人图像提取的该行人的可见光行人特征和从该红外光行人图像提取的该行人的红外光行人特征进行融合,得到该行人的双光融合行人特征;基于该行人的多模态行人特征和预设特征底库中的多个行人特征,对该行人进行行人重识别,得到该行人的行人重识别结果。全天候对待重识别的行人进行较为准确的行人重识别并且提升行人重识别结果的准确性。
-
公开(公告)号:CN117392400A
公开(公告)日:2024-01-12
申请号:CN202311255571.5
申请日:2023-09-26
Applicant: 北京迈格威科技有限公司
Abstract: 本申请提供了一种目标对象检测方法、电子设备及存储介质,包括:获取从不同视角所采集的目标对象所在3D空间的多个图像;对多个图像进行特征提取,得到不同视角下的多个2D图像特征;针对每个2D图像特征,将2D图像特征变换到3D空间,得到N个变换3D特征,以及,对2D图像特征进行处理,得到N个3D体素在3D空间中的深度分布信息;将变换3D特征和深度分布信息进行融合,得到3D空间的3D占用体素信息;基于3D占用体素信息对3D空间进行目标对象检测,得到目标对象的检测结果。基于该方法,不需要3D信号输入,有效地利用不同视角的多个图像中隐含的深度信息来生成高精度的3D占用体素信息,实现目标对象检测。
-
公开(公告)号:CN116485943A
公开(公告)日:2023-07-25
申请号:CN202310286679.4
申请日:2023-03-22
Applicant: 北京迈格威科技有限公司
IPC: G06T11/60 , G06V10/75 , G06F16/583
Abstract: 本申请实施例提供了一种图像生成方法、电子设备及存储介质,该方法包括:生成与提示文本对应的至少一张图像;生成每张图像的初始文字说明;提取提示文本中的实体词,并确定每个实体词所表征的物体在每张图像中的目标检测结果;根据每张图像的目标检测结果和初始文字说明,生成每张图像的目标文字说明;针对每张图像,将提示文本与图像的目标文字说明进行匹配,得到匹配结果;在不存在满足目标条件的匹配结果时,根据目标文字说明对提示文本进行更新,并基于更新后的提示文本,迭代执行上述各步骤,直至存在满足所述目标条件的匹配结果;从匹配结果满足所述目标条件的至少一张图像中确定目标图像。本申请实施例可以提高图像的生成效率。
-
公开(公告)号:CN115984093A
公开(公告)日:2023-04-18
申请号:CN202211397790.2
申请日:2022-11-09
Applicant: 北京迈格威科技有限公司
IPC: G06T3/00 , G06T7/50 , G06N3/0464 , G06N3/088
Abstract: 本申请实施例提供一种基于红外图像的深度估计方法、电子设备以及存储介质。该方法包括:获取待处理红外图像;将待处理红外图像输入目标深度估计模型,获得对应的第一深度估计结果,第一深度估计结果是与待处理红外图像中的每个像素的深度相关的信息;基于第一深度估计结果,确定待处理红外图像所对应的第一深度信息;其中,目标深度估计模型利用合成红外训练数据训练获得,合成红外训练数据包括合成红外图像和标注深度信息,合成红外图像基于标注RGB图像生成,标注深度信息是标注RGB图像所对应的深度信息。目标深度估计模型由于利用合成红外图像训练获得,因此可用的训练数据较为充足,获得的目标深度估计模型性能也较为鲁棒。
-
公开(公告)号:CN114648604A
公开(公告)日:2022-06-21
申请号:CN202210190169.2
申请日:2022-02-28
Applicant: 北京旷视科技有限公司 , 北京迈格威科技有限公司
Abstract: 本申请提供了一种图像渲染方法、电子设备、存储介质及程序产品,涉及数字图像处理技术领域,旨在快速渲染出高质量的图像。所述方法包括:获取第一渲染程度的初始渲染图像;获取所述初始渲染图像所对应的参考渲染图像,所述参考渲染图像为与所述初始渲染图像之间存在关联关系的图像,所述参考渲染图像为第二渲染程度的渲染图像,所述第二渲染程度高于所述第一渲染程度;利用所述参考渲染图像,对所述初始渲染图像进行纹理迁移处理,得到目标渲染图像。
-
公开(公告)号:CN110428394B
公开(公告)日:2022-04-26
申请号:CN201910516879.8
申请日:2019-06-14
Applicant: 北京迈格威科技有限公司
Abstract: 提供了一种用于目标移动侦测的方法、装置及计算机存储介质。所述方法包括:获取关键帧图像;通过全卷积检测网络,得到所述关键帧图像中的像素为目标像素点的概率值;判断所述概率值是否满足背景条件;如果所述概率值满足所述背景条件,则将所述像素标记为背景,否则标记为前景。如此可见,本发明实施例中,可以通过判断像素为目标像素点的概率值是否满足背景条件,进而确定像素是否为背景,能够快速地实现移动目标侦测,缩短侦测所需的时间,提高移动侦测的速度。
-
公开(公告)号:CN114067136A
公开(公告)日:2022-02-18
申请号:CN202111194289.1
申请日:2021-10-13
Applicant: 北京旷视科技有限公司 , 北京迈格威科技有限公司
IPC: G06V10/74 , G06V10/774 , G06V10/44 , G06K9/62
Abstract: 本发明公开一种图像匹配方法、装置、电子设备、存储介质及相关产品,包括:接收待匹配的两个图像;对于每个待匹配的图像,提取图像中的特征结构和对应的特征描述子,其中,所述特征结构包括:特征线和/或特征形状;根据所述待匹配的两个图像的特征描述子,确定所述待匹配的两个图像的特征结构是否匹配。实施上述方法,通过提取图像中包括线、形状类型的特征结构,将现有技术中需要人工标注的特征点通过线和/或形状来涵盖进来,将图像拆分成线和/或形状的特征结构的组合,以得到图像特征结构的对应关系,避免了人工标注的复杂步骤,提高了图像匹配的速度和准确度,可以有效的适用于大数据量图像匹配的场景中。
-
公开(公告)号:CN113902657A
公开(公告)日:2022-01-07
申请号:CN202110990427.0
申请日:2021-08-26
Applicant: 北京旷视科技有限公司 , 北京迈格威科技有限公司
Abstract: 本发明提供了一种图像拼接方法、装置和电子设备,获取待拼接的第一图像和第二图像;确定第一图像和第二图像的初始拼接图像;利用第一神经网络模型对初始拼接图像中的目标重叠区域进行融合处理,得到目标重叠区域所对应的融合重叠区域;基于融合重叠区域和初始拼接图像,确定第一图像和第二图像所对应的目标拼接图像。该方式中,在确定第一图像和第二图像的初始拼接图像后,采用第一神经网络模型对初始拼接图像中的目标重叠区域进行融合处理,得到对应的融合重叠区域,不需要基于CPU对初始拼接图像中的每个像素进行融合相关计算,节省了对初始拼接图像中所有像素进行融合计算的时间,提高了融合处理效率,进而提高了图像拼接的处理效率。
-
公开(公告)号:CN113780058A
公开(公告)日:2021-12-10
申请号:CN202110839348.X
申请日:2021-07-23
Applicant: 北京旷视科技有限公司 , 北京迈格威科技有限公司
Abstract: 本发明的实施例提供了一种用于确定视频中多目标轨迹的方法、装置、系统及存储介质。方法包括:对当前的视频帧进行目标检测,以获得当前的视频帧中的所有目标的检测框。依据先前的视频帧中的目标的轨迹,预测当前的视频帧中的对应目标的预测框。分别计算检测框和预测框之间的相似度,以获得原始匹配数据。将原始匹配数据输入匹配神经网络,以由匹配神经网络输出检测框和轨迹之间的最终匹配数据。根据最终匹配数据,将检测框存储到相匹配的轨迹。实现了端到端地确定视频中多目标轨迹。不存在迭代的计算过程,提高了计算效率。此外,可以利用GPU进行计算加速,针对视频帧中的所有目标可以并行计算,进一步大大提升确定视频中多目标轨迹的计算速度。
-
公开(公告)号:CN111967314A
公开(公告)日:2020-11-20
申请号:CN202010658452.4
申请日:2020-07-09
Applicant: 北京迈格威科技有限公司
Abstract: 本申请实施例提供了行人重识别方法、装置,该方法包括:获取待重识别的行人的可见光行人图像和红外光行人图像;将获取的待重识别的行人的可见光行人图像和该红外光行人图像输入到多模态融合识别网络,得到该行人的行人重识别结果,多模态融合识别网络被配置为:将从该可见光行人图像提取的该行人的可见光行人特征和从该红外光行人图像提取的该行人的红外光行人特征进行融合,得到该行人的双光融合行人特征;基于该行人的多模态行人特征和预设特征底库中的多个行人特征,对该行人进行行人重识别,得到该行人的行人重识别结果。全天候对待重识别的行人进行较为准确的行人重识别并且提升行人重识别结果的准确性。
-
-
-
-
-
-
-
-
-