视觉感知模型训练方法、装置、设备及存储介质

发明公开

CN115205628A 视觉感知模型训练方法、装置、设备及存储介质审中-实审

请登陆查看更多内容

专利标题： 视觉感知模型训练方法、装置、设备及存储介质
申请号： CN202210769935.0

申请日： 2022-06-30
公开(公告)号： CN115205628A

公开(公告)日： 2022-10-18
发明人: 张珂 , 杨峻伟 , 崔兆林 , 苏金明 , 罗钧峰 , 魏晓明 , 魏晓林
申请人： 北京三快在线科技有限公司
申请人地址： 北京市海淀区北四环西路9号2106-030
专利权人： 北京三快在线科技有限公司
当前专利权人： 北京三快在线科技有限公司
当前专利权人地址： 北京市海淀区北四环西路9号2106-030
代理机构： 北京三高永信知识产权代理有限责任公司
代理商 谢冬寒
主分类号： G06V10/774
IPC分类号： G06V10/774 ; G06V10/772 ; G06V10/764 ; G06V10/26 ; G06V10/40 ; G06V10/74

摘要：

本申请公开了一种视觉感知模型训练方法、装置、设备及存储介质，属于计算机视觉技术领域。该方法先获取多个单实例样本图像，然后对每个单实例样本图像分别进行第一数据增强处理和第二数据增强处理，得到第一处理图像和第二处理图像，对从多个单实例样本图像中选取的M个单实例样本图像进行拼接处理，得到多实例样本图像，分别对第一处理图像、多实例样本图像、第二处理图像和M个单实例样本图像进行特征提取，得到对应的图像特征，基于这些图像特征，进行模型训练，得到视觉感知模型。由于训练模型的图像特征不仅包括单实例样本图像的图像特征，还包括多实例样本图像的图像特征，因此，可以提高模型的泛化能力。

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类:

G	物理
G06	计算；推算或计数
G06V	图像或视频识别或理解
G06V10/00	图像或视频识别或理解的安排（图像或视频中的字符识别 G06V30/10）
G06V10/70	.使用模式识别或机器学习（光学模式识别或电子计算 G06V10/88）
G06V10/77	..处理特征空间中的图像或视频特征；使用数据集成或数据缩减，例如主成分分析 [PCA] 或独立成分分析 [ICA] 或自组织图 [SOM]；盲源分离
G06V10/774	...生成训练模式集；引导方法，例如捕获或促进