发明公开
- 专利标题: 视觉感知模型训练方法、装置、设备及存储介质
-
申请号: CN202210769935.0申请日: 2022-06-30
-
公开(公告)号: CN115205628A公开(公告)日: 2022-10-18
- 发明人: 张珂 , 杨峻伟 , 崔兆林 , 苏金明 , 罗钧峰 , 魏晓明 , 魏晓林
- 申请人: 北京三快在线科技有限公司
- 申请人地址: 北京市海淀区北四环西路9号2106-030
- 专利权人: 北京三快在线科技有限公司
- 当前专利权人: 北京三快在线科技有限公司
- 当前专利权人地址: 北京市海淀区北四环西路9号2106-030
- 代理机构: 北京三高永信知识产权代理有限责任公司
- 代理商 谢冬寒
- 主分类号: G06V10/774
- IPC分类号: G06V10/774 ; G06V10/772 ; G06V10/764 ; G06V10/26 ; G06V10/40 ; G06V10/74
摘要:
本申请公开了一种视觉感知模型训练方法、装置、设备及存储介质,属于计算机视觉技术领域。该方法先获取多个单实例样本图像,然后对每个单实例样本图像分别进行第一数据增强处理和第二数据增强处理,得到第一处理图像和第二处理图像,对从多个单实例样本图像中选取的M个单实例样本图像进行拼接处理,得到多实例样本图像,分别对第一处理图像、多实例样本图像、第二处理图像和M个单实例样本图像进行特征提取,得到对应的图像特征,基于这些图像特征,进行模型训练,得到视觉感知模型。由于训练模型的图像特征不仅包括单实例样本图像的图像特征,还包括多实例样本图像的图像特征,因此,可以提高模型的泛化能力。