摆盘图像的生成方法、图像生成模型的训练方法及装置

    公开(公告)号:CN112966617B

    公开(公告)日:2022-10-21

    申请号:CN202110266639.4

    申请日:2021-03-11

    摘要: 本申请实施例提供了一种摆盘图像的生成方法、图像生成模型的训练方法及装置,涉及机器学习和图像识别技术领域。所述摆盘图像的生成方法包括:获取目标餐品的原始图像;基于原始图像获取目标餐品的餐品信息,餐品信息用于指示目标餐品的相关特征;基于原始图像和餐品信息,生成目标餐品的摆盘图像。本申请实施例提供的技术方案,使得用户可以根据自动生成的摆盘图像,对目标餐品进行摆盘,相比于对各个餐品手动设计对应的摆盘方案,降低了确定摆盘方案所需的成本。

    基于图像的字符识别方法、装置、设备及存储介质

    公开(公告)号:CN115019309A

    公开(公告)日:2022-09-06

    申请号:CN202210724527.3

    申请日:2022-06-23

    摘要: 本申请公开了一种基于图像的字符识别方法、装置、设备及存储介质,属于计算机技术领域。方法包括:对目标图像进行特征提取,得到视觉特征;对所述视觉特征进行识别,得到所述目标图像对应的多个候选识别结果,所述候选识别结果包括识别出的多个字符;确定所述多个候选识别结果中多个字符的语义相关性特征;基于所述多个候选识别结果中多个字符的语义相关性特征,从所述多个候选识别结果中确定所述目标图像的字符识别结果,该方法能够减少个别字符识别错误的情况,能够提高字符识别结果的准确率。

    一种模型训练的方法及装置

    公开(公告)号:CN113344198B

    公开(公告)日:2022-08-26

    申请号:CN202110641511.1

    申请日:2021-06-09

    摘要: 本说明书公开了一种模型训练的方法及装置,获取第一图像,并将第一图像输入到感知模型,以针对第一图像涉及的每个目标物,将提取出的该目标物在第一图像中对应的至少一个感兴趣图像区域进行融合,以确定该目标物在第一图像中的目标物区域,并确定第一图像涉及的目标物的识别结果,对感知模型进行训练。而后,确定该目标物在第二图像中对应的目标物区域,将第二图像输入到识别模型,得到该目标物在第二图像中的识别区域。最后,以最小化该目标物在第二图像中对应的目标物区域,与识别区域之间的偏差为优化目标,对识别模型进行训练。本方法能够提高图像对应的标注的精细程度以及准确性,进而提高了识别模型的识别准确率,以更好的完成识别任务。

    商品状态识别方法、装置、电子设备及可读存储介质

    公开(公告)号:CN109446883B

    公开(公告)日:2022-08-23

    申请号:CN201811034093.4

    申请日:2018-09-05

    摘要: 本发明提供了一种商品状态识别方法、装置、电子设备及可读存储介质,所述方法包括:获取实时状态图像,以及,获取所述实时状态图像对应的标定信息;将所述实时状态图像输入至预先训练得到的目标检测模型中,得到实时目标位置信息,所述实时目标位置信息包括实时商品位置信息;根据所述标定信息与所述实时商品位置信息确定商品状态信息,所述标定信息对应所述实时状态图像。可以根据商品状态信息表示缺货程度,有助于提高补货提示的准确性。

    菜单识别方法、装置、电子设备及存储介质

    公开(公告)号:CN109255290A

    公开(公告)日:2019-01-22

    申请号:CN201810847475.2

    申请日:2018-07-27

    发明人: 冯丹 马彬 魏晓明

    IPC分类号: G06K9/00

    摘要: 本申请公开了一种菜单识别方法,属于计算机技术领域,解决现有技术中存在的菜单录入效率低下的问题。本申请实施例公开的菜单识别方法包括:获取目标菜单的菜单图像;根据所述菜单图像的信息,确定所述目标菜单中待录入的产品名称和校正所述产品名称的辅助信息;根据所述辅助信息在知识库中确定所述产品名称对应的候选产品名称;根据所述候选产品名称对所述产品名称进行校正。本申请实施例公开的菜单识别方法,通过获取辅助信息以缩小用于校正识别结果的知识库,有效地提升了菜单录入效率。

    图像语义分割方法及装置
    7.
    发明公开

    公开(公告)号:CN112686267A

    公开(公告)日:2021-04-20

    申请号:CN202110033687.9

    申请日:2021-01-11

    摘要: 本公开提供了一种图像语义分割方法及装置。包括:将待处理图像输入至图像识别模型;图像识别模型包括:短时密集连接网络层和解码网络层,短时密集连接网络层包括:卷积模块、多个短时密集连接层和输出模块,短时密集连接层包含多个短时密集连接模块;调用卷积模块对待处理图像进行处理得到待处理图像对应的第一特征图;调用短时密集连接层对第一特征图进行处理得到第二特征图;调用输出模块对第二特征图进行处理得到第三特征图;调用解码网络层对第三特征图进行上采样并向分割类别映射,得到通道数为分割类别数的第四特征图;根据第四特征图确定待处理图像对应的语义分割结果。本公开可以减少网络结构性冗余,提高图像语义分割性能和效率。

    目标识别方法、装置、电子设备和存储介质

    公开(公告)号:CN111401359A

    公开(公告)日:2020-07-10

    申请号:CN202010116980.7

    申请日:2020-02-25

    IPC分类号: G06K9/32 G06K9/62 G06T7/70

    摘要: 本申请公开了目标识别方法、装置、电子设备和存储介质。所述方法包括:获取待识别图像;对所述待识别图像进行位置识别,得到位置识别结果,并根据位置识别结果确定所述待识别图像的候选区域集合;对候选区域集合中的各候选区域进行目标类别识别,得到类别识别结果。有益效果在于,将目标位置的识别与目标类别的的识别作为两个阶段,利用多个候选区域进行目标类别的识别,能够更充分地利用待识别图像中的有效信息,提高类别识别的精确度,提高目标识别的效果。

    视觉感知模型训练方法、装置、设备及存储介质

    公开(公告)号:CN115205628A

    公开(公告)日:2022-10-18

    申请号:CN202210769935.0

    申请日:2022-06-30

    摘要: 本申请公开了一种视觉感知模型训练方法、装置、设备及存储介质,属于计算机视觉技术领域。该方法先获取多个单实例样本图像,然后对每个单实例样本图像分别进行第一数据增强处理和第二数据增强处理,得到第一处理图像和第二处理图像,对从多个单实例样本图像中选取的M个单实例样本图像进行拼接处理,得到多实例样本图像,分别对第一处理图像、多实例样本图像、第二处理图像和M个单实例样本图像进行特征提取,得到对应的图像特征,基于这些图像特征,进行模型训练,得到视觉感知模型。由于训练模型的图像特征不仅包括单实例样本图像的图像特征,还包括多实例样本图像的图像特征,因此,可以提高模型的泛化能力。