-
公开(公告)号:CN111310585B
公开(公告)日:2023-08-01
申请号:CN202010062771.9
申请日:2020-01-20
Applicant: 北京百度网讯科技有限公司
Abstract: 本公开的实施例公开了用于生成信息的方法和装置。该方法的一具体实施方式包括:获取待取放物品的位置信息和用户的位置信息集合,其中,该用户的位置信息集合中包括表征与待取放物品的位置相关联的用户的至少一个人体关键点的位置的位置信息;根据该用户的位置信息集合中的位置信息所指示的至少一个人体关键点与该待取放物品之间的距离,生成对应的距离信息集合;根据所生成的距离信息所指示的距离,从该用户的位置信息集合中确定至少一个准匹配位置信息;根据该至少一个准匹配位置信息之间的匹配,生成表征用户与待取放物品之间具备关联关系的用户物品取放信息。该实施方式提高了复杂购物情景下的用户与购买的商品之间的关联精度和准确性。
-
公开(公告)号:CN115187995B
公开(公告)日:2023-04-18
申请号:CN202210807745.3
申请日:2022-07-08
Applicant: 北京百度网讯科技有限公司
IPC: G06V30/16 , G06V30/148 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本公开提供了一种文档矫正方法、装置、电子设备和存储介质,涉及人工智能领域,具体涉及深度学习、图像处理和计算机视觉等技术领域,可应用于OCR等场景。文档矫正方法的具体实现方案为:对包括待矫正文档的原始图像进行语义分割,得到边缘像素点;基于边缘像素点,确定第一边缘线;根据矫正后文档对应的图像尺寸,确定目标图像的网格图像;对第一边缘线和网格图像的第二边缘线进行等分处理,分别得到第一边缘线的第一关键点和第二边缘线中与第一关键点对应的第二关键点;以及根据第一关键点和第二关键点之间的对应关系,生成目标图像。
-
公开(公告)号:CN113362543B
公开(公告)日:2023-10-31
申请号:CN202110558542.0
申请日:2021-05-21
Applicant: 北京百度网讯科技有限公司
IPC: G07G1/00 , G07G1/01 , G07G1/12 , G01G19/414 , G01G19/52 , G06V20/60 , G06V10/762 , G06V10/764
Abstract: 本公开提供了结算方法、装置、电子设备以及存储介质,涉及人工智能技术领域,尤其涉及计算机视觉和深度学习技术领域,可应用于图像识别场景下。具体实现方案为:通过摄像头采集目标物品的图像并通过称重台获取目标物品的重量;对目标物品的图像进行识别,获取图像中目标物品对应的特征;根据目标物品对应的特征与预先确定的至少一个物品类别对应的聚类中心,确定目标物品所属的目标类别;根据目标物品对应的特征与目标类别下至少一个子类别物品对应的特征,确定目标物品所属的目标子类别;根据目标物品的目标子类别及目标物品的重量,对目标物品进行结算。由此,提高了目标物品的结算效率和准确性,降低了结算的人力成本。
-
公开(公告)号:CN113313114B
公开(公告)日:2023-06-30
申请号:CN202110652178.4
申请日:2021-06-11
Applicant: 北京百度网讯科技有限公司
IPC: G06V30/19 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本公开提供了证件信息获取方法、装置、设备以及存储介质,涉及人工智能技术领域,具体涉及计算机视觉和深度学习技术领域。具体实现方案为:获取目标证件图像;对目标证件图像进行文本识别,确定文本识别结果;响应于确定文本识别结果中包括字符,对文本识别结果中的字符进行再次识别,得到字符优化结果;根据字符优化结果,更新文本识别结果;输出更新后的文本识别结果。本实现方式能够对字符的识别结果进行优化,提高文本识别的准确度。
-
公开(公告)号:CN115601775A
公开(公告)日:2023-01-13
申请号:CN202211303281.9
申请日:2022-10-24
Applicant: 北京百度网讯科技有限公司(CN)
IPC: G06V30/414 , G06V30/18 , G06V30/16
Abstract: 本公开提供了一种主体检测框的显示方法,涉及人工智能技术领域,具体为深度学习、图像处理、计算机视觉技术领域。具体实现方案为:获取对目标对象采集的视频流中的帧图像序列;基于预设的第一抽取频率从所述帧图像序列中抽取显示帧图像,并基于预设的第二抽取率从所述帧图像序列中抽取检测帧图像;响应于从所述检测帧图像中确定出第二检测帧图像,针对第二显示帧图像中的任一个目标第二显示帧图像,基于所述目标第二显示帧图像的前一帧显示帧图像中的主体显示框,以及所述第二检测帧图像中的主体检测框,确定所述目标第二显示帧图像的中的主体显示框。本公开可以减少前后显示帧图像的主体显示框的偏移,减少画面的抖动,提升用户体验。
-
公开(公告)号:CN113656630A
公开(公告)日:2021-11-16
申请号:CN202110943222.7
申请日:2021-08-17
Applicant: 北京百度网讯科技有限公司
IPC: G06F16/583 , G06K9/62
Abstract: 本公开提供了检索图像的方法、装置和系统,涉及人工智能技术领域,具体为计算机视觉和深度学习技术领域,可应用于图像处理和图像识别等场景下。具体实现方案为:响应于接收到包括目标图像的查询请求,从目标图像中检测目标主体;若检测到的目标主体的检测框的置信度大于第一阈值,则从目标主体中提取出主体特征,其中,主体特征包括相同特征、相似特征和类别;将目标图像的主体特征与数据库中预先存储的候选图像的主体特征进行匹配,得到候选图像的相似得分、相同得分;根据相似得分、相同得分选择预定数目个候选图像作为搜索结果输出。该实施方式实现了提高了检索的准确性。
-
公开(公告)号:CN115187995A
公开(公告)日:2022-10-14
申请号:CN202210807745.3
申请日:2022-07-08
Applicant: 北京百度网讯科技有限公司
IPC: G06V30/16 , G06V30/148 , G06V10/82 , G06N3/04 , G06N3/08
Abstract: 本公开提供了一种文档矫正方法、装置、电子设备和存储介质,涉及人工智能领域,具体涉及深度学习、图像处理和计算机视觉等技术领域,可应用于OCR等场景。文档矫正方法的具体实现方案为:对包括待矫正文档的原始图像进行语义分割,得到边缘像素点;基于边缘像素点,确定第一边缘线;根据矫正后文档对应的图像尺寸,确定目标图像的网格图像;对第一边缘线和网格图像的第二边缘线进行等分处理,分别得到第一边缘线的第一关键点和第二边缘线中与第一关键点对应的第二关键点;以及根据第一关键点和第二关键点之间的对应关系,生成目标图像。
-
公开(公告)号:CN113362543A
公开(公告)日:2021-09-07
申请号:CN202110558542.0
申请日:2021-05-21
Applicant: 北京百度网讯科技有限公司
Abstract: 本公开提供了结算方法、装置、电子设备以及存储介质,涉及人工智能技术领域,尤其涉及计算机视觉和深度学习技术领域,可应用于图像识别场景下。具体实现方案为:通过摄像头采集目标物品的图像并通过称重台获取目标物品的重量;对目标物品的图像进行识别,获取图像中目标物品对应的特征;根据目标物品对应的特征与预先确定的至少一个物品类别对应的聚类中心,确定目标物品所属的目标类别;根据目标物品对应的特征与目标类别下至少一个子类别物品对应的特征,确定目标物品所属的目标子类别;根据目标物品的目标子类别及目标物品的重量,对目标物品进行结算。由此,提高了目标物品的结算效率和准确性,降低了结算的人力成本。
-
公开(公告)号:CN113313114A
公开(公告)日:2021-08-27
申请号:CN202110652178.4
申请日:2021-06-11
Applicant: 北京百度网讯科技有限公司
Abstract: 本公开提供了证件信息获取方法、装置、设备以及存储介质,涉及人工智能技术领域,具体涉及计算机视觉和深度学习技术领域。具体实现方案为:获取目标证件图像;对目标证件图像进行文本识别,确定文本识别结果;响应于确定文本识别结果中包括字符,对文本识别结果中的字符进行再次识别,得到字符优化结果;根据字符优化结果,更新文本识别结果;输出更新后的文本识别结果。本实现方式能够对字符的识别结果进行优化,提高文本识别的准确度。
-
公开(公告)号:CN111310585A
公开(公告)日:2020-06-19
申请号:CN202010062771.9
申请日:2020-01-20
Applicant: 北京百度网讯科技有限公司
Abstract: 本公开的实施例公开了用于生成信息的方法和装置。该方法的一具体实施方式包括:获取待取放物品的位置信息和用户的位置信息集合,其中,该用户的位置信息集合中包括表征与待取放物品的位置相关联的用户的至少一个人体关键点的位置的位置信息;根据该用户的位置信息集合中的位置信息所指示的至少一个人体关键点与该待取放物品之间的距离,生成对应的距离信息集合;根据所生成的距离信息所指示的距离,从该用户的位置信息集合中确定至少一个准匹配位置信息;根据该至少一个准匹配位置信息之间的匹配,生成表征用户与待取放物品之间具备关联关系的用户物品取放信息。该实施方式提高了复杂购物情景下的用户与购买的商品之间的关联精度和准确性。
-
-
-
-
-
-
-
-
-