Patent search ap:("北京百度网讯科技有限公司") AND inv:"钦夏孟" Page 6

51.

发明公开
一种光学字符识别模型的优化方法、装置、设备及介质审中-实审

公开(公告)号：CN114495123A

公开(公告)日：2022-05-13

申请号：CN202210041824.8

申请日：2022-01-14

Applicant: 北京百度网讯科技有限公司

Inventor： 谢群义 , 钦夏孟 , 恩孟一 , 王鹏 , 姚锟

IPC: G06V30/40 , G06V30/10 , G06V10/774

Abstract: 本公开提供了一种光学字符识别模型的优化方法、装置、设备及介质，涉及人工智能技术领域，尤其涉及深度学习、计算机视觉技术领域。具体实现方案为：获取多个线上业务数据的编码向量；采用编码器和两个解码器，对多个线上业务数据的编码向量进行处理，得到每个线上业务数据的两个解码向量；根据每个线上业务数据的编码向量和两个解码向量，确定每个线上业务数据对应的两个损失值；从多个线上业务数据中，获取坐标在预设坐标范围外的线上业务数据，作为困难样本，每个线上业务数据的坐标由该线上业务数据对应的两个损失值构成；利用困难样本，优化光学字符识别模型。

52.

发明公开
图像识别方法、装置、电子设备以及存储介质有权

公开(公告)号：CN114359904A

公开(公告)日：2022-04-15

申请号：CN202210013240.X

申请日：2022-01-06

Applicant: 北京百度网讯科技有限公司

Inventor： 杨夏浛 , 钦夏孟 , 谢群义 , 徐杨柳 , 张胜 , 姚锟

IPC: G06V30/14 , G06V30/18 , G06V30/19 , G06V10/82 , G06V10/70 , G06K9/62 , G06N3/08 , G06N20/00

Abstract: 本公开提供了一种图像识别方法、装置、电子设备及存储介质，涉及人工智能技术领域，具体为深度学习、计算机视觉技术领域，应用于图像识别场景，以至少解决相关技术中模型识别的准确率较低的技术问题。具体实现方案为：获取目标图像，其中，目标图像包括待识别对象；利用目标模型对目标图像进行对象识别，得到识别结果；其中，目标模型分别使用多组训练数据通过机器学习训练得到，多组训练数据至少包括：第一组训练数据、第二组训练数据、第三组训练数据，第一组训练数据、第二组训练数据、第三组训练数据的损失梯度不同。

53.

发明公开
神经网络模型的压缩方法、设备和存储介质审中-实审

公开(公告)号：CN114282670A

公开(公告)日：2022-04-05

申请号：CN202210044856.3

申请日：2022-01-14

Applicant: 北京百度网讯科技有限公司

Inventor： 陈毅 , 谢群义 , 徐杨柳 , 钦夏孟 , 章成全 , 姚锟

IPC: G06N3/08 , G06N3/04

Abstract: 本公开提供了一种神经网络模型的压缩方法、设备和存储介质，涉及人工智能技术领域，具体为深度学习、计算机视觉技术领域，可应用于图像处理等场景。具体实现方案为：在对初始神经网络模型进行压缩的过程中，结合初始神经网络模型中各层神经网络的剪枝比例，对各层神经网络分别进行剪枝处理，以得到中间神经网络模型，并基于训练数据对中间神经网络模型进行训练，并对训练后的所述中间神经网络模型进行量化，以及结合训练数据对量化后的中间神经网络模型进行训练，以得到最终的目标神经网络模型。由此，在保证神经网络模型的性能的情况下，节省了计算资源、存储和硬件资源等。

54.

发明公开
签名识别模型训练方法、装置及电子设备失效

公开(公告)号：CN114049686A

公开(公告)日：2022-02-15

申请号：CN202111345986.2

申请日：2021-11-15

Applicant: 北京百度网讯科技有限公司

Inventor： 王晓燕 , 黄聚 , 钦夏孟 , 范森 , 吕鹏原 , 章成全 , 姚锟

IPC: G06V40/30 , G06V10/774 , G06V30/19 , G06V10/22 , G06V30/28

Abstract: 本公开提供了签名识别模型训练方法、装置及电子设备，涉及人工智能技术领域，具体为深度学习、计算机视觉技术领域。具体方案为：从预定的样本库中，获取待利用样本以及对应的姓名标注信息；其中，所述样本库包括第一类样本和对应的姓名标注信息；第一类样本为在基于该签名识别模型进行签名识别时，经反馈识别结果错误的签名图片；获取待利用样本对应的文本行图片，其中，文本行图片为待利用样本中的签名区域；基于待利用样本对应的文本行图片和姓名标注信息，对签名识别模型进行更新训练。通过本方案，可以自动进行训练迭代签名识别模型，大大减少了迭代签名识别模型的人力成本。

55.

发明公开
文档生成方法、装置、平台、电子设备以及存储介质审中-实审

公开(公告)号：CN113971810A

公开(公告)日：2022-01-25

申请号：CN202111260590.8

申请日：2021-10-27

Applicant: 北京百度网讯科技有限公司

Inventor： 谢群义 , 钦夏孟 , 恩孟一 , 张栋栋 , 黄聚 , 徐杨柳 , 陈毅 , 姚锟

IPC: G06V30/413 , G06V30/414 , G06V10/774 , G06V10/82 , G06V10/764 , G06K9/62

Abstract: 本公开提供了文档生成方法、装置、平台、电子设备、存储介质以及程序产品，涉及人工智能技术领域，尤其涉及计算机视觉和深度学习技术领域，可应用于文字识别等场景。具体实现方案为：对文档图片进行类别识别，得到目标类别结果；确定与目标类别结果相匹配的目标结构化模型；以及利用目标结构化模型，对文档图片进行结构识别，得到结构识别结果，以便基于结构识别结果生成电子文档，结构识别结果包括字段属性识别结果和字段位置识别结果。

56.

发明公开
一种模型训练、字符识别方法、装置、设备及存储介质有权

公开(公告)号：CN113971806A

公开(公告)日：2022-01-25

申请号：CN202111248583.6

申请日：2021-10-26

Applicant: 北京百度网讯科技有限公司

Inventor： 徐杨柳 , 谢群义 , 陈毅 , 钦夏孟 , 章成全 , 姚锟

IPC: G06V30/194 , G06V30/24 , G06N3/04 , G06N3/08

Abstract: 本公开提供了一种模型训练、字符识别方法、装置、设备及存储介质，涉及人工智能技术领域，具体为计算机视觉和深度学习技术领域，可应用于OCR光学字符识别等场景下。具体实现方案为：获得场景图像、所述场景图像中的第二实际字符和第二构建图像；采用所述待训练模型对所述场景图像进行字符识别，得到字符识别过程中提取的字符的第一特征和第一识别字符；采用所述辅助训练模型对所述第二构建图像进行字符识别，得到字符识别过程中提取的字符的第二特征；基于所述第一识别字符、第二实际字符、第一特征和第二特征，对所述待训练模型的模型参数进行调整，得到字符识别模型。应用本公开实施例提供的方案能够训练得到用于进行字符识别的模型。

57.

发明公开
文字识别方法、装置、电子设备以及存储介质有权

公开(公告)号：CN113780098A

公开(公告)日：2021-12-10

申请号：CN202110945259.3

申请日：2021-08-17

Applicant: 北京百度网讯科技有限公司

Inventor： 黄聚 , 谢群义 , 李煜林 , 钦夏孟 , 姚锟

IPC: G06K9/00 , G06K9/46 , G06N3/08

Abstract: 本公开提供了文字识别方法、装置、电子设备以及存储介质，涉及人工智能技术领域，具体涉及计算机视觉和深度学习技术领域，可应用于OCR光学字符识别等场景。具体实现方案为：采用骨干网络对待识别的目标图像进行特征提取，得到特征图；将特征图输入第一网络，以预测特征图中的各特征点是否属于文本框，以及所属的文本框在目标图像中的位置；将特征图输入第二网络，以预测特征图中各特征点所属文本框之间的关联关系；根据各文本框的位置，对目标图像中对应图像内容进行文字识别，得到各文本框对应的文字内容；根据各文本框之间的关联关系，对各文本框对应的文字内容进行组织得到结构化信息。由此，提高了文字识别的准确性。

58.

发明公开
一种文字定位模型的训练方法及文字定位方法审中-实审

公开(公告)号：CN113762109A

公开(公告)日：2021-12-07

申请号：CN202110970305.5

申请日：2021-08-23

Applicant: 北京百度网讯科技有限公司

Inventor： 黄聚 , 李煜林 , 王鹏 , 谢群义 , 钦夏孟 , 姚锟

IPC: G06K9/00 , G06K9/62 , G06N3/08

Abstract: 本公开提供了一种文字定位方法及文字定位模型的训练方法，涉及人工智能技术领域，具体为计算机视觉和深度学习技术领域，可应用于光学字符识别OCR等场景。具体实现方案为：获取样本图像；将样本图像输入至待训练的文字定位模型中，输出预测文本框；获取样本先验锚点框；根据样本先验锚点框、标注文本框和预测文本框，对文字定位模型的模型参数进行调整，并使用下一个样本图像对调整后的文字定位模型继续训练，直至模型训练结束生成目标文字定位模型。由此，本公开能够通过结合先验锚点框进行文字定位模型的训练，不再需要在模型训练过程中从零开始进行回归预测，降低了模型训练过程中的耗时及难度，提高了模型训练结果的可靠性。

59.

发明公开
用于检测图像质量的方法、装置、设备、介质和产品失效

公开(公告)号：CN113643260A

公开(公告)日：2021-11-12

申请号：CN202110930170.X

申请日：2021-08-13

Applicant: 北京百度网讯科技有限公司

Inventor： 杨夏浛 , 钦夏孟 , 李煜林 , 李乔伊 , 王卫

IPC: G06T7/00

Abstract: 本公开提供了用于检测图像质量的方法、装置、设备、介质和产品，涉及涉及人工智能技术领域，具体为计算机视觉和深度学习技术领域，可应用于图形处理和图像识别等场景下。具体实现方案为：获取目标图像；确定与目标图像对应的至少一个模型；基于目标图像和至少一个模型，确定目标图像对应的图像参数；图像参数至少包括以下一项：清晰度参数、完整性参数、类型参数；基于图像参数，确定目标图像的图像质量结果。本实现方式可以提高图像质量检测效率。

60.

发明公开
文本结构化处理方法、处理装置、电子设备以及存储介质有权转让

公开(公告)号：CN113627439A

公开(公告)日：2021-11-09

申请号：CN202110921811.5

申请日：2021-08-11

Applicant: 北京百度网讯科技有限公司

Inventor： 于海鹏 , 梁思远 , 李煜林 , 钦夏孟 , 姚锟

IPC: G06K9/34 , G06F16/332 , G06F16/35 , G06F40/30

Abstract: 本公开提供了一种文本结构化处理方法、处理装置、电子设备以及存储介质，涉及人工智能技术领域，尤其涉及计算机视觉和深度学习技术领域，可应用于OCR光学字符识别等场景。具体实现方案为：对文本图像进行文本检测，得到与文本图像对应的至少一个文本检测框的类别信息，其中，类别信息包括关键字类别或数值类别；确定与至少一个文本检测框中的目标文本检测框对应的文本图像；对与目标文本检测框对应的文本图像进行文本识别，得到与目标文本检测框对应的文本图像的文本识别结果；对文本识别结果进行文本分类，得到与文本识别结果对应的语义类别结果；生成文本结构化结果，其中，文本结构化结果包括与关键字类别对应的值和与数值类别对应的值。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification