Patent search ap:("北京百度网讯科技有限公司") AND inv:"徐杨柳" Page 1

1.

发明授权
文本识别方法、视觉特征提取模型的训练方法及装置有权转让

公开(公告)号：CN113657395B

公开(公告)日：2024-02-13

申请号：CN202110944388.0

申请日：2021-08-17

Applicant: 北京百度网讯科技有限公司

Inventor： 徐杨柳 , 谢群义 , 钦夏孟 , 章成全 , 姚锟

IPC: G06V30/148 , G06V30/18 , G06V30/19 , G06V10/80

Abstract: 本公开提供了一种文本识别方法、视觉特征提取模型的训练方法及装置，涉及人工智能技术领域，具体为计算机视觉和深度学习技术领域，可应用于光学字符识别等场景，包括：获取待识别图像中待识别文本分别对应的先验特征和视觉特征，先验特征是基于待识别图像的先验知识确定的，对先验特征和视觉特征进行融合处理，得到融合特征，对融合特征进行编码处理得到编码特征，对编码特征进行解码处理，得到与待识别文本对应的文本内容，使得文本识别过程不再为孤立和片面的过程，而具有全面性和完整性，以通过充分考虑可能影响文本识别的信息(用于确定先验特征的信息、用于确定视觉特征的信息)确定文本内容，以提高文本识别的可靠性、准确性、及精度。

2.

发明公开
图像生成方法、装置、电子设备及可读存储介质审中-实审

公开(公告)号：CN114549695A

公开(公告)日：2022-05-27

申请号：CN202210032582.6

申请日：2022-01-12

Applicant: 北京百度网讯科技有限公司

Inventor： 徐杨柳 , 谢群义 , 陈毅 , 钦夏孟 , 章成全 , 姚锟

IPC: G06T11/60 , G06F40/30 , G06F16/55 , G06F16/583

Abstract: 本公开提供了一种图像生成方法、装置、电子设备及可读存储介质，涉及人工智能技术领域，具体为深度学习、计算机视觉技术领域，可应用于文字识别等场景。其中，图像生成方法包括：获取第一图像，得到所述第一图像中的文本内容；根据所述文本内容，确定目标文本库；根据所述第一图像与所述目标文本库中的目标文本，生成第二图像。本公开能够简化图像生成时的步骤，提升图像生成时的效率。

3.

发明公开
任务处理方法、处理装置、电子设备及存储介质有权

公开(公告)号：CN114428677A

公开(公告)日：2022-05-03

申请号：CN202210110164.4

申请日：2022-01-28

Applicant: 北京百度网讯科技有限公司

Inventor： 谢群义 , 张栋栋 , 钦夏孟 , 恩孟一 , 徐杨柳 , 陈毅 , 黄聚 , 姚锟

IPC: G06F9/48

Abstract: 本公开提供了一种任务处理方法、处理装置、电子设备及存储介质，涉及人工智能技术领域，具体为深度学习、计算机视觉技术领域，可应用于OCR光学字符识别等场景。具体实现方案为：响应于接收到任务处理请求，根据任务处理请求指示的任务类型标识，对待处理的标注数据进行解析，得到任务标注数据，其中，任务标注数据的标签信息与任务类型标识相匹配，任务标注数据包括第一任务标注数据和第二任务标注数据；利用第一任务标注数据训练待训练模型，得到多个候选模型，其中，待训练模型是根据任务类型标识确定的；根据利用第二任务标注数据对多个候选模型进行性能评估得到的性能评估结果，从多个候选模型中确定目标模型。

4.

发明授权
生成样本图像的方法以及文字识别模型的训练方法有权

公开(公告)号：CN114998897B

公开(公告)日：2023-08-29

申请号：CN202210662775.X

申请日：2022-06-13

Applicant: 北京百度网讯科技有限公司

Inventor： 徐杨柳 , 谢群义 , 陈毅 , 钦夏孟 , 章成全 , 姚锟

IPC: G06V30/14 , G06V30/148 , G06V30/19 , G06N3/08 , G06N3/04

Abstract: 本公开提供了生成样本图像的方法以及文字识别模型的训练方法，涉及人工智能领域，尤其涉及深度学习、图像处理、计算机视觉等技术领域，可应用于光学字符识别等场景。具体实现方案为：根据初始图像，生成第一背景图像和第一文字；其中，第一背景图像为初始图像中的所述第一文字被替换为目标图像所得到的。对第一背景图像进行调整，生成与第一背景图像相似的第二背景图像；对第一文字进行调整，生成与第一文字相似的第二文字。根据第二背景图像和第二文字，生成第一样本图像；对第一样本图像进行真实化处理，得到第二样本图像，进而增加最终得到的第二样本图像，提高训练得到的文字识别模型的准确度。

5.

发明授权
模型的半监督训练、分类方法装置、设备、介质及产品有权

公开(公告)号：CN115471717B

公开(公告)日：2023-06-20

申请号：CN202211142519.4

申请日：2022-09-20

Applicant: 北京百度网讯科技有限公司

Inventor： 陈毅 , 徐杨柳 , 谢群义 , 钦夏孟 , 姚锟

IPC: G06V10/774 , G06V10/764 , G06V10/82

Abstract: 本公开提供了模型的半监督训练、分类方法装置、设备、介质及产品，涉及人工智能领域，尤其涉及计算机视觉、深度学习领域。具体实现方案为：采用有标签图像样本对待训练的图像分类模型进行训练，获得第一分类模型，所述第一分类模型为第一次训练后的分类模型；确定两个无标签图像样本为一组，获得目标图像样本组；以所述目标图像样本组中两个无标签图像样本互为标签对所述第一分类模型进行训练，获得第二分类模型，所述第二分类模型为第二次训练后的分类模型。

6.

发明授权
一种模型训练、字符识别方法、装置、设备及存储介质有权

公开(公告)号：CN113971806B

公开(公告)日：2023-05-05

申请号：CN202111248583.6

申请日：2021-10-26

Applicant: 北京百度网讯科技有限公司

Inventor： 徐杨柳 , 谢群义 , 陈毅 , 钦夏孟 , 章成全 , 姚锟

IPC: G06V30/194 , G06V30/24 , G06N3/0464 , G06N3/044 , G06N3/09 , G06N3/084

Abstract: 本公开提供了一种模型训练、字符识别方法、装置、设备及存储介质，涉及人工智能技术领域，具体为计算机视觉和深度学习技术领域，可应用于OCR光学字符识别等场景下。具体实现方案为：获得场景图像、所述场景图像中的第二实际字符和第二构建图像；采用所述待训练模型对所述场景图像进行字符识别，得到字符识别过程中提取的字符的第一特征和第一识别字符；采用所述辅助训练模型对所述第二构建图像进行字符识别，得到字符识别过程中提取的字符的第二特征；基于所述第一识别字符、第二实际字符、第一特征和第二特征，对所述待训练模型的模型参数进行调整，得到字符识别模型。应用本公开实施例提供的方案能够训练得到用于进行字符识别的模型。

7.

发明公开
模型压缩方法、图像处理方法、装置和电子设备有权

公开(公告)号：CN114881227A

公开(公告)日：2022-08-09

申请号：CN202210520999.7

申请日：2022-05-13

Applicant: 北京百度网讯科技有限公司

Inventor： 陈毅 , 徐杨柳 , 谢群义 , 钦夏孟 , 姚锟

IPC: G06N3/08 , G06N3/04 , G06K9/62

Abstract: 本公开提供了一种模型压缩方法、图像处理方法、装置和电子设备，涉及人工智能技术领域，尤其涉及深度学习、图像处理、计算机视觉技术领域。具体实现方案为：基于第一训练样本对初始模型进行训练，得到训练后的第一目标模型，第一目标模型包括N个第一网络层和M个第二网络层；对N个第一网络层进行剪枝，得到N个第三网络层；将第i个第三网络层对应的第i个第一网络层作为老师层，基于第一目标模型对应的第二训练样本，对第i个第三网络层进行蒸馏学习，得到第i个第四网络层；根据N个第四网络层和M个第二网络层，生成第二目标模型。由此，可对第一网络层分别进行剪枝，并对第三网络层分别进行蒸馏学习，提升了模型压缩的性能。

8.

发明公开
文字识别模型的样本确定的方法及装置审中-实审

公开(公告)号：CN118629054A

公开(公告)日：2024-09-10

申请号：CN202410749748.5

申请日：2024-06-11

Applicant: 北京百度网讯科技有限公司

Inventor： 徐杨柳 , 谢群义 , 钦夏孟 , 姚锟

IPC: G06V30/19

Abstract: 本公开提供了文字识别模型的样本确定的方法及装置。本公开涉及人工智能技术领域，具体涉及计算机视觉、深度学习、图像处理、文字识别等技术领域，可应用于智慧城市、智慧金融等场景。基于初始的第一文字识别模型，得到更新后的第一训练集；使用更新后的第一训练集对初始的第一文字识别模型进行再训练，得到更新后的第一文字识别模型；基于更新后的第一文字识别模型，得到再次更新后的第一训练集；基于再次更新后的第一训练集，对该更新后的第一文字识别模型进行再训练，直到满足第一预设条件；根据训练得到目标第一文字识别模型采用的第一训练集，确定第一类样本集。

9.

发明授权
文字识别模型的训练方法和识别图像中文字的方法有权

公开(公告)号：CN113313022B

公开(公告)日：2023-11-10

申请号：CN202110587936.9

申请日：2021-05-27

Applicant: 北京百度网讯科技有限公司

Inventor： 徐杨柳 , 谢群义 , 钦夏孟 , 章成全 , 姚锟

IPC: G06V30/413 , G06V30/19 , G06V10/82 , G06N3/0475 , G06N3/045 , G06N3/044

Abstract: 本公开提供了一种文字识别模型的训练方法和识别图像中文字的方法、装置、电子设备和存储介质，应用于人工智能技术领域，具体应用于计算机视觉和深度学习技术领域，可应用于图像识别场景下。文字识别模型的训练方法的具体实现方案为：以第一目标图像作为第一文字识别模型的输入，获得第一特征图；以样本图像作为第二文字识别模型的输入，获得第二特征图，其中，第二文字识别模型以第一文字识别模型作为初始模型；基于第一特征图和第二特征图的差异，确定第一损失值；以及基于第一损失值，对第二文字识别模型进行训练。其中，第一目标图像与样本图像包括相同的文字，且第一目标图像以目标格式表示文字。

10.

发明公开
模型的半监督训练、分类方法装置、设备、介质及产品有权

公开(公告)号：CN115471717A

公开(公告)日：2022-12-13

申请号：CN202211142519.4

申请日：2022-09-20

Applicant: 北京百度网讯科技有限公司

Inventor： 陈毅 , 徐杨柳 , 谢群义 , 钦夏孟 , 姚锟

IPC: G06V10/774 , G06V10/764 , G06V10/82

Abstract: 本公开提供了模型的半监督训练、分类方法装置、设备、介质及产品，涉及人工智能领域，尤其涉及计算机视觉、深度学习领域。具体实现方案为：采用有标签图像样本对待训练的图像分类模型进行训练，获得第一分类模型，所述第一分类模型为第一次训练后的分类模型；确定两个无标签图像样本为一组，获得目标图像样本组；以所述目标图像样本组中两个无标签图像样本互为标签对所述第一分类模型进行训练，获得第二分类模型，所述第二分类模型为第二次训练后的分类模型。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification