Patent search ap:("北京百度网讯科技有限公司") AND inv:"韩钧宇" Page 5

41.

发明公开
端到端的文字识别方法及装置、计算机设备及可读介质审中-实审

公开(公告)号：CN110458011A

公开(公告)日：2019-11-15

申请号：CN201910602608.4

申请日：2019-07-05

Applicant: 北京百度网讯科技有限公司

Inventor： 孙逸鹏 , 章成全 , 黄祖明 , 刘家铭 , 韩钧宇 , 丁二锐

IPC: G06K9/00 , G06K9/32 , G06K9/34

Abstract: 本发明提供一种端到端的文字识别方法及装置、计算机设备及可读介质。其方法包括：获取包含有文字区域的待识别的图片；采用预先训练的端到端的文字识别模型，识别所述待识别的图片中的所述文字区域的位置和所述文字区域中包括的文字内容；所述端到端的文字识别模型中包括感兴趣区域透视变换处理模块，用于对所述文字区域进行透视变换处理。本发明的技术方案，不需要串联多个步骤，能够避免引入累计误差，从而能够有效地提高文字识别的准确性。

42.

发明公开
服务部署方法和装置以及服务启动方法和装置审中-实审

公开(公告)号：CN110175033A

公开(公告)日：2019-08-27

申请号：CN201910441104.9

申请日：2019-05-24

Applicant: 北京百度网讯科技有限公司

Inventor： 陈露露 , 韩钧宇 , 钦夏孟 , 朱胜贤

IPC: G06F8/60 , G06F21/60 , H04L29/06

Abstract: 本发明实施例提出一种服务部署方法和装置以及服务启动方法和装置，其中服务部署方法包括：获取用于部署服务的预设硬件设备的标识；将所述预设硬件设备的标识写入所述服务对应的部署包；下发所述部署包。本发明实施例能够限定服务的部署范围。

43.

发明公开
车牌识别方法和装置有权

公开(公告)号：CN110070085A

公开(公告)日：2019-07-30

申请号：CN201910359065.8

申请日：2019-04-30

Applicant: 北京百度网讯科技有限公司

Inventor： 杨静远 , 孙逸鹏 , 韩钧宇

IPC: G06K9/32 , G06K9/62

Abstract: 本申请提出一种车牌识别方法和装置，其中，方法包括：从采集到的图像中，识别呈现车牌的图像区域；采用卷积神经网络对图像区域进行特征提取，得到图像区域的特征矩阵；将特征矩阵输入循环神经网络，以顺序识别出车牌各文本位置上的文本信息；其中，循环神经网络，用于根据特征矩阵中各元素对相应文本位置的注意力权重进行文本识别。该方法既能够实现对单行车牌进行识别，又能够实现对双行车牌进行识别，可以提升该方法的适用性。并且，无需对图像区域进行切分，再进行单字分割识别，可以减少算法的步骤，能够实现提升车牌识别的效率和准确性。

44.

发明公开
批注电子文档的方法和装置无效复审申请

公开(公告)号：CN103500158A

公开(公告)日：2014-01-08

申请号：CN201310463942.9

申请日：2013-10-08

Applicant: 北京百度网讯科技有限公司

Inventor： 韩钧宇

IPC: G06F17/24

Abstract: 提供了一种在终端设备中批注电子文档的方法和装置，所述方法包括：获取用户在所述电子文档中针对选定的批注区域输入的批注信息；根据获取的批注信息向所述用户推荐至少一个批注类别，以便用户选择；将用户选择的批注类别确定为所述获取的批注信息所属的批注类别。采用本发明所述方法及装置不仅能够实现对电子文档中各种批注信息的准确、有效地分类，而且通过分类显示批注信息还能够让用户在阅读过程中迅速定位到想要关注的批注信息，从而进一步增强了用户体验。

45.

发明公开
一种基于语音输入的图像信息提取分析方法及装置有权

公开(公告)号：CN103064936A

公开(公告)日：2013-04-24

申请号：CN201210568735.5

申请日：2012-12-24

Applicant: 北京百度网讯科技有限公司

Inventor： 韩钧宇

IPC: G06F17/30

Abstract: 本发明提供了一种基于语音输入的图像信息提取分析方法及装置，其中，方法包括：预先建立像信息提取场景库；S1、根据用户输入的语音，获取用户的信息提取意图；S2、根据所述用户的信息提取意图查询图像信息提取场景库，与各文字描述标签进行匹配，并获取匹配得到的文字描述标签对应的图像信息提取场景；S3、根据所获取的图像信息提取场景对目标图像进行目标对象识别，将识别结果返回给用户。本发明能够综合各种不同类别的图像信息提取软件所具有的功能，同时，能够根据用户输入的语音，智能地提取目标图像中的对应信息并进行分析处理，显著减少了用户的交互负担。

46.

发明授权
移动终端执行的车辆定损方法、装置、移动终端、介质有权

公开(公告)号：CN112712498B

公开(公告)日：2024-09-13

申请号：CN202011559563.6

申请日：2020-12-25

Applicant: 北京百度网讯科技有限公司

Inventor： 张演龙 , 彭冕 , 杨尊程 , 韩钧宇 , 刘经拓

IPC: G06T7/00 , G06T7/11 , G06Q10/20 , G06N3/0464 , G06F18/214

Abstract: 本公开的实施例提供了一种由移动终端执行的车辆定损方法、装置、移动终端、介质以及计算机程序产品。本公开涉及人工智能领域，具体涉及计算机视觉和深度学习技术。实现方案为：采集至少一个输入图像；在至少一个输入图像中检测车辆标识信息；在至少一个输入图像中检测车辆损伤信息；基于车辆标识信息和车辆损伤信息确定车辆定损结果。利用本公开的实施例提供的方法，可以在移动终端处离线地执行车辆定损而无需将拍摄的图像发送到云端，从而可以实现定损过程实时性高、网络延迟小、节省网络服务资源、节省网络带宽费用的效果。

47.

发明授权
图像处理方法、图像处理模型的训练方法和装置有权

公开(公告)号：CN116597454B

公开(公告)日：2024-07-12

申请号：CN202310597526.1

申请日：2023-05-24

Applicant: 北京百度网讯科技有限公司

Inventor： 钦夏孟 , 李煜林 , 谢群义 , 姚锟 , 韩钧宇

IPC: G06V30/19 , G06V10/82

Abstract: 本公开提供了一种图像处理方法、图像处理模型的训练方法、装置和设备，涉及人工智能技术领域，具体为计算机视觉、图像处理、深度学习等技术领域，可应用于OCR、智慧政务等场景。图像处理方法包括：对目标图像进行文本识别，得到多个文本区域和其各自的文本内容；提取表征多个文本区域的视觉模态信息的多个第一视觉特征和每一个文本区域所包括的文本内容的文本模态信息的多个第一文本特征；基于多个第一视觉特征将多个第一文本特征融合，以得到多个第一文本融合特征；基于多个第一文本特征将多个第一视觉特征融合，以得到多个第一视觉融合特征；基于注意力机制对多个第一视觉融合特征和多个第一文本融合特征进行强化进而得到图像处理结果。

48.

发明授权
图像问答方法、装置、计算机设备和介质有权

公开(公告)号：CN111782838B

公开(公告)日：2024-04-05

申请号：CN202010616310.1

申请日：2020-06-30

Applicant: 北京百度网讯科技有限公司

Inventor： 李煜林 , 钦夏孟 , 黄聚 , 谢群义 , 韩钧宇

IPC: G06N5/04 , G06F18/25 , G06F40/30 , G06V20/70 , G06V10/44 , G06V10/74 , G06V10/82 , G06N3/042 , G06N3/0464 , G06N3/045 , G06N3/0442 , G06N3/0985

Abstract: 本公开提供了一种图像问答方法，涉及计算机视觉、自然语言处理领域。该方法包括：获取输入图像和输入问题；基于输入图像，构建视觉图，视觉图包括第一节点特征和第一边特征；基于输入问题，构建问题图，问题图包括第二节点特征和第二边特征；对视觉图和问题图进行多模态融合，以得到更新视觉图和更新问题图；基于输入问题，确定问题特征；基于更新视觉图、更新问题图和问题特征，确定融合特征；并且，基于融合特征，生成针对输入图像和输入问题的预测答案。本公开还提供了图像问答装置、计算机设备和介质。

49.

发明授权
图像处理方法、模型训练方法、装置、电子设备及介质有权

公开(公告)号：CN114022598B

公开(公告)日：2024-02-20

申请号：CN202111321970.8

申请日：2021-11-09

Applicant: 北京百度网讯科技有限公司

Inventor： 胡天舒 , 何声一 , 韩钧宇 , 洪智滨

IPC: G06T13/20 , G10L21/10 , G06V40/16 , G06V40/20 , G06V40/70 , G06V10/774

Abstract: 本公开提供了图像处理方法、模型训练方法、装置、电子设备及介质，涉及工智能技术领域，尤其涉及深度学习、计算机视觉等技术领域。具体实现方案为：生成第一人脸图像；所述第一人脸图像和参照人脸图像之间的清晰度差异和真实性差异在设定范围内；根据用于驱动所述第一人脸图像的目标语音，调整所述第一人脸图像中与发音相关的脸部动作信息，生成脸部组织位置符合所述目标语音发音规则的第二人脸图像；将所述第二人脸图像作为所述目标语音驱动后的人脸图像。本公开实施例能够提高人脸驱动效果。

50.

发明授权
一种视频拼接方法、装置、电子设备及存储介质有权

公开(公告)号：CN114125324B

公开(公告)日：2024-02-06

申请号：CN202111315996.1

申请日：2021-11-08

Applicant: 北京百度网讯科技有限公司

Inventor： 胡天舒 , 郭汉奇 , 韩钧宇 , 洪智滨

IPC: H04N5/265 , H04N21/44

Abstract: 本公开提供了一种视频拼接方法、装置、电子设备及存储介质，涉及人工智能技术领域，尤其涉及深度学习和计算机视觉技术领域。具体实现方案为：在第一视频的最后一个图像帧和第二个视频的第一个图像帧之间插入一个中间帧；在第一视频和第二视频中分别按照从后向前的顺序和从前向后的顺序依次选取L个图像帧；其中，L为大于1的自然数；基于中间帧以及第一视频中的L个图像帧和第二视频中的L个图像帧，将第一视频和第二视频拼接为目标视频。本申请实施例可以实现视频之间的平滑过渡，能够极大地降低视频拼接难度，同时还可以提高拼接速度，降低成本。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification