Patent search ap:("北京百度网讯科技有限公司") AND inv:"顾佳昕" Page 1

1.

发明公开
基于大模型的问答信息生成方法、装置、电子设备及介质审中-实审

公开(公告)号：CN118568240A

公开(公告)日：2024-08-30

申请号：CN202410889692.3

申请日：2024-07-03

Applicant: 北京百度网讯科技有限公司

Inventor： 顾佳昕 , 李弼 , 希滕 , 张刚

IPC: G06F16/332 , G06F16/33 , G06F16/338 , G06F16/35 , G06F40/216

Abstract: 本公开提供了一种基于大模型的问答信息生成方法、装置、电子设备及存储介质，涉及人工智能技术领域，尤其涉及计算机视觉、深度学习、大模型等技术领域，可应用于人机交互等场景。具体实现方案为：根据提问文本和与提问文本相关联的图像，生成初始应答文本；确定针对图像的图像内容的第一描述文本；确定针对图像中对象的第二描述文本；以及根据提问文本、第一描述文本和第二描述文本，基于大模型对初始应答文本进行修正，得到目标应答文本。

2.

发明公开
生成多模态偏好数据的方法、装置、设备以及存储介质审中-实审

公开(公告)号：CN118747292A

公开(公告)日：2024-10-08

申请号：CN202410882599.X

申请日：2024-07-02

Applicant: 北京百度网讯科技有限公司

Inventor： 顾佳昕 , 李弼 , 希滕 , 张刚

IPC: G06F18/214 , G06V20/70 , G06V10/82 , G06N3/04 , G06N5/04

Abstract: 本公开提供了一种生成多模态偏好数据的方法、装置、设备以及存储介质，涉及人工智能技术领域，尤其涉及计算机视觉、深度学习、大模型等技术领域，可应用于生成式人工智能(AIGC)、人机交互等场景。具体实现方案为：接收用户指令、第一文件和针对用户指令和第一文件的多个问答信息；第一文件包括图像和视频中的至少之一；提取第一文件的视觉信息；将用户指令、多个问答信息和视觉信息输入预先训练的神经网络模型，以获取针对各个问答信息的评估值；基于用户指令、第一文件、多个问答信息和针对各个问答信息的评估值，生成多模态偏好数据。

Patent Agency Ranking