-
公开(公告)号:CN118568240A
公开(公告)日:2024-08-30
申请号:CN202410889692.3
申请日:2024-07-03
Applicant: 北京百度网讯科技有限公司
IPC: G06F16/332 , G06F16/33 , G06F16/338 , G06F16/35 , G06F40/216
Abstract: 本公开提供了一种基于大模型的问答信息生成方法、装置、电子设备及存储介质,涉及人工智能技术领域,尤其涉及计算机视觉、深度学习、大模型等技术领域,可应用于人机交互等场景。具体实现方案为:根据提问文本和与提问文本相关联的图像,生成初始应答文本;确定针对图像的图像内容的第一描述文本;确定针对图像中对象的第二描述文本;以及根据提问文本、第一描述文本和第二描述文本,基于大模型对初始应答文本进行修正,得到目标应答文本。
-
公开(公告)号:CN118747292A
公开(公告)日:2024-10-08
申请号:CN202410882599.X
申请日:2024-07-02
Applicant: 北京百度网讯科技有限公司
IPC: G06F18/214 , G06V20/70 , G06V10/82 , G06N3/04 , G06N5/04
Abstract: 本公开提供了一种生成多模态偏好数据的方法、装置、设备以及存储介质,涉及人工智能技术领域,尤其涉及计算机视觉、深度学习、大模型等技术领域,可应用于生成式人工智能(AIGC)、人机交互等场景。具体实现方案为:接收用户指令、第一文件和针对用户指令和第一文件的多个问答信息;第一文件包括图像和视频中的至少之一;提取第一文件的视觉信息;将用户指令、多个问答信息和视觉信息输入预先训练的神经网络模型,以获取针对各个问答信息的评估值;基于用户指令、第一文件、多个问答信息和针对各个问答信息的评估值,生成多模态偏好数据。
-