-
公开(公告)号:CN119418351A
公开(公告)日:2025-02-11
申请号:CN202411595491.9
申请日:2024-11-08
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06V30/19 , G06F40/183 , G06V30/413 , G06N3/0499 , G06N3/08
Abstract: 本公开提供了一种图像处理方法,涉及人工智能技术领域,尤其涉及深度学习、计算机视觉、大模型、生成式模型、多模态数据处理技术领域。具体实现方案为:从文档中提取包含图表的图像以及图像的图像描述文本;根据图像和图像描述文本,生成图表的元素描述文本;以及根据图表的元素描述文本生成表格数据。本公开还提供了一种深度学习模型的训练方法、装置、电子设备和存储介质。
-
公开(公告)号:CN119025734A
公开(公告)日:2024-11-26
申请号:CN202410955105.6
申请日:2024-07-16
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/953 , G06F18/241 , G06F18/214
Abstract: 本公开提供了网页文章内容提取及目标模型训练方法和装置,涉及深度学习、大模型以及自然语言处理等人工智能领域。其中的网页文章内容提取方法可包括:获取待处理网页,待处理网页中包括文章形式的网页数据;将待处理网页作为目标模型的输入,得到目标模型输出的网页文章内容提取结果,所述目标模型为对预训练的大语言模型进行微调后得到的。应用本公开所述方案,可节省人力和时间成本,并可提升处理效率及提升得到的网页文章内容提取结果的准确性等。
-
公开(公告)号:CN119990081A
公开(公告)日:2025-05-13
申请号:CN202510063722.X
申请日:2025-01-15
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F40/177 , G06F40/106 , G06F40/109 , G06F16/56 , G06N20/00 , G06F40/258
Abstract: 本公开提供了一种图表生成大模型的训练方法、图表生成方法及相关装置,涉及人工智能领域,尤其大模型、自然语言处理及深度学习等技术领域。图表生成大模型的训练方法包括:获取训练样本对,训练样本对中包括主题样本、与主题样本对应的参考SVG图表和至少两个SVG图表样本,至少两个SVG图表样本为相同图表类型的不同布局的SVG图表;将训练样本对输入图表生成大模型进行图表生成处理,得到图表生成大模型输出的预测SVG图表;基于预测SVG图表和参考SVG图表,微调图表生成大模型的模型参数。本公开的图表生成大模型能够根据主题自动生成布局多样、排版美观整齐以及内容合理丰富的SVG图表。
-
公开(公告)号:CN119250023A
公开(公告)日:2025-01-03
申请号:CN202411052984.8
申请日:2024-08-01
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F40/16 , G06F40/166
Abstract: 本公开提供了一种研究报告的生成方法、装置、电子设备及存储介质,涉及人工智能等技术领域。具体实现方案为:获取欲生成研究报告时用户输入的文本信息和其他类型信息;所述其他类型信息包括图片、图表、公式以及指定格式的文档中的至少一种;采用数据处理智能体模块抓取所述其他类型信息中的有效信息,得到有效文本信息;基于所述文本信息和所述有效文本信息,采用大纲智能体模块、信息索引智能体模块以及内容智能体模块,生成研究报告。本公开的技术,能够有效地提高研究报告的生成效率。
-
公开(公告)号:CN118378097A
公开(公告)日:2024-07-23
申请号:CN202410605300.6
申请日:2024-05-15
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本公开提供了一种文档生成方法、装置、设备以及存储介质,涉及人工智能技术领域,尤其神经网络模型、生成模型或大模型等技术领域。具体实现方案为:接收文档标题;利用该文档标题,生成文档大纲;基于该文档大纲,从文档知识库中检索相似段落,利用该文档大纲和该相似段落生成章节内容;基于该文档大纲,从数据知识库中检索相关数据,利用该文档大纲和该相关数据生成图表信息;以及,将该章节内容和该图表信息进行融合,以得到文档。本公开能够自动生成文档,节约人力和时间成本,提高文档生成效率。
-
公开(公告)号:CN119991876A
公开(公告)日:2025-05-13
申请号:CN202510046121.8
申请日:2025-01-10
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06T11/60 , G06F3/0482 , G06F3/04847 , G06F3/04845 , G06N5/04
Abstract: 本公开提出了一种图文内容生成、推送和代码生成大模型的训练方法,涉及大模型技术领域,方法包括响应于图表生成操作,展示需求输入页面;响应于输入完成操作,从所述需求展示输入页面提供的输入框中获取输入的图文生成需求文本;从预设的图文展示区域中,获取基于所述图文生成需求文本生成的目标图文内容,其中,所述目标图文内容可无损缩放。
-
公开(公告)号:CN119250024A
公开(公告)日:2025-01-03
申请号:CN202411053027.7
申请日:2024-08-01
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F40/16 , G06F40/166
Abstract: 本公开提供了一种基于生成式大模型生成研究报告的方法、装置及存储介质,涉及人工智能等技术领域。具体实现方案为:基于获取的用户的输入信息,获取研究报告的标题以及描述信息;所述描述信息用于限定要生成的所述研究报告;基于所述标题和所述描述信息,获取知识信息;基于所述标题和所述描述信息,采用预先训练的生成式大模型,采用至少两步的生成方式,生成研究报告的目标大纲;所述目标大纲中包括具有顺序关系的多个章节标题以及各章节内容的目标字数;基于所述目标大纲和所述知识信息,采用所述生成式大模型,生成研究报告的正文内容。本公开的技术,能够有效地提高研究报告的生成效率。
-
-
-
-
-
-