网页文章内容提取及目标模型训练方法和装置

    公开(公告)号:CN119025734A

    公开(公告)日:2024-11-26

    申请号:CN202410955105.6

    申请日:2024-07-16

    Abstract: 本公开提供了网页文章内容提取及目标模型训练方法和装置,涉及深度学习、大模型以及自然语言处理等人工智能领域。其中的网页文章内容提取方法可包括:获取待处理网页,待处理网页中包括文章形式的网页数据;将待处理网页作为目标模型的输入,得到目标模型输出的网页文章内容提取结果,所述目标模型为对预训练的大语言模型进行微调后得到的。应用本公开所述方案,可节省人力和时间成本,并可提升处理效率及提升得到的网页文章内容提取结果的准确性等。

    图表生成大模型的训练方法、图表生成方法及相关装置

    公开(公告)号:CN119990081A

    公开(公告)日:2025-05-13

    申请号:CN202510063722.X

    申请日:2025-01-15

    Abstract: 本公开提供了一种图表生成大模型的训练方法、图表生成方法及相关装置,涉及人工智能领域,尤其大模型、自然语言处理及深度学习等技术领域。图表生成大模型的训练方法包括:获取训练样本对,训练样本对中包括主题样本、与主题样本对应的参考SVG图表和至少两个SVG图表样本,至少两个SVG图表样本为相同图表类型的不同布局的SVG图表;将训练样本对输入图表生成大模型进行图表生成处理,得到图表生成大模型输出的预测SVG图表;基于预测SVG图表和参考SVG图表,微调图表生成大模型的模型参数。本公开的图表生成大模型能够根据主题自动生成布局多样、排版美观整齐以及内容合理丰富的SVG图表。

    研究报告的生成方法、装置、电子设备及存储介质

    公开(公告)号:CN119250023A

    公开(公告)日:2025-01-03

    申请号:CN202411052984.8

    申请日:2024-08-01

    Abstract: 本公开提供了一种研究报告的生成方法、装置、电子设备及存储介质,涉及人工智能等技术领域。具体实现方案为:获取欲生成研究报告时用户输入的文本信息和其他类型信息;所述其他类型信息包括图片、图表、公式以及指定格式的文档中的至少一种;采用数据处理智能体模块抓取所述其他类型信息中的有效信息,得到有效文本信息;基于所述文本信息和所述有效文本信息,采用大纲智能体模块、信息索引智能体模块以及内容智能体模块,生成研究报告。本公开的技术,能够有效地提高研究报告的生成效率。

    基于生成式大模型生成研究报告的方法、装置及存储介质

    公开(公告)号:CN119250024A

    公开(公告)日:2025-01-03

    申请号:CN202411053027.7

    申请日:2024-08-01

    Abstract: 本公开提供了一种基于生成式大模型生成研究报告的方法、装置及存储介质,涉及人工智能等技术领域。具体实现方案为:基于获取的用户的输入信息,获取研究报告的标题以及描述信息;所述描述信息用于限定要生成的所述研究报告;基于所述标题和所述描述信息,获取知识信息;基于所述标题和所述描述信息,采用预先训练的生成式大模型,采用至少两步的生成方式,生成研究报告的目标大纲;所述目标大纲中包括具有顺序关系的多个章节标题以及各章节内容的目标字数;基于所述目标大纲和所述知识信息,采用所述生成式大模型,生成研究报告的正文内容。本公开的技术,能够有效地提高研究报告的生成效率。

Patent Agency Ranking