-
公开(公告)号:CN119599107A
公开(公告)日:2025-03-11
申请号:CN202411483004.X
申请日:2024-10-23
Applicant: 国网江苏省电力有限公司经济技术研究院
IPC: G06N5/022 , G06N3/0442 , G06N3/0464 , G06N3/045 , G06F16/353 , G06F40/30 , G06N5/04 , G06N5/025 , G06F16/3329 , G06F16/334
Abstract: 本发明公开了一种基于大语言模型的文档关键信息检索方法,根据多级输入的文档和用户输入的问题输出检索结果,该方法包括:构建领域知识图谱;构建并训练问题提取模型,通过问题提取模型得到用户输入的问题的关键信息和意图;根据关键信息和意图在知识图谱中检索,形成对关键信息的段落描述;对所述文档进行筛选并拆分成多个文本块,得到与用户输入的内容最相关的若干个文本块;使用大语言模型得出最高嵌入相似性的对应文本块;采用大语言模型整合推理对应文本块和段落描述,得到文档中的关于用户输入问题的信息。有益效果:不仅能够提高信息抽取的准确性和效率,还能够适应不同领域的特定需求,为文档自动化处理和知识管理提供强有力的技术支持。