-
公开(公告)号:CN115688755A
公开(公告)日:2023-02-03
申请号:CN202211420423.X
申请日:2022-11-15
Applicant: 云南电网有限责任公司电力科学研究院
IPC: G06F40/279 , G06F40/216 , G06F40/30
Abstract: 本发明实施例公开了一种摘要提取方法、装置、存储介质以及计算机设备,其中,该方法包括:遍历目标文本中目标段落的语句,对于遍历到的第一语句,计算第一语句与第二语句之间的第一语义相似度、第一语句与目标段落之间的第二语义相似度以及第一语句与目标文本之间的第三语义相似度,根据目标段落的每个语句对应的第一语义相似度、第二语义相似度以及第三语义相似度,确定目标段落的关键句,将目标段落的关键句组成目标文本的摘要。本发明通过第一语义相似度结合第二语义相似度以及第三语义相似度,能够使得关键句的选取考虑到了目标文本中句子、段落、篇章等维度的语义信息,进而提高了关键句提取的精确度。
-
公开(公告)号:CN119493855A
公开(公告)日:2025-02-21
申请号:CN202411626134.4
申请日:2024-11-14
Applicant: 云南电网有限责任公司电力科学研究院
IPC: G06F16/334 , G06F16/36 , G06N5/04 , G06F18/24 , G06F18/22
Abstract: 本发明公开了一种电力领域热点话题发现方法、装置、介质和设备,首先通过标签标记文本来区分电力领域的子领域,然后通过自指导生成提问指令,构建指令数据库。接着,基于电力领域的语料库对初始大语言模型进行增量训练,并使用指令数据库进行微调,从而获得适应电力领域的目标大语言模型。最后,利用知识图谱检索最新的标签文本,将其输入模型以生成热点话题。可以理解的是,本方法通过增量训练和微调,使大语言模型在电力领域内具备更强的理解和生成能力,解决了“幻觉”问题。同时通过实时更新的数据、标签和知识图谱,系统能够提供更加精准、时效性高的热点话题,确保生成内容的专业性和准确性。
-
公开(公告)号:CN117251580A
公开(公告)日:2023-12-19
申请号:CN202311203409.9
申请日:2023-09-18
Applicant: 云南电网有限责任公司电力科学研究院
IPC: G06F16/36 , G06F16/33 , G06F16/9535 , G06N3/08
Abstract: 本申请实施例公开了电力项目的话题推荐模型的训练方法及相关设备,利用协作知识图谱损失函数和预设的深度学习算法训练预设的话题推荐模型,使话题推荐系统所推荐的知识文档与用户具备较高的关联性。同时协作知识图谱是一个包含丰富内容的知识文档的结构化数据图,能够完整的记录与预设电力项目相关的知识文档,使训练后的话题推荐模型所推荐的知识文档更为全面。
-
公开(公告)号:CN117171291A
公开(公告)日:2023-12-05
申请号:CN202311099681.7
申请日:2023-08-29
Applicant: 云南电网有限责任公司电力科学研究院
IPC: G06F16/31 , G06F16/332 , G06F16/35 , G06F40/279 , G06F40/186 , G06F40/126 , G06F18/2415 , G06N3/0499
Abstract: 本发明公开了一种基于提示学习的实体关系抽取方法、装置、介质和设备,首先构建包含待抽取文本和实体问题的实体抽取模板,及构建包含待抽取文本和关系类别的关系抽取模板关系问题抽取模板;然后将实体抽取模板与文本进行组合,通过对句子特征进行编码,并基于提示学习进行调优,抽取实体集合。最后,将前一步抽取的实体集合加入关系问题抽取模板并与文本进行组合,通过关系问题抽取模板抽取待抽取文本中的预设关系及包含预设关系的实体作为三元组。本发明通过转换任务的形式,充分利用问答领域预训练模型,通过构建问题模板来对模型进行信息提示,可以有效减少对标注数据的依赖,实现少样本下的实体和关系抽取具有良好的实用性。
-
-
-