一种摘要抽取方法、装置、存储介质以及计算机设备

    公开(公告)号:CN115688755A

    公开(公告)日:2023-02-03

    申请号:CN202211420423.X

    申请日:2022-11-15

    Abstract: 本发明实施例公开了一种摘要提取方法、装置、存储介质以及计算机设备,其中,该方法包括:遍历目标文本中目标段落的语句,对于遍历到的第一语句,计算第一语句与第二语句之间的第一语义相似度、第一语句与目标段落之间的第二语义相似度以及第一语句与目标文本之间的第三语义相似度,根据目标段落的每个语句对应的第一语义相似度、第二语义相似度以及第三语义相似度,确定目标段落的关键句,将目标段落的关键句组成目标文本的摘要。本发明通过第一语义相似度结合第二语义相似度以及第三语义相似度,能够使得关键句的选取考虑到了目标文本中句子、段落、篇章等维度的语义信息,进而提高了关键句提取的精确度。

    电力领域热点话题发现方法、装置、介质和设备

    公开(公告)号:CN119493855A

    公开(公告)日:2025-02-21

    申请号:CN202411626134.4

    申请日:2024-11-14

    Abstract: 本发明公开了一种电力领域热点话题发现方法、装置、介质和设备,首先通过标签标记文本来区分电力领域的子领域,然后通过自指导生成提问指令,构建指令数据库。接着,基于电力领域的语料库对初始大语言模型进行增量训练,并使用指令数据库进行微调,从而获得适应电力领域的目标大语言模型。最后,利用知识图谱检索最新的标签文本,将其输入模型以生成热点话题。可以理解的是,本方法通过增量训练和微调,使大语言模型在电力领域内具备更强的理解和生成能力,解决了“幻觉”问题。同时通过实时更新的数据、标签和知识图谱,系统能够提供更加精准、时效性高的热点话题,确保生成内容的专业性和准确性。

Patent Agency Ranking