针对复杂知识图谱问答任务的知识改写方法

    公开(公告)号:CN119025683A

    公开(公告)日:2024-11-26

    申请号:CN202411177700.8

    申请日:2024-08-26

    Applicant: 东南大学

    Abstract: 本发明涉及一种针对复杂知识图谱问答任务的知识改写方法,具体如下,步骤1,将GLM‑4作为数据生成器,构建用于监督训练的数据集,步骤2,基于构建的数据集,对开源大模型进行监督训练,使其初步掌握知识改写的能力,步骤3,从监督训练后的大模型中采样同一知识改写任务的多种输出,作为候选知识表示形式,步骤4,对于候选知识表示形式,将其作为问答任务的上下文,以获取问题对应的答案,构建偏好数据集,步骤5,采用GLM‑4对偏好的知识表示形式进行改写,提升数据集的质量和多样性,步骤6,采用偏好数据集基于DPO算法微调开源大模型,使其与问答模型的偏好对齐。显著提升了大模型在处理复杂知识图谱问答任务中的性能。

    一种用于知识点定位的语义匹配模型

    公开(公告)号:CN112926340B

    公开(公告)日:2024-05-07

    申请号:CN202110319217.9

    申请日:2021-03-25

    Applicant: 东南大学

    Abstract: 本发明公开了一种用于知识点定位的语义匹配模型,主要用于解决电学领域题目知识点定位的问题。本发明首先对原始教材进行预处理,形成语料。然后,使用基于统计学的语义匹配模型TF‑IDF,LSI以及LDA编码。之后,再使用深度学习的语义匹配模型加强深度语义理解,通过BERT编码。随后,对于以上四种编码方式,计算余弦相似度作为语义相似的衡量。最后,基于投票的语义匹配集成模型根据教材片段出现在前列的次数和余弦相似度选择用户指定数量的教材片段作为最终知识点定位的结果。

    一种用于知识点定位的语义匹配模型

    公开(公告)号:CN112926340A

    公开(公告)日:2021-06-08

    申请号:CN202110319217.9

    申请日:2021-03-25

    Applicant: 东南大学

    Abstract: 本发明公开了一种用于知识点定位的语义匹配模型,主要用于解决电学领域题目知识点定位的问题。本发明首先对原始教材进行预处理,形成语料。然后,使用基于统计学的语义匹配模型TF‑IDF,LSI以及LDA编码。之后,再使用深度学习的语义匹配模型加强深度语义理解,通过BERT编码。随后,对于以上四种编码方式,计算余弦相似度作为语义相似的衡量。最后,基于投票的语义匹配集成模型根据教材片段出现在前列的次数和余弦相似度选择用户指定数量的教材片段作为最终知识点定位的结果。

Patent Agency Ranking