一种事件抽取方法、相关装置、设备及存储介质

    公开(公告)号:CN113761122B

    公开(公告)日:2025-03-07

    申请号:CN202110546916.7

    申请日:2021-05-19

    Abstract: 本申请实施例公开了一种事件抽取方法、相关装置、设备及存储介质,用于将句级自然语言转化为结点和边,再将结点和边转化为语义特征来进行事件抽取,能够保证获取事件的精度。本申请实施例方法包括:获取待处理文本;根据待处理文本生成抽象语义表示,抽象语义表示包括与词语一一对应的结点,以及用于连接结点之间边;对抽象语义和文本表示进行语义编码处理,得到语义嵌入向量,语义嵌入向量用于表示每个词语的与事件之间的语义特征;对抽象语义表示进行图编码处理,得到图嵌入向量,其中,图嵌入向量为用于表示通过边相连接的结点的结构特征;将语义嵌入向量与图嵌入向量进行拼接,得到拼接特征向量;对拼接特征向量进行识别,输出目标事件。

    基于新闻事件的关系分析方法及装置

    公开(公告)号:CN113158672B

    公开(公告)日:2024-11-08

    申请号:CN202110326769.2

    申请日:2021-03-26

    Applicant: 清华大学

    Abstract: 本发明提供一种基于新闻事件的关系分析方法及装置,其中方法包括:获取多篇新闻文本;对多篇新闻文本进行聚类,得到聚类后的多个新闻事件;对多个新闻事件进行实体链接、实体抽取、实体关系抽取、事件关系抽取、实体与事件关系抽取,根据实体链接结果、实体抽取结果、实体关系抽取结果、事件关系抽取结果、实体与事件关系抽取结果进行关联分析得到分析结果。本发明通过原始新闻文本聚类实现新闻事件级别分析,得到多个事件,再通过对事件文本抽取实体、实体关系、事件关系、事件与实体的关系。进而通过实体链接,将实体背景知识进行补充,实现对事件的深层次挖掘,从而使读者能够获得更全面和深入的信息。

    跨域推荐方法、装置、电子设备及存储介质

    公开(公告)号:CN115098692B

    公开(公告)日:2024-09-20

    申请号:CN202210614778.6

    申请日:2022-05-30

    Applicant: 清华大学

    Abstract: 本发明提供一种跨域推荐方法、装置、电子设备及存储介质,其中,所述方法应用于数据稀疏的目标域,目标域的目标域实体包括待推荐用户实体和待推荐商品实体,所述方法包括:获取知识图谱和源域,其中,源域中的源域实体包括源域用户实体和源域商品实体;基于知识图谱,对目标域实体和源域实体进行转换,得到目标域实体向量和源域实体向量;基于目标域实体向量和源域实体向量,通过图注意力模型得到待推荐用户实体的融合偏好特征;基于待推荐用户实体的融合偏好特征,通过跨域贝叶斯机制进行推荐,得到待推荐用户实体关于待推荐商品实体的推荐排序。通过本发明提高了对待推荐用户实体进行商品实体推荐的推荐效率。

    融合关系短语知识的关系抽取方法、装置和电子设备

    公开(公告)号:CN113705237B

    公开(公告)日:2024-07-23

    申请号:CN202110881415.4

    申请日:2021-08-02

    Applicant: 清华大学

    Abstract: 本发明提供一种融合关系短语知识的关系抽取方法、装置和电子设备,包括:确定待抽取关系语句,以及该语句中的待抽取关系的两个实体的位置信息;将所述待抽取关系语句和所述位置信息输入抽取模型,输出所述两个实体的关系类型;其中,所述抽取模型是基于样本语句、对应的样本头尾实体位置和对应的头尾实体间关系类型标签进行训练得到的,所述抽取模型训练时的网络结构包括语句编码器、协同切割关系短语表示网络、关系记忆网络和关系短语类别分类网络。本发明提供的方法、装置和电子设备,实现了融合关系短语的语义信息到关系类型中,提高了语句中关系类型抽取的准确率。

    用于为在线课程建立知识库的方法

    公开(公告)号:CN118020080A

    公开(公告)日:2024-05-10

    申请号:CN202180101405.2

    申请日:2021-08-06

    Abstract: 本公开内容提供了一种用于为在线课程建立知识库的方法。所述方法包括:从多个课程中获得多个概念,其中,所述多个课程包括视频和练习;将所述课程中包括的所述视频和所述练习中的每一项链接到所述多个概念中的一个或多个相关概念;以及将多个学生行为中的每个学生行为链接到所述多个概念中的一个或多个相关概念,其中,所建立的知识库包括以下各项:包括所述视频和所述练习的所述多个课程、所述多个学生行为、所述多个概念、所述视频与所述多个概念之间的链接、所述练习与所述多个概念之间的链接、所述学生行为与所述多个概念之间的链接。

    问答推理方法及装置
    8.
    发明授权

    公开(公告)号:CN114817512B

    公开(公告)日:2023-03-14

    申请号:CN202210738644.5

    申请日:2022-06-28

    Applicant: 清华大学

    Abstract: 本发明涉及人工智能技术领域,提供一种问答推理方法及装置,其中方法包括:确定推理目标问题的答案所需的至少一个算子;针对至少一个算子中至少部分需要访问知识库的算子,基于知识库中预先构建的知识元素的倒排索引结构,访问知识库,以得到算子的执行结果;基于至少一个算子的执行结果,得到答案。如此解决现有技术中推理引擎的推理效率不高的缺陷,由于确定的推理目标问题的答案所需的至少一个算子,能够展示出推理目标问题的答案的过程,透明可解释,并且,由于针对至少部分需要访问知识库的算子,基于知识库中预先构建的知识元素的倒排索引结构,访问知识库,以得到算子的执行结果,提高了算子的执行速度,进而提高了答案的推理效率。

    一种实体记录匹配方法及系统

    公开(公告)号:CN114781471B

    公开(公告)日:2022-12-27

    申请号:CN202110614418.1

    申请日:2021-06-02

    Applicant: 清华大学

    Abstract: 本发明提供一种实体记录匹配方法及系统,该方法包括:获取待匹配的实体记录集合,所述实体记录集合中的实体记录是由实体的属性和属性值组成的;将所述实体记录集合输入到训练好的实体记录匹配模型,得到所述实体记录集合中实体记录之间的匹配结果,其中,所述训练好的实体记录匹配模型是由自监督学习方法训练后的神经网络和决策树算法训练后的决策树模型构建得到的。本发明通过神经网络对实体转换为属性值向量,利用自动构建的关键属性树,克服深度学习可解释性差的缺点,能将学习到的关键属性树转化成匹配规则,运用到其他数据集中;同时,本发明对应模型的训练仅需要少量的标记实体记录对,克服了现有方法需要大量标记实体记录对的缺点。

    开放式信息抽取方法、装置、电子设备及存储介质

    公开(公告)号:CN112527981B

    公开(公告)日:2022-11-11

    申请号:CN202011312007.9

    申请日:2020-11-20

    Applicant: 清华大学

    Abstract: 本发明提供一种开放式信息抽取方法、装置、电子设备及存储介质,其中,该方法包括:根据预设的知识图谱,获取目标技术领域的文档集中每一待提取文档中的候选三元组;根据各待提取文档中的候选三元组,建立图表示模型,根据图表示模型,获取每一待提取文档中每一候选三元组的重要性分值;对于每一待提取文档,根据每一待提取文档中各候选三元组的重要性分值,获取抽取结果。本发明提供的开放式信息抽取方法、装置、电子设备及存储介质,根据从目标技术领域的文档集中提取出的各候选三元组,建立图表示模型,根据图表示模型,获取候选三元组的重要性分值,对待提取文档中的候选三元组进行筛选,获取抽取结果,能提高开放式信息抽取的准确率。

Patent Agency Ranking