一种基于多视图蒸馏增强的实体链接方法

    公开(公告)号:CN118760772A

    公开(公告)日:2024-10-11

    申请号:CN202410736212.X

    申请日:2024-06-07

    Abstract: 本发明公开了一种基于多视图蒸馏增强的实体链接方法。本方法包括:1)多视图实体表征:将每个实体原本篇章级的文本描述分成多个句子级的视图,对每一视图独立地经过语言模型进行编码,得到每一句子视图对应的向量表征;从中选择一个和提及最相关的视图的向量表征作为实体的向量表征,以避免与提及无关的信息被引入到实体表征中;2)多视图蒸馏增强:在引入了细粒度的视图表征后,通过交叉对齐和自对齐机制,分别在原始的实体层次以及细粒度的视图层次两个维度上对齐学生模型和教师模型间的相关性分数分布,从而促进教师模型到学生模型的细粒度知识蒸馏。本发明促进了实体链接系统的整体性能的提升。

    一种基于卷积神经网络的用户属性推断方法和装置

    公开(公告)号:CN108492200B

    公开(公告)日:2022-06-17

    申请号:CN201810124041.X

    申请日:2018-02-07

    Abstract: 本发明涉及一种基于卷积神经网络的用户属性推断方法和装置。该方法根据用户节点的属性和好友关系,建立自中心网络;然后采用卷积神经网络提取所述自中心网络中用户节点的属性信息和好友关系中所包含的隐藏信息,利用所述隐藏信息推断出用户的缺失属性。针对好友关系无法直接获取或获取难度较大的社交网络,采用神经网络仅利用用户的属性信息对缺失的属性进行分类预测。本发明可以很好的避免人为定义相似度函数的局限性,而且通过卷积核的卷积操作能够更好的表现出不同属性间以及不同的属性维度间的关系,从而能够高效、准确地进行用户缺失属性推断。

    一种基于文本分类的中文表格列标签恢复方法和系统

    公开(公告)号:CN109710725A

    公开(公告)日:2019-05-03

    申请号:CN201811524302.3

    申请日:2018-12-13

    Abstract: 本发明涉及一种基于文本分类的中文表格列标签恢复方法和系统。该方法的步骤包括:1)从表格中的每一行中提取实体,在网络百科知识平台中搜索提取的实体,获取实体对应的信息详情页面;2)对实体的每一个属性,在实体的信息详情页面中抽取包含属性值的句子,组成属性值的相关文本;3)将属性值的相关文本输入文本分类器中,获取属性值所属的类别,即为属性值所在单元格的类别;4)对于表格的属性列,根据属性列中各单元格所属的类别,使用多数投票的规则确定该属性列的列标签。本发明能够有效的对网络表格进行列标签恢复,恢复列标签后的表格可用于中文知识图谱的构建和扩展,也可用于数据抽取和表格搜索等应用。

    一种基于卷积神经网络的用户属性推断方法和装置

    公开(公告)号:CN108492200A

    公开(公告)日:2018-09-04

    申请号:CN201810124041.X

    申请日:2018-02-07

    Abstract: 本发明涉及一种基于卷积神经网络的用户属性推断方法和装置。该方法根据用户节点的属性和好友关系,建立自中心网络;然后采用卷积神经网络提取所述自中心网络中用户节点的属性信息和好友关系中所包含的隐藏信息,利用所述隐藏信息推断出用户的缺失属性。针对好友关系无法直接获取或获取难度较大的社交网络,采用神经网络仅利用用户的属性信息对缺失的属性进行分类预测。本发明可以很好的避免人为定义相似度函数的局限性,而且通过卷积核的卷积操作能够更好的表现出不同属性间以及不同的属性维度间的关系,从而能够高效、准确地进行用户缺失属性推断。

    一种基于多视图蒸馏增强的实体链接方法

    公开(公告)号:CN118760772B

    公开(公告)日:2025-04-01

    申请号:CN202410736212.X

    申请日:2024-06-07

    Abstract: 本发明公开了一种基于多视图蒸馏增强的实体链接方法。本方法包括:1)多视图实体表征:将每个实体原本篇章级的文本描述分成多个句子级的视图,对每一视图独立地经过语言模型进行编码,得到每一句子视图对应的向量表征;从中选择一个和提及最相关的视图的向量表征作为实体的向量表征,以避免与提及无关的信息被引入到实体表征中;2)多视图蒸馏增强:在引入了细粒度的视图表征后,通过交叉对齐和自对齐机制,分别在原始的实体层次以及细粒度的视图层次两个维度上对齐学生模型和教师模型间的相关性分数分布,从而促进教师模型到学生模型的细粒度知识蒸馏。本发明促进了实体链接系统的整体性能的提升。

Patent Agency Ranking