- 专利标题: 一种基于知网的多义词中文实体关系识别方法
-
申请号: CN202110309085.1申请日: 2021-03-23
-
公开(公告)号: CN113239663B公开(公告)日: 2022-07-12
- 发明人: 赵忠华 , 余在洋 , 王禄恒 , 张磊 , 赵志云 , 王勇 , 葛自发 , 孙小宁 , 万欣欣 , 李欣 , 孙立远 , 付培国 , 王晴 , 杜宛真
- 申请人: 国家计算机网络与信息安全管理中心 , 中国科学院信息工程研究所
- 申请人地址: 北京市朝阳区裕民路甲3号;
- 专利权人: 国家计算机网络与信息安全管理中心,中国科学院信息工程研究所
- 当前专利权人: 国家计算机网络与信息安全管理中心,中国科学院信息工程研究所
- 当前专利权人地址: 北京市朝阳区裕民路甲3号;
- 代理机构: 北京君尚知识产权代理有限公司
- 代理商 司立彬
- 主分类号: G06F40/126
- IPC分类号: G06F40/126 ; G06F40/216 ; G06F40/242 ; G06F40/284 ; G06F40/295 ; G06F40/30 ; G06N3/04 ; G06N3/08
摘要:
本发明公开了一种基于知网的多义词中文实体关系识别方法,其步骤包括:1)对中文网事数据中的每一条语料样本基于知网进行字颗粒度的向量化,得到每一个字对的字颗粒度向量;然后对每一字颗粒度向量所在的位置信息进行编码,得到语料中每个字与预标注的待识别实体关系对的相对位置编码;2)根据步骤1)所得结果生成每一语料样本的字颗粒度语义向量集合;3)基于知网生成每一语料的词颗粒度语义向量集合;4)利用各语义向量及其对应位置编码训练深度自注意力神经网络,得到深度自注意力神经网络编码器;5)生成待处理语料中字和词汇的语义向量及其对应位置编码输入深度自注意力神经网络编码器,得到该待处理语料中的实体关系。
公开/授权文献
- CN113239663A 一种基于知网的多义词中文实体关系识别方法 公开/授权日:2021-08-10