- 专利标题: 一种远程监督的Dual-Attention关系分类方法及系统
-
申请号: CN201810432079.3申请日: 2018-05-08
-
公开(公告)号: CN108829722B公开(公告)日: 2020-10-02
- 发明人: 贺敏 , 毛乾任 , 王丽宏 , 李晨
- 申请人: 国家计算机网络与信息安全管理中心
- 申请人地址: 北京市朝阳区裕民路甲3号
- 专利权人: 国家计算机网络与信息安全管理中心
- 当前专利权人: 国家计算机网络与信息安全管理中心
- 当前专利权人地址: 北京市朝阳区裕民路甲3号
- 代理机构: 北京华夏泰和知识产权代理有限公司
- 代理商 陈英
- 主分类号: G06F16/35
- IPC分类号: G06F16/35 ; G06F16/36 ; G06F40/295
摘要:
本发明涉及一种远程监督的Dual‑Attention关系分类方法及系统,包括:通过远程监督将知识库中的实体对对齐到新闻语料,构建实体对句子集合;基于词级别注意力机制的Bi‑LSTM模型将所述句子进行词级别的向量编码,得到所述句子的语义特征编码向量;基于句子级别注意力机制的Bi‑LSTM模型将所述句子的语义特征进行编码与去噪,得到句子集特征编码向量;将所述句子集特征编码向量与实体对翻译向量进行打包,对得到的包特征进行实体对的关系分类。本发明提供的技术方案降低了模型训练的噪声数据,避免人工标注数据及其造成的错误传递。运用开放域文本与大规模知识库进行实体对齐,有效解决了关系抽取的标注数据规模问题。
公开/授权文献
- CN108829722A 一种远程监督的Dual-Attention关系分类方法及系统 公开/授权日:2018-11-16