发明公开
- 专利标题: 文本实体的识别方法及相关装置
-
申请号: CN202110361172.1申请日: 2021-04-02
-
公开(公告)号: CN113065346A公开(公告)日: 2021-07-02
- 发明人: 何东 , 陈华智 , 王红凯 , 黄宇腾 , 徐海青 , 毛冬 , 张辰 , 饶涵宇 , 陈是同 , 梁翀 , 浦正国 , 余江斌
- 申请人: 国网浙江省电力有限公司信息通信分公司 , 国网浙江省电力有限公司 , 安徽继远软件有限公司 , 国网信息通信产业集团有限公司
- 申请人地址: 浙江省杭州市黄龙路8号641室; ; ;
- 专利权人: 国网浙江省电力有限公司信息通信分公司,国网浙江省电力有限公司,安徽继远软件有限公司,国网信息通信产业集团有限公司
- 当前专利权人: 国网浙江省电力有限公司信息通信分公司,国网浙江省电力有限公司,安徽继远软件有限公司,国网信息通信产业集团有限公司
- 当前专利权人地址: 浙江省杭州市黄龙路8号641室; ; ;
- 代理机构: 北京集佳知识产权代理有限公司
- 代理商 尹秀
- 主分类号: G06F40/279
- IPC分类号: G06F40/279 ; G06N3/04 ; G06N3/08
摘要:
本申请公开了文本实体的识别方法及相关装置,其中,方法包括:从待处理文本序列中获取指代同一概念的实体表述;实体表述用于实体归一化;将实体表述转换为预设长度的表述向量;对待处理文本序列进行词嵌入处理,得到向量;对向量中用于实体识别的上下文特征进行编码,得到编码向量;对表述向量与编码向量进行拼接,得到拼接向量;将拼接向量解码为待处理文本序列的预测序列。本申请以向量为纽带将实体归一化和实体识别在向量空间上的联结起来。拼接向量既包含了实体归一化的信息,也包含了实体识别的信息,并且,实体归一化信息作用于实体识别。由于实体识别利用了实体归一化的信息,从而,使得实体识别结果更全面,提高实体识别的准确性。