文本实体的识别方法及相关装置
摘要:
本申请公开了文本实体的识别方法及相关装置,其中,方法包括:从待处理文本序列中获取指代同一概念的实体表述;实体表述用于实体归一化;将实体表述转换为预设长度的表述向量;对待处理文本序列进行词嵌入处理,得到向量;对向量中用于实体识别的上下文特征进行编码,得到编码向量;对表述向量与编码向量进行拼接,得到拼接向量;将拼接向量解码为待处理文本序列的预测序列。本申请以向量为纽带将实体归一化和实体识别在向量空间上的联结起来。拼接向量既包含了实体归一化的信息,也包含了实体识别的信息,并且,实体归一化信息作用于实体识别。由于实体识别利用了实体归一化的信息,从而,使得实体识别结果更全面,提高实体识别的准确性。
0/0