一种基于PRADO的实体识别方法
摘要:
本发明涉及计算机网络技术领域,特别涉及一种基于PRADO的实体识别方法,包括获取原始数据,并对原始数据进行分词、标注处理;在PRADO层,基于投影嵌入模型,使用局部敏感哈希构建投影网络,将句子中的每个字转化为低维的Embedding词表;利用BiLSTM神经网络上下文关联的特点提取Embedding向量特征;将BiLSTM层获取的特征向量通过注意力机制的方法分配以不同的注意力权重;利用CRF完成序列标注的任务;本发明采用LSH算法来构建投影网络,以达到减少词嵌入向量参数的目的,同时使用注意力机制来保证该特征向量与全文的联系,来消除LSH算法不能较好的联系上下文的隐患。
公开/授权文献
0/0