-
公开(公告)号:CN113609861B
公开(公告)日:2024-02-23
申请号:CN202110913799.3
申请日:2021-08-10
Applicant: 北京工商大学
IPC: G06F40/295 , G06F16/951 , G06N3/0442 , G06N3/0455 , G06N3/08
Abstract: 本发明涉及一种基于食品文献数据的多维度特征命名实体识别方法及系统,其方法包括:S1:获得食品领域文献的语料;S2:获取食品领域文献的字偏旁和字拼音,分别输入BiLSTM模型,获得字偏旁特征向量S和字拼音特征向量P;S3:对Bert模型进行预训练,得到训练好的预训练模型;把S1得到语料输入训练好的预训练模型,得到字维度的特征向量;S4:将字维度的特征向量、字偏旁特征向量和字拼音特征向量输入基于BiLSTM的神经网络模型,得到融合全文语义信息的特征向量;S5:将融合全文语义信息的特征向量输入CRF模型,最后得到命名实体识别结果。本发明通过将字的偏旁特征、拼音特征加入字维度向量表示中,提高了面向食品领域的文献数据的命名实体识别的准确性。
-
公开(公告)号:CN113609861A
公开(公告)日:2021-11-05
申请号:CN202110913799.3
申请日:2021-08-10
Applicant: 北京工商大学
IPC: G06F40/295 , G06F16/951 , G06N3/04 , G06N3/08
Abstract: 本发明涉及一种基于食品文献数据的多维度特征命名实体识别方法及系统,其方法包括:S1:获得食品领域文献的语料;S2:获取食品领域文献的字偏旁和字拼音,分别输入BiLSTM模型,获得字偏旁特征向量S和字拼音特征向量P;S3:对Bert模型进行预训练,得到训练好的预训练模型;把S1得到语料输入训练好的预训练模型,得到字维度的特征向量;S4:将字维度的特征向量、字偏旁特征向量和字拼音特征向量输入基于BiLSTM的神经网络模型,得到融合全文语义信息的特征向量;S5:将融合全文语义信息的特征向量输入CRF模型,最后得到命名实体识别结果。本发明通过将字的偏旁特征、拼音特征加入字维度向量表示中,提高了面向食品领域的文献数据的命名实体识别的准确性。
-