一种基于条件随机场的电信领域命名实体识别方法

    公开(公告)号:CN107832296A

    公开(公告)日:2018-03-23

    申请号:CN201711096147.5

    申请日:2017-11-09

    Inventor: 章韵 张歌

    CPC classification number: G06F17/278

    Abstract: 本发明公开了一种基于条件随机场的电信领域命名实体识别方法,包括步骤:将语料转化为条件随机场CRF模型的输入格式并利用基于词的标注模型对其进行标注;选择上下文窗口大小及从候选特征集中选取特征以构建特征模版;定义条件随机场CRF模型的特征模版,将得到的语料及特征模版输入条件随机场CRF模型,得到电信领域命名实体识别CRF模型,并利用电信领域命名实体识别CRF模型进行待识别电信文本中的电信领域命名实体识别获得输出结果;从所得输出结果中还原识别出的电信领域命名实体。本发明通过自动化的方法进行电信领域命名实体抽取,在一定程度上提高了电信领域命名实体识别的效率,并且能够保证电信领域命名实体识别结果具有较好的准确率和召回率。

Patent Agency Ranking