一种基于纠错输出编码的无需消歧的无监督词性标注方法

    公开(公告)号:CN105955955A

    公开(公告)日:2016-09-21

    申请号:CN201610292680.8

    申请日:2016-05-05

    Applicant: 东南大学

    CPC classification number: G06F17/274 G06F17/2705

    Abstract: 本发明公开了一种基于纠错输出编码的无需消歧的无监督词性标注方法,包括两个主要步骤:(1)基于词性字典生成训练数据。(2)基于纠错输出编码进行训练与测试。本发明不需标注语料,可以应用于不易获得标注语料的语言的词性标注问题;不需消歧,避免了迭代式消歧过程中的错误传播问题;采用神经语言模型自动生成训练和测试使用的特征,避免了手动选取和构建特征。

    一种基于纠错输出编码的无需消歧的无监督词性标注方法

    公开(公告)号:CN105955955B

    公开(公告)日:2018-08-28

    申请号:CN201610292680.8

    申请日:2016-05-05

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于纠错输出编码的无需消歧的无监督词性标注方法,包括两个主要步骤:(1)基于词性字典生成训练数据。(2)基于纠错输出编码进行训练与测试。本发明不需标注语料,可以应用于不易获得标注语料的语言的词性标注问题;不需消歧,避免了迭代式消歧过程中的错误传播问题;采用神经语言模型自动生成训练和测试使用的特征,避免了手动选取和构建特征。

Patent Agency Ranking