摘要:
本发明涉及一种基于句法特性与统计融合的自然语言谓语动词识别方法,属于自然语言处理技术领域。本发明首先对输入的待测句子进行预处理分析,具体包括:判定语种、词性标注、对应的过滤处理和疑似动词抽取;其次,进行疑似谓语动词的排查,通过句法特性甄别出疑似动词中的谓语动词;接着判断该动词是否以动词搭配组的情况出现,这里利用φ2统计法来判断动词搭配组的真伪;最后根据识别结果输出所测句子的谓语动词或是谓语动词搭配组信息。本发明通过词性标注,过滤处理和疑似动词抽取来提高识别谓语动词的高效性,通过句法特性分析和φ2统计法提高识别谓语动词和谓语动词搭配的精确性。本发明的可行性高并适用于一般自然语言的谓语动词识别。
公开/授权文献
- CN106294315A 基于句法特性与统计融合的自然语言谓语动词识别方法 公开/授权日:2017-01-04