-
公开(公告)号:CN107608999A
公开(公告)日:2018-01-19
申请号:CN201710582070.6
申请日:2017-07-17
Applicant: 南京邮电大学
Abstract: 本发明公开了一种适用于自动问答系统的问句分类方法,适用于计算机技术领域,该方法包括:获取待分类的问句,利用分词工具进行分词和词性标注;获取所述分词操作后的待分类问句,进行预处理;获预处理过后的待分类问句,找出问句中的关键词,组成关键词集合,根据改进的TF-IDF算法计算关键词集合中关键词的权重,根据特定的方法取前N个关键词;根据依存句法分析方法,提取问句中关键词的主谓、动宾及定中三种依存句法关系特征;利用训练好的朴素贝叶斯模型对关键词向量进行分类,得出分类结果。本发明提高了问句分类的准确性及效率。