-
公开(公告)号:CN107590195A
公开(公告)日:2018-01-16
申请号:CN201710692909.1
申请日:2017-08-14
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F17/30
Abstract: 本申请公开了一种文本分类模型训练方法、文本分类方法及其装置,该文本分类模型的训练方法,包括:通过计算训练文本集合中各候选词的词频-逆文档频率和互信息,筛选出若干特征词;基于各特征词,根据遗传算法训练文本分类模型。根据本申请实施例提供的技术方案,通过计算训练文本集合中各候选词的词频-逆文档频率和互信息,筛选出若干特征词,能够解决现有技术筛选的特征词准确率低下问题。