一种基于信息熵的文本特征量化方法和装置及文本分类方法和装置

    公开(公告)号:CN105224695B

    公开(公告)日:2018-04-20

    申请号:CN201510770947.5

    申请日:2015-11-12

    Applicant: 中南大学

    Abstract: 本发明公开了一种基于信息熵的文本特征量化方法和装置及文本分类方法和装置,根据特征词在文本文档内的词频和在不同文本类别上分布的信息熵来计算文档内各特征词的权重;同时可根据文本集各类别规模的非平衡性采用不同方式来计算特征词的类间分布熵,另外根据各特征词在文本集中的分布特点按需引入了反文档频率,而且适当缩减了局部词频因子,使得文档内各特征词的权重分配更合理,所生成的文档特征向量更充分地反映了不同类别文本的特征差异。所公开的文本特征量化装置和文本分类装置具备多个选项或参数,通过调节可获得最优的文本分类效果。所述文本特征量化方法不仅提高了文本分类的准确率,而且在不同文本集上的性能比较稳定。

    一种基于信息熵的文本特征量化方法和装置及文本分类方法和装置

    公开(公告)号:CN105224695A

    公开(公告)日:2016-01-06

    申请号:CN201510770947.5

    申请日:2015-11-12

    Applicant: 中南大学

    Abstract: 本发明公开了一种基于信息熵的文本特征量化方法和装置及文本分类方法和装置,根据特征词在文本文档内的词频和在不同文本类别上分布的信息熵来计算文档内各特征词的权重;同时可根据文本集各类别规模的非平衡性采用不同方式来计算特征词的类间分布熵,另外根据各特征词在文本集中的分布特点按需引入了反文档频率,而且适当缩减了局部词频因子,使得文档内各特征词的权重分配更合理,所生成的文档特征向量更充分地反映了不同类别文本的特征差异。所公开的文本特征量化装置和文本分类装置具备多个选项或参数,通过调节可获得最优的文本分类效果。所述文本特征量化方法不仅提高了文本分类的准确率,而且在不同文本集上的性能比较稳定。

    一种基于自适应论域划分的模糊控制方法

    公开(公告)号:CN104991443A

    公开(公告)日:2015-10-21

    申请号:CN201510395449.7

    申请日:2015-07-08

    Applicant: 中南大学

    Inventor: 龙军 胡扬 杨柳

    Abstract: 本发明公开了一种基于自适应论域划分的模糊控制方法,包括以下步骤:步骤1:论域划分:以被控量T的变化区间[x,y]作为论域区间;x和y分别是被控量的下限值和上限值;将论域区间划分为多个子区间,对每一个子区间分别定义模糊子集及模糊子集中每一个元素即模糊语言变量的隶属度函数;步骤2:采用模块控制策略并基于步骤1的模糊子集及隶属度函数对被控对象实施控制。该基于自适应论域划分的模糊控制方法易于实施,灵活性好,能有效改善控制效果。

    一种基于自适应论域划分的模糊控制方法

    公开(公告)号:CN104991443B

    公开(公告)日:2018-01-26

    申请号:CN201510395449.7

    申请日:2015-07-08

    Applicant: 中南大学

    Inventor: 龙军 胡扬 杨柳

    Abstract: 本发明公开了一种基于自适应论域划分的模糊控制方法,包括以下步骤:步骤1:步骤1:论域划分:以被控量T的变化区间[x,y]作为论域区间;x和y分别是被控量的下限值和上限值;将论域区间划分为多个子区间,对每一个子区间分别定义模糊子集及模糊子集中每一个元素即模糊语言变量的隶属度函数;步骤2:采用模块控制策略并基于步骤1的模糊子集及隶属度函数对被控对象实施控制。该基于自适应论域划分的模糊控制方法易于实施,灵活性好,能有效改善控制效果。

Patent Agency Ranking