基于FCBF的自定义特征维数文本特征选择算法

    公开(公告)号:CN109885682B

    公开(公告)日:2022-08-16

    申请号:CN201910071963.3

    申请日:2019-01-25

    Abstract: 本发明公开了一种基于FCBF的自定义特征维数文本特征选择算法,包括步骤:步骤一,初始化;步骤二,利用FCBF算法对特征词集合中的特征词进行进一步的筛选,得到初始特征词集合;步骤三,若初始特征词集合的维度小于设定的维度时,选择特征词与类别的相关性值排名靠前的特征去补足初始特征词集合直至其维度等于设定的特征维度;若初始特征词集合的维度刚好大于或等于设定的特征维度时,则初始特征词集合中即可获取到自定义特征维数的特征词。本发明对FCBF原始算法相关性计算公式进行改进,能够更加准确的选择文本特征,改进算法能够得到自定义的特征维度。

    基于FCBF的自定义特征维数文本特征选择算法

    公开(公告)号:CN109885682A

    公开(公告)日:2019-06-14

    申请号:CN201910071963.3

    申请日:2019-01-25

    Abstract: 本发明公开了一种基于FCBF的自定义特征维数文本特征选择算法,包括步骤:步骤一,初始化;步骤二,利用FCBF算法对特征词集合中的特征词进行进一步的筛选,得到初始特征词集合;步骤三,若初始特征词集合的维度小于设定的维度时,选择特征词与类别的相关性值排名靠前的特征去补足初始特征词集合直至其维度等于设定的特征维度;若初始特征词集合的维度刚好大于或等于设定的特征维度时,则初始特征词集合中即可获取到自定义特征维数的特征词。本发明对FCBF原始算法相关性计算公式进行改进,能够更加准确的选择文本特征,改进算法能够得到自定义的特征维度。

Patent Agency Ranking