一种基于分段编码遗传算法的文本信息分类方法

    公开(公告)号:CN105787088B

    公开(公告)日:2018-12-07

    申请号:CN201610144800.X

    申请日:2016-03-14

    Abstract: 本发明涉及智能制造信息分析技术,尤其是涉及一种基于分段编码遗传算法的文本信息分类方法。本发明主要包括以下步骤:通过文本前处理技术生成相应的文本信息矩阵,即为群体规模,给定降维特征数,随机产生初始群体,同时标记优化目标函数值最大的染色体,记录优化函数值;染色体采用分段编码(每段对应一类),对初始种群交叉、变异生产新的种群,计算优化种群的优化函数值。本发明可以生成优化的文本信息分类,基于分段编码/交叉的合理分类可以解决遗传算法因数据量大而产生的工作效率低下的问题,同时因分段编码/交叉可以实现分布式处理、并行操作,可极大地提高后续数据处理的效率。

    一种基于分段编码遗传算法的文本信息分类方法

    公开(公告)号:CN105787088A

    公开(公告)日:2016-07-20

    申请号:CN201610144800.X

    申请日:2016-03-14

    Abstract: 本发明涉及智能制造信息分析技术,尤其是涉及一种基于分段编码遗传算法的文本信息分类方法。本发明主要包括以下步骤:通过文本前处理技术生成相应的文本信息矩阵,即为群体规模,给定降维特征数,随机产生初始群体,同时标记优化目标函数值最大的染色体,记录优化函数值;染色体采用分段编码(每段对应一类),对初始种群交叉、变异生产新的种群,计算优化种群的优化函数值。本发明可以生成优化的文本信息分类,基于分段编码/交叉的合理分类可以解决遗传算法因数据量大而产生的工作效率低下的问题,同时因分段编码/交叉可以实现分布式处理、并行操作,可极大地提高后续数据处理的效率。

Patent Agency Ranking