一种基于特征融合和双重分类的新闻文本分类方法

    公开(公告)号:CN116432644B

    公开(公告)日:2023-08-15

    申请号:CN202310687090.5

    申请日:2023-06-12

    Abstract: 本发明属于自然语言处理和机器学习领域,公开了一种基于特征融合和双重分类的新闻文本分类方法,包括如下步骤:首先,对各大新闻网站上的各类新闻文本数据进行采集构成数据集,其次,对采集到的数据集进行数据预处理并进行分词后,以json的格式进行存储,再次,利用BERT模型和TF‑IDF模型构造出特征融合模型,再与fasttext模型联合,构造基于特征融合和双重分类的新闻文本分类模型,该模型进行训练,依据该模型提出基于特征融合和双重分类的新闻文本分类方法,最后,使用基于特征融合和双重分类的新闻文本分类方法对新闻数据进行分类。本发明可以提高新闻文本分类过程中的效率和精度,在较短的时间内取得更好的分类效果。

    一种基于特征融合和双重分类的新闻文本分类方法

    公开(公告)号:CN116432644A

    公开(公告)日:2023-07-14

    申请号:CN202310687090.5

    申请日:2023-06-12

    Abstract: 本发明属于自然语言处理和机器学习领域,公开了一种基于特征融合和双重分类的新闻文本分类方法,包括如下步骤:首先,对各大新闻网站上的各类新闻文本数据进行采集构成数据集,其次,对采集到的数据集进行数据预处理并进行分词后,以json的格式进行存储,再次,利用BERT模型和TF‑IDF模型构造出特征融合模型,再与fasttext模型联合,构造基于特征融合和双重分类的新闻文本分类模型,该模型进行训练,依据该模型提出基于特征融合和双重分类的新闻文本分类方法,最后,使用基于特征融合和双重分类的新闻文本分类方法对新闻数据进行分类。本发明可以提高新闻文本分类过程中的效率和精度,在较短的时间内取得更好的分类效果。

Patent Agency Ranking