-
公开(公告)号:CN114077836B
公开(公告)日:2025-02-25
申请号:CN202111373470.9
申请日:2021-11-19
Applicant: 中电信数智科技有限公司
IPC: G06F16/353 , G06F18/2431 , G06F40/284 , G06F40/216 , G06N3/042 , G06N3/08
Abstract: 本发明公开了一种基于异构神经网络的文本分类方法及装置,所述方法包括:步骤S1,结合训练数据集合中的实际分类体系的树形结构,构建与该树形结构对应的N层文本分类多叉树,并根据N层文本分类多叉树的结构,将训练数据集合中的训练数据分别写入到各层级对应的分类文件中,对各分类文件的中文文本进行分词,并进行特征选择保存到对应的特征文件中;步骤S2,构建与该树形结构对应的文本异构神经网络;步骤S3,设定异构神经网络算法参数,及参数调整,迭代生成训练数据的每个分类与子分类模型并保存,用验证数据集进行准确率判定,本方法将类别及类别间层级关系也加入异构神经网络中,对类别显示地学习向量表示,环节数据稀疏性问题。