发明公开
- 专利标题: 一种文本分类分级方法、装置、设备及存储介质
-
申请号: CN202410050120.6申请日: 2024-01-12
-
公开(公告)号: CN117708678A公开(公告)日: 2024-03-15
- 发明人: 钟丹东 , 卢瑶
- 申请人: 江苏保旺达软件技术有限公司
- 申请人地址: 江苏省南京市江北新区星火路9号软件大厦B座9楼
- 专利权人: 江苏保旺达软件技术有限公司
- 当前专利权人: 江苏保旺达软件技术有限公司
- 当前专利权人地址: 江苏省南京市江北新区星火路9号软件大厦B座9楼
- 代理机构: 北京品源专利代理有限公司
- 代理商 蔡舒野
- 主分类号: G06F18/241
- IPC分类号: G06F18/241 ; G06F16/35 ; G06F18/22 ; G06F18/25 ; G06N3/084
摘要:
本发明公开了一种文本分类分级方法、装置、设备及存储介质。该方法包括:对获取的待分类文本进行切片处理,得到至少一个文本切片;将各所述文本切片输入目标文本分类模型,得到各所述文本切片的切片标签概率序列和切片分类特征向量;将各所述切片分类特征向量输入目标文本检索模型,得到各所述文本切片的切片相似度标签集;根据各所述切片标签概率序列确定所述待分类文本的第一预测标签集,以及,根据各所述切片相似度标签集确定所述待分类文本的第二预测标签集;对所述第一预测标签集和第二预测标签集进行融合,得到所述待分类文本的目标分类分级标签。本发明可以实现对长文本数据分类分级流程自动化,提高分类分级效率和正确率。