发明公开
- 专利标题: 一种基于有监督对比学习的细粒度文本分类方法
-
申请号: CN202210430095.5申请日: 2022-04-22
-
公开(公告)号: CN114757289A公开(公告)日: 2022-07-15
- 发明人: 徐建 , 李晓冬 , 阮国庆 , 王羽
- 申请人: 中国电子科技集团公司第二十八研究所
- 申请人地址: 江苏省南京市栖霞区灵山南路1号
- 专利权人: 中国电子科技集团公司第二十八研究所
- 当前专利权人: 中国电子科技集团公司第二十八研究所
- 当前专利权人地址: 江苏省南京市栖霞区灵山南路1号
- 代理机构: 江苏圣典律师事务所
- 代理商 黄振华
- 主分类号: G06K9/62
- IPC分类号: G06K9/62 ; G06F40/30 ; G06F40/289
摘要:
本发明公开了一种基于有监督对比学习的细粒度文本分类方法,包括:步骤1,构建文本分类模型,并定义层级分类体系,细粒度刻画类别;步骤2,选取样本,并对于每个样本合理构建正负例,进行数据增广;步骤3,基于交叉熵损失和对比损失对文本分类模型进行联合训练,实现细粒度文本分类。针对细粒度文本分类的实际需求,定义层级分类体系;为了区分细粒度文本分类,引入基于对比学习的损失函数;为了构建样本的正例,提出了一种基于随机替换的数据增广方式;提出一种基于对比损失和交叉熵损失相结合的细粒度文本分类方法,引入了对比学习的思想解决细粒度文本分类问题,保证同类别样本较近的语义距离。
公开/授权文献
- CN114757289B 一种基于有监督对比学习的细粒度文本分类方法 公开/授权日:2024-11-19