Patent search ap:("中电科大数据研究院有限公司" OR "太极计算机股份有限公司") AND inv:"李东宝" Page 1

1.

发明公开
一种文本分类方法有权

公开(公告)号：CN116127079A

公开(公告)日：2023-05-16

申请号：CN202310425424.1

申请日：2023-04-20

Applicant: 中电科大数据研究院有限公司 , 太极计算机股份有限公司

Inventor： 韩国权 , 李响 , 仲恺 , 祁纲 , 陈轮 , 李庆 , 李东宝 , 蔡惠民

IPC: G06F16/35 , G06F40/279 , G06F40/216

Abstract: 本发明提供一种文本分类方法，基于待分类文本段的文本特征向量与各个文本类别的支持文本特征向量之间的语义相似度，确定该待分类文本段所属的文本类别，即使部分文本类别的支持文本段数量较少，仍能根据该文本类别的支持文本段的文本特征向量准确地归纳出该文本类别的支持文本特征向量，从而根据上述语义相似度识别出属于该文本类别的待分类文本段，减少多标签分类场景下遗漏类别标签的概率；此外，在进行文本特征提取时，充分运用了对应文本段的语法结构，从而提取更准确、更丰富的上下文信息，以结合各个非停用词本身的语义信息以及上下文语义信息进行整体语义提取，有助于提升政务文本分类的准确性。

2.

发明授权
一种文本分类方法有权

公开(公告)号：CN116127079B

公开(公告)日：2023-06-20

申请号：CN202310425424.1

申请日：2023-04-20

Applicant: 中电科大数据研究院有限公司 , 太极计算机股份有限公司

Inventor： 韩国权 , 李响 , 仲恺 , 祁纲 , 陈轮 , 李庆 , 李东宝 , 蔡惠民

IPC: G06F16/35 , G06F40/279 , G06F40/216

Abstract: 本发明提供一种文本分类方法，基于待分类文本段的文本特征向量与各个文本类别的支持文本特征向量之间的语义相似度，确定该待分类文本段所属的文本类别，即使部分文本类别的支持文本段数量较少，仍能根据该文本类别的支持文本段的文本特征向量准确地归纳出该文本类别的支持文本特征向量，从而根据上述语义相似度识别出属于该文本类别的待分类文本段，减少多标签分类场景下遗漏类别标签的概率；此外，在进行文本特征提取时，充分运用了对应文本段的语法结构，从而提取更准确、更丰富的上下文信息，以结合各个非停用词本身的语义信息以及上下文语义信息进行整体语义提取，有助于提升政务文本分类的准确性。

Patent Agency Ranking