-
公开(公告)号:CN109783818B
公开(公告)日:2023-04-07
申请号:CN201910045591.7
申请日:2019-01-17
Applicant: 上海三零卫士信息安全有限公司
IPC: G06F40/258 , G06F40/30 , G06F18/23213 , G06F18/2431
Abstract: 本发明公开了一种企业行业多标签分类方法,本发明根据行业关键词的提取,企业的经营范围涉及到多个行业的关键词的交叉情况下,并利用半监督和聚类的方法更新词库,利用深度学习的方法进行多行业标签分类。本发明利用了基于图的排序算法,K‑means的聚类的方法、嵌入的词向量模型提取企业关键词,然后使用了双层的循环神经网络构建多层行业标签的自动标签模型,并借此使用半监督和聚类的方法更新行业关键词库,得到四层的级联行业标签体系,有利于解决人工标注的繁琐低效问题。
-
公开(公告)号:CN109783818A
公开(公告)日:2019-05-21
申请号:CN201910045591.7
申请日:2019-01-17
Applicant: 上海三零卫士信息安全有限公司
Abstract: 本发明公开了一种企业行业多标签分类方法,本发明根据行业关键词的提取,企业的经营范围涉及到多个行业的关键词的交叉情况下,并利用半监督和聚类的方法更新词库,利用深度学习的方法进行多行业标签分类。本发明利用了基于图的排序算法,K-means的聚类的方法、嵌入的词向量模型提取企业关键词,然后使用了双层的循环神经网络构建多层行业标签的自动标签模型,并借此使用半监督和聚类的方法更新行业关键词库,得到四层的级联行业标签体系,有利于解决人工标注的繁琐低效问题。
-