-
公开(公告)号:CN113449816A
公开(公告)日:2021-09-28
申请号:CN202110820105.1
申请日:2021-07-20
Applicant: 恒安嘉新(北京)科技股份公司
Abstract: 本发明实施例公开了一种网址分类模型训练、网址分类方法、装置、设备及介质。该网址分类模型训练方法,包括:获取网址训练数据;其中,所述网址训练数据包括URL地址和地址分类标签;根据所述网址训练数据生成字符向量矩阵和词向量矩阵;提取所述字符向量矩阵的特征向量作为第一特征向量,并提取所述词向量矩阵的特征向量作为第二特征向量;对所述第一特征向量和所述第二特征向量进行拼接,得到拼接特征向量;根据所述拼接特征向量对网址分类模型进行模型训练。本发明实施例的技术方案能够提高网址分类模型的查全率,从而提高网址分类模型的准确率和分类精度。
-
公开(公告)号:CN112492606A
公开(公告)日:2021-03-12
申请号:CN202011247127.5
申请日:2020-11-10
Applicant: 恒安嘉新(北京)科技股份公司
IPC: H04W12/088 , H04W12/128 , G06F16/35 , H04W4/14
Abstract: 本发明公开了一种垃圾短信的分类识别方法、装置、计算机设备及存储介质。该方法包括:对短信文本集合进行文本过滤,获得垃圾短信文本集合;将垃圾短信文本集合依次输入至一级分类模型和二级分类模型,获得多个类别垃圾短信文本集合;将各类别垃圾短信文本集合输入至实体信息提取模型,获得识别或者还原实体信息之后的各类别垃圾短信文本集合。使用本发明的技术方案,可以实现对海量短信的精确分类识别,并准确提取垃圾短信中的实体信息。
-