-
公开(公告)号:CN111601314A
公开(公告)日:2020-08-28
申请号:CN202010457020.7
申请日:2020-05-27
Applicant: 北京亚鸿世纪科技发展有限公司 , 国家计算机网络与信息安全管理中心安徽分中心
IPC: H04W12/12 , H04W4/14 , G06K9/62 , G06F16/955 , G06F16/951 , G06F16/35
Abstract: 预训练模型加短信地址双重判定不良短信的方法和装置涉及信息技术领域。本发明由已分类短信样品集、预训练模型模块、短信采集器、文本处理器、地址提取器、网络爬虫和不良短信判断器组成;实现本发明解决传统机器学习在不良短信识别中对特征的依赖,与深度学习相比,不仅不需要大量的训练集,而且可以通过短信中的url短链接进行判断,使得语义信息稀疏的短信得到很好的识别;同时结合文本信息和短信地址来判断短信的性质比仅依据短信地址的ip判断短信的性质拥有更好的解释性和更直观的分析效果。
-
公开(公告)号:CN111601314B
公开(公告)日:2023-04-28
申请号:CN202010457020.7
申请日:2020-05-27
Applicant: 北京亚鸿世纪科技发展有限公司 , 国家计算机网络与信息安全管理中心安徽分中心
IPC: G06F16/35 , G06F16/951
Abstract: 预训练模型加短信地址双重判定不良短信的方法和装置涉及信息技术领域。本发明由已分类短信样品集、预训练模型模块、短信采集器、文本处理器、地址提取器、网络爬虫和不良短信判断器组成;实现本发明解决传统机器学习在不良短信识别中对特征的依赖,与深度学习相比,不仅不需要大量的训练集,而且可以通过短信中的url短链接进行判断,使得语义信息稀疏的短信得到很好的识别;同时结合文本信息和短信地址来判断短信的性质比仅依据短信地址的ip判断短信的性质拥有更好的解释性和更直观的分析效果。
-