一种多渠道获取可疑钓鱼网站的方法

    公开(公告)号:CN106302440A

    公开(公告)日:2017-01-04

    申请号:CN201610659857.3

    申请日:2016-08-11

    Abstract: 本发明公开一种多渠道获取可疑钓鱼网站的方法,包括以下步骤:S1:根据钓鱼网站样本,针对性获取可疑钓鱼网站列表;其包括S11-S15中的一种或其组合,S11:根据钓鱼网站样本的URL地址变换组合分析获取网站列表,URL地址包括域名的前缀、域名的后缀和域名;S12:根据钓鱼网站样本的域名注册信息反查获取网站列表;S13:根据钓鱼网站样本的IP信息反查获取网站列表;S14:根据钓鱼网站样本的页面关键内容信息关联分析获取网站列表;S15:根据钓鱼网站样本利用搜索引擎检索获取网站列表;以及获取上述步骤S11-S15网站列表后,经过黑白名单过滤,获取新增未知可疑钓鱼网站列表;S2:将上述可疑钓鱼网站经过风险评估、人工确认后,最终发现钓鱼网站。

    一种多渠道的基于行为特征的主动监测钓鱼网站的方法

    公开(公告)号:CN106302438A

    公开(公告)日:2017-01-04

    申请号:CN201610659317.5

    申请日:2016-08-11

    Abstract: 本发明公开一种多渠道的基于行为特征的主动监测钓鱼网站的方法,包括以下步骤:S1:根据钓鱼网站样本,有针对性的获取可疑钓鱼网站列表,其包括步骤S11-S15中的一种或其组合;S11:根据钓鱼网站样本的域名注册信息反查与关联分析获取可疑钓鱼网站;S12:根据钓鱼网站样本的IP信息反查与关联分析获取可疑钓鱼网站;S13:根据钓鱼网站样本的页面关键内容信息关联分析获取可疑钓鱼网站;S14:根据钓鱼网站样本的URL地址变换组合分析获取可疑钓鱼网站;S15:根据钓鱼网站样本利用搜索引擎检索获取可疑钓鱼网站;S2:建立钓鱼网站样本的静态特征库和行为特征库并提取可疑钓鱼网站的静态特征、行为特征;以及S3:基于静态特征和行为特征形成风险评估模型,对钓鱼网站自动化识别。

    一种基于限定领域的分词方法及系统

    公开(公告)号:CN114330307A

    公开(公告)日:2022-04-12

    申请号:CN202110483554.1

    申请日:2021-04-30

    Abstract: 本发明公开了一种基于限定领域的分词方法及系统,方法包括:对限定领域的数据进行预处理,对预处理后得到的数据中的命名实体进行识别,并抽取出数据中的实体词汇,得到命名实体识别结果;基于预处理后得到的数据计算限定领域语料中的特征信息,并根据得到的特征信息构建新词发现模型,利用新词发现模型对语料库中的新词进行识别,以获取新词数据组;利用所述命名实体识别结果及常用词词典对获取的新词数据组进行过滤,排除掉常用词汇和实体词汇,以获取并确认敏感词,并基于确认后的敏感词建立敏感词库;结合敏感词库中获取的敏感词信息和命名实体识别结果进行分词。解决了现有技术中在限定领域中分词准确性较差的技术问题。

Patent Agency Ranking