-
公开(公告)号:CN108712403A
公开(公告)日:2018-10-26
申请号:CN201810419153.8
申请日:2018-05-04
Applicant: 哈尔滨工业大学(威海)
Abstract: 本发明提供一种基于域名构造相似性的非法域名挖掘方法,其解决了现有方法不能主动挖掘大量非法域名的技术问题;包括以下步骤:步骤1,从域名黑名单中读取非法域名;步骤2,判断是否存在聚集成功的类,若不存在,则转到步骤10;否则,继续下一步;步骤3,判断当前域名是否可以归到第i个聚集类中,若不可以,则转到步骤10;否则,继续下一步;判断的依据是当前域名是否与中心域名相似,中心域名是指聚集类中有代表性的域名;步骤4,将当前域名并入第i个聚集类,并提取出当前域名与该类中心域名的匹配过程中所产生的生成模式,继续下一步;生成模式是聚集类中各域名与中心域名所提取出的通配字符串。本发明广泛应用于信息技术领域。
-
公开(公告)号:CN107743128A
公开(公告)日:2018-02-27
申请号:CN201711044754.7
申请日:2017-10-31
Applicant: 哈尔滨工业大学(威海)
CPC classification number: H04L63/1483 , H04L61/1511
Abstract: 本发明提供一种基于首页关联域名和同服务IP的非法网站挖掘方法,其解决了现有非法网站挖掘方法的挖掘范围小、效率低和准确性差的技术问题。包括关联域名搜索,步骤如下:步骤1,准备一份非法域名集作为黑名单、一份合法域名集作为白名单,黑名单中的每个域名均作为种子域名,起始黑名单中的域名作为第一批种子域名,存储在数据库中;步骤2,从数据库中逐个取出种子域名展开广度优先搜索;步骤3,当前访问域名的层次达到最大限制层次数或当前域名无关联域名可搜索时,停止本次种子域名的关联域名搜索,继续该批次的下一个种子域名的关联域名搜索。本发明可广泛应用于信息技术领域。
-
公开(公告)号:CN108737589B
公开(公告)日:2020-12-15
申请号:CN201810419155.7
申请日:2018-05-04
Applicant: 哈尔滨工业大学(威海)
Abstract: 本发明提供一种基于地理信息对域名进行画像的方法,其解决了现有技术问题:域名描述主要侧重在其应用,不便于非法域名挖掘;包括以下步骤:步骤1.对域名进行预处理:(1)验证域名是否合法;(2)提取注册域名和网站首页域名;步骤2.获取多源地理信息;(1)根据网站首页域名,获取网站的ICP备案中的地理信息;(2)根据注册域名,获取域名的WHOIS信息中地理信息;(3)根据网站首页域名,获取域名的IP地理信息;步骤3.对多源地理信息进行标准化;步骤4.评估域名的地理信息一致性指数,完成域名画像。本发明广泛应用于信息技术领域。
-
公开(公告)号:CN108737589A
公开(公告)日:2018-11-02
申请号:CN201810419155.7
申请日:2018-05-04
Applicant: 哈尔滨工业大学(威海)
Abstract: 本发明提供一种基于地理信息对域名进行画像的方法,其解决了现有技术问题:域名描述主要侧重在其应用,不便于非法域名挖掘;包括以下步骤:步骤1.对域名进行预处理:(1)验证域名是否合法;(2)提取注册域名和网站首页域名;步骤2.获取多源地理信息;(1)根据网站首页域名,获取网站的ICP备案中的地理信息;(2)根据注册域名,获取域名的WHOIS信息中地理信息;(3)根据网站首页域名,获取域名的IP地理信息;步骤3.对多源地理信息进行标准化;步骤4.评估域名的地理信息一致性指数,完成域名画像。本发明广泛应用于信息技术领域。
-
公开(公告)号:CN108111526A
公开(公告)日:2018-06-01
申请号:CN201711471406.8
申请日:2017-12-29
Applicant: 哈尔滨工业大学(威海)
CPC classification number: H04L63/1425 , H04L43/10 , H04L61/1511
Abstract: 本发明提供一种基于异常WHOIS信息的非法网站挖掘方法,其解决了现有非法网站挖掘方法的挖掘范围小、效率低和准确性差的技术问题。包括步骤如下:步骤1,准备一份非法域名的恶意关键词库的源数据、一份作为基础数据的中国未知域名;步骤2,提取中国未知域名的WHOIS信息,解析出WHOIS信息中各地理源的地理位置,筛选出异常域名集;步骤3,对异常域名集进行在线检测,筛选出WEB可访问域名集;步骤4,对WEB可访问域名集进行恶意性检测,筛选出具有恶意域名集;步骤5,对恶意域名集进行WHOIS反查,得到未检测的反查域名集;步骤6,从反查域名集中提取出新的关键信息,重复步骤3‑5。本发明可广泛应用于信息技术领域。
-
公开(公告)号:CN108712403B
公开(公告)日:2020-08-04
申请号:CN201810419153.8
申请日:2018-05-04
Applicant: 哈尔滨工业大学(威海)
Abstract: 本发明提供一种基于域名构造相似性的非法域名挖掘方法,其解决了现有方法不能主动挖掘大量非法域名的技术问题;包括以下步骤:步骤1,从域名黑名单中读取非法域名;步骤2,判断是否存在聚集成功的类,若不存在,则转到步骤10;否则,继续下一步;步骤3,判断当前域名是否可以归到第i个聚集类中,若不可以,则转到步骤10;否则,继续下一步;判断的依据是当前域名是否与中心域名相似,中心域名是指聚集类中有代表性的域名;步骤4,将当前域名并入第i个聚集类,并提取出当前域名与该类中心域名的匹配过程中所产生的生成模式,继续下一步;生成模式是聚集类中各域名与中心域名所提取出的通配字符串。本发明广泛应用于信息技术领域。
-
公开(公告)号:CN108600249A
公开(公告)日:2018-09-28
申请号:CN201810419474.8
申请日:2018-05-04
Applicant: 哈尔滨工业大学(威海)
CPC classification number: H04L63/0876 , H04L61/1511 , H04L63/1441
Abstract: 本发明提供一种基于多维关联信息进行非法域名注册团伙挖掘的方法,其解决了现有方法中没有对非法域名注册团伙进行挖掘的技术问题;包括以下步骤:步骤1.对域名进行预处理:(1)判断输入的域名字符组成上是否正确;(2)将域名处理为注册域名、网站首页域名两种结构;步骤2.获取关联域名:步骤3.对关联域名中新增域名的恶意性进行验证,保留验证结果为恶意的域名集合;步骤4.获取恶意的域名的注册信息;步骤5.根据注册信息间的关联性强弱,挖掘非法注册团体。本发明广泛应用于信息技术领域。
-
-
-
-
-
-