-
公开(公告)号:CN111538836B
公开(公告)日:2024-02-02
申请号:CN202010321249.8
申请日:2020-04-22
Applicant: 哈尔滨工业大学(威海) , 国家计算机网络与信息安全管理中心
IPC: G06F16/35 , G06F16/951 , G06F40/284 , G06F18/2431
Abstract: 本发明涉及一种识别文本类广告中金融广告的方法,其解决了现有广告分析模型无法有效识别金融广告的技术问题,其包括以下步骤:(1)从数据库中获取爬取到的广告文本数据;(2)对步骤(1)的文本数据进行预处理,进行分词以及去除无用信息;(3)将步骤(2)预处理后的文本通过不同的方式表示为计算机可以处理的方式,即文本表示;(4)针对步骤(3)的不同文本表示方式选择合适的分类算法,然后将文本表示的语义信息提炼成类别信息;(5)将步骤(4)中不同文本表示方式表示的分类模型进行整合,获得最终的金融广告识别模型。本发明可广泛应于在文本类广告中识别金融广告的场合。
-
公开(公告)号:CN112883072A
公开(公告)日:2021-06-01
申请号:CN202110258091.9
申请日:2021-03-10
Applicant: 哈尔滨工业大学(威海)
IPC: G06F16/2457 , G06F16/26 , G06Q50/26 , H04L29/12
Abstract: 本发明提供一种基于网络服务商国别标注的域名国家可控性评估方法,具体步骤为:(1)首先,分别获取域名注册商信息、CNAME信息、NS信息、IP信息、顶级域五种国别源信息;(2)其次,将所有源解析为标准的国别信息;(3)最后,根据获取国别信息的来源及重要程度,对五个标准国别信息进行加权赋值,标注域名的国别信息归属度,进行国家可控性评估。其解决了现有技术中对域名国别信息归属标注的方法较少,且不够完善,不够系统的技术问题。本发明可广泛应用于域名数据的分析中。
-
公开(公告)号:CN112787946A
公开(公告)日:2021-05-11
申请号:CN202110121032.7
申请日:2021-01-28
Applicant: 哈尔滨工业大学(威海)
IPC: H04L12/801 , H04L12/26 , H04L29/12
Abstract: 本发明涉及一种获取网络数据时网络阻塞造成的噪声数据消除方法,其解决了现有技术消除网络堵塞时,数据获取时间长、获取效率低的技术问题,其具体步骤为:域名、权威服务器IP预处理,将需要获取DNS记录的批量域名与对应请求的权威服务器IP组合为一个元组,生成为任务列表;通过获取DNS记录和ping探测网络质量,批量获取域名DNS记录及网络质量数据;判定获取数据是否为网络堵塞噪声数据,从而过滤噪声数据,消除网络堵塞影响。本发明可广泛应用于DNS记录获取领域。
-
公开(公告)号:CN111885220A
公开(公告)日:2020-11-03
申请号:CN202010749324.0
申请日:2020-07-30
Applicant: 哈尔滨工业大学(威海)
IPC: H04L29/12
Abstract: 本发明涉及一种目标单位IP资产主动获取与验证方法,其解决了现有目标单位IP资产无法有效获取完全的的技术问题,其通过DNS解析,与主动探测、分析验证相结合的方式,充分发现、挖掘DNS解析结果之外的目标单位的IP资产;通过多DNS获取IP,避免单一DNS由于地域限制等因素获取IP地址少的现象。本发明可广泛应于目标单位IP资产主动获取与验证,能有效的提高获取目标单位的效率,节省了人力资源。
-
公开(公告)号:CN113395211B
公开(公告)日:2022-11-18
申请号:CN202110638488.0
申请日:2021-06-08
Applicant: 哈尔滨工业大学(威海)
IPC: H04L45/745 , H04L45/74 , H04L45/121 , G06K9/62 , G06F16/29
Abstract: 本发明涉及一种基于聚类思想的路由IP定位优化方法,其解决了现有网络拓扑中路由IP定位数据库定位准确度差、准确率低的技术问题,其通过分析各省市地标间的网络探测得到各省市的路由往返时延信息,并构造地标库数据,利用时延指标计算出路由的距离,参考地标库数据从而计算出traceroute路径中路由IP实际所在的省市位置。本发明可广泛应用于通过IP地址确定网络实体的地理位置信息的场合。
-
公开(公告)号:CN112787946B
公开(公告)日:2022-04-15
申请号:CN202110121032.7
申请日:2021-01-28
Applicant: 哈尔滨工业大学(威海)
IPC: H04L47/11 , H04L43/08 , H04L43/0811 , H04L61/4511
Abstract: 本发明涉及一种获取网络数据时网络阻塞造成的噪声数据消除方法,其解决了现有技术消除网络堵塞时,数据获取时间长、获取效率低的技术问题,其具体步骤为:域名、权威服务器IP预处理,将需要获取DNS记录的批量域名与对应请求的权威服务器IP组合为一个元组,生成为任务列表;通过获取DNS记录和ping探测网络质量,批量获取域名DNS记录及网络质量数据;判定获取数据是否为网络堵塞噪声数据,从而过滤噪声数据,消除网络堵塞影响。本发明可广泛应用于DNS记录获取领域。
-
公开(公告)号:CN111010456A
公开(公告)日:2020-04-14
申请号:CN201911153077.1
申请日:2019-11-22
Applicant: 哈尔滨工业大学(威海)
Abstract: 本发明涉及一种主域名获取和验证方法,本发明的目的在于解决根据目标单位的基本信息对该单位名下的主域名进行尽可能全面地搜集的问题,提出了以第三方网站获取的目标单位的种子主域名为基础的目标单位主域名发现、扩展、验证技术和方法,该发明主要是通过第三方网站域名的获取构建域名种子;基于域名种子,通过域名前缀与通用域名后缀组合、目标单位的可访问网站获取到的页面中的链接提取域名这两种方式进行主域名的扩展;通过查询whois信息、DNS信息两种手段对扩展域名进行验证,判断扩展域名是否属于目标单位。
-
公开(公告)号:CN115563498A
公开(公告)日:2023-01-03
申请号:CN202211150219.0
申请日:2022-09-21
Applicant: 哈尔滨工业大学(威海)
IPC: G06F18/214 , G06F18/15 , G06F18/2411 , G06F16/35 , H04L61/4511 , H04L9/40 , H04L67/02
Abstract: 本发明提供一种面向HTTP特征的CDN识别特征集扩充方法,CDN识别特征集以CNAME特征的匹配为主,该方法的具体步骤如下:步骤1获取域名基础数据,通过一种探测对象约减的方法对探测的域名基础数据进行约减;步骤2利用HTTP特征,针对待分类域名基础数据进行二次判定,根据判定结果扩充CNAME特征集,使得预分类精度逐渐提高,达到对新注册CDN厂商的CNAME特征关键字收集、或已有CDN厂商注册的新CNAME特征关键字收集的目的。该方法依赖DNS解析和HTTP解析,面向重点域名和区域递归DNS服务器,迭代时间成本较小,且方法实现对机器成本要求较低,单机即可完成该扩充流程。
-
公开(公告)号:CN114880541B
公开(公告)日:2024-10-15
申请号:CN202210606165.8
申请日:2022-05-31
Applicant: 哈尔滨工业大学(威海)
IPC: G06F16/951 , G06F16/958 , G06F16/906 , G06F16/583 , G06Q10/0635 , G06Q30/0241 , H04L9/40 , H04L67/02
Abstract: 本发明涉及一种多设备网页中内嵌广告获取以及恶意性识别的方法,其解决了现有技术对跨平台及跨浏览器广告识别及恶意性标注方法较少,且不够完善,不够系统的技术问题,其步骤包括:从浏览器HTML文本中对资源记录进行捕捉,根据广告判定规则,使用正则表达式方式筛选出广告资源,并分别对广告资源中的图片资源和跳转链接资源进行解析;对解析结果按不同维度进行分类,具体包括:煽动特征分类过程和广告内容分类过程;对各维度分类结果,按维度重要程度进行加权赋值,标注广告的恶意性程度,进行风险评估。本发明可广泛应用于对违法违规广告的监测识别。
-
公开(公告)号:CN111885220B
公开(公告)日:2023-04-07
申请号:CN202010749324.0
申请日:2020-07-30
Applicant: 哈尔滨工业大学(威海)
IPC: H04L61/4511 , H04L61/09
Abstract: 本发明涉及一种目标单位IP资产主动获取与验证方法,其解决了现有目标单位IP资产无法有效获取完全的的技术问题,其通过DNS解析,与主动探测、分析验证相结合的方式,充分发现、挖掘DNS解析结果之外的目标单位的IP资产;通过多DNS获取IP,避免单一DNS由于地域限制等因素获取IP地址少的现象。本发明可广泛应于目标单位IP资产主动获取与验证,能有效的提高获取目标单位的效率,节省了人力资源。
-
-
-
-
-
-
-
-
-