-
公开(公告)号:CN114201698A
公开(公告)日:2022-03-18
申请号:CN202010981078.1
申请日:2020-09-17
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院信息工程研究所
IPC: G06F16/955
Abstract: 本发明提供一种基于URL特征的网站首页识别方法及电子装置,包括剔除待识别URL首部的http://字符或者https://字符,获取包含http://字符或https://字符的临时变量t1;按照“/”字符对临时变量t1进行拆分,并进行有效性判断;若不能拆分或仅能拆成两部分且第二部分为空,则判断临时变量t1是否包含是二级、三级或四级域名;若仅能拆成两部分、第二部分不为空且第二部分长度小于第一阈值,则判断第二部分是否包含特定字符;若临时变量t1包含是二级、三级或四级域名或第二部分包含特定字符,则判断待识别URL为首页URL。本发明无需训练分类器、人工标注大量数据集及对URL页面内容进行分析,解决了通过语义无法识别嵌套URL的情况,降低了误报率,节省人力与网络资源,提升了识别速度。
-
公开(公告)号:CN113163234B
公开(公告)日:2022-10-14
申请号:CN202110360151.8
申请日:2021-04-02
Applicant: 中国科学院信息工程研究所
IPC: H04N21/24 , H04L43/08 , H04L61/4511 , G06F16/958 , G06N3/04
Abstract: 本发明公开了一种基于第三方服务的盗版视频网站检测方法及系统。本方法为:1)域名检测模块提取网站的域名及其第三方服务域名信息,然后基于域名信息检测该网站为盗版的概率P1;2)元数据检测模块提取该网站相关第三方服务的统计信息,然后基于所述统计信息判断该网站为盗版的概率P2;3)融合检测模块基于概率P1、P2确定该网站是否为盗版视频网站。本发明基于快速建站系统通常会使用相同或相似的第三方服务的特点,设计一种基于网站第三方服务信息的方法来高效灵活的检测出盗版视频网站。
-
公开(公告)号:CN112347334A
公开(公告)日:2021-02-09
申请号:CN202011001392.5
申请日:2020-09-22
Applicant: 中国科学院信息工程研究所
IPC: G06F16/953 , G06F16/955 , H04N21/647
Abstract: 本发明公开一种主被动结合的音视频网站用户入口标识方法及系统,属于互联网信息技术领域,通过用户输入的域名查询全局节目标识表中是否存在该域名,如果不存在,则获取域名网站主页的候选子页面URL;通过主动访问,判断页面中是否存在音视频节目,提取所有包含音视频节目的子页面URL;根据候选子页面URL的数量及其与包含音视频节目的子页面URL的数量占比关系,判断该网站是否为音视频网站;如果是音视频网站,则获得节目标识,并将网站信息和节目标识更新至全局节目标识表中;如果不是,则将该网站信息更新至全局节目标识表中;将是否为音视频网站和音视频网站的节目标识作为查询结果返回给用户。
-
公开(公告)号:CN119945936A
公开(公告)日:2025-05-06
申请号:CN202411914941.6
申请日:2024-12-24
Applicant: 中国科学院信息工程研究所
IPC: H04L43/0805 , H04L61/5007 , H04L61/5046 , H04L69/165 , G06N3/08 , G06F18/23
Abstract: 本发明公开了一种基于IP指纹多视图聚类的网络服务接入节点拓线方法,其步骤包括:1)选取域网接入节点的流量特征;2)基于域网接入节点的流量特征进行IP扫描;3)获取扫描结果形成IP库;4)根据扫描结果形成初级指纹库;5)对IP指纹特征升维并将其存入初级IP指纹库;6)针对软件定义网络服务选取需要加权的特征,并对其权重进行初始化;7)将IP库、初级指纹库和初始化软件定义网络加权指纹输入聚类图层,得到初级IP聚类结果;8)获取IP聚类结果,将其反向映射至软件定义网络加权指纹,得到加权指纹的更新权重;9)重复3)‑8),将持续动态的对相同软件定义网络服务域网接入节点进行拓线。
-
公开(公告)号:CN116055155A
公开(公告)日:2023-05-02
申请号:CN202310019128.1
申请日:2023-01-06
Applicant: 中国科学院信息工程研究所
IPC: H04L9/40 , H04L61/4511
Abstract: 本发明公开了种基于第三方服务ID的非法网站检测方法及装置,所述方法包括:利用白名单ID对多个待检测网站进行过滤,并基于网站的过滤结果,构造待检测社区;提取待检测社区的社区域名语义特征、网站ID特征和社区统计特征;基于社区域名语义特征、网站ID特征和社区统计特征,得到多个待检测网站的非法检测结果。本发明不仅可以发现使用了伪装技术的域名,还可以快速发现已观测的非法域名。
-
公开(公告)号:CN115209183B
公开(公告)日:2024-04-30
申请号:CN202210727746.7
申请日:2022-06-22
Applicant: 中国科学院信息工程研究所
IPC: H04N21/234 , H04N21/262 , H04N21/266 , H04N21/858
Abstract: 本发明公开一种面向加密流量的视频资源与视频播放页面的域名关联方法,属于网络安全领域,基于流量数据利用序列挖掘算法挖掘不同资源间的关联关系,将视频资源与视频播放页面的域名进行关联,通过防范视频播放页面的方式遏制有害视频的传播。本方法主要适用于部署在网关系统中,有助于发现盗版视频的源头,防范有害视频的传播。
-
公开(公告)号:CN112347334B
公开(公告)日:2023-05-23
申请号:CN202011001392.5
申请日:2020-09-22
Applicant: 中国科学院信息工程研究所
IPC: G06F16/953 , G06F16/955 , H04N21/647
Abstract: 本发明公开一种主被动结合的音视频网站用户入口标识方法及系统,属于互联网信息技术领域,通过用户输入的域名查询全局节目标识表中是否存在该域名,如果不存在,则获取域名网站主页的候选子页面URL;通过主动访问,判断页面中是否存在音视频节目,提取所有包含音视频节目的子页面URL;根据候选子页面URL的数量及其与包含音视频节目的子页面URL的数量占比关系,判断该网站是否为音视频网站;如果是音视频网站,则获得节目标识,并将网站信息和节目标识更新至全局节目标识表中;如果不是,则将该网站信息更新至全局节目标识表中;将是否为音视频网站和音视频网站的节目标识作为查询结果返回给用户。
-
公开(公告)号:CN115209183A
公开(公告)日:2022-10-18
申请号:CN202210727746.7
申请日:2022-06-22
Applicant: 中国科学院信息工程研究所
IPC: H04N21/234 , H04N21/262 , H04N21/266 , H04N21/858
Abstract: 本发明公开一种面向加密流量的视频资源与视频播放页面的域名关联方法,属于网络安全领域,基于流量数据利用序列挖掘算法挖掘不同资源间的关联关系,将视频资源与视频播放页面的域名进行关联,通过防范视频播放页面的方式遏制有害视频的传播。本方法主要适用于部署在网关系统中,有助于发现盗版视频的源头,防范有害视频的传播。
-
公开(公告)号:CN115348058B
公开(公告)日:2025-05-09
申请号:CN202210818672.8
申请日:2022-07-12
Applicant: 中国科学院信息工程研究所
Abstract: 本发明公开一种基于数据帧抽取的DoH流量分析方法,涉及信息技术领域,从DoH流量中提取报文级别加密流量特征,构建并训练数据帧抽取分类器来识别承载数据帧TLS报文;将承载了数据帧的TLS报文重组成TLS流,提取流级别加密流量特征,构建并训练DoH流量指纹识别分类器来识别DoH流量对应的具体网页。本方法能够提升模型的准确性和泛化性。
-
公开(公告)号:CN118157914A
公开(公告)日:2024-06-07
申请号:CN202410164354.3
申请日:2024-02-05
Applicant: 中国科学院信息工程研究所
IPC: H04L9/40
Abstract: 本发明公开了一种基于主被动结合的匿名服务器节点识别方法及系统,涉及网络安全领域。本发明通过构建探测图和通信图,并进行探测特征和通信特征的嵌入,提取探测图特征和通信图特征,再进行探测图特征和通信图特征的特征融合,然后输入到分类模型中进行匿名服务器检测。本发明基于主被动结合的方式来识别匿名服务器,能够提高识别的泛化能力,减缓因缺乏响应信息带来的性能下降问题。
-
-
-
-
-
-
-
-
-