-
公开(公告)号:CN118157908A
公开(公告)日:2024-06-07
申请号:CN202410127121.6
申请日:2024-01-30
Applicant: 中国科学院信息工程研究所
IPC: H04L9/40
Abstract: 本发明属于信息技术领域,具体涉及一种基于访问行为的隐藏服务溯源方法和系统。该方法包括:收集隐藏服务的Onion地址列表,根据Onion地址使用水印生成算法为隐藏服务生成水印信号;客户端控制stream_id的值并根据隐藏服务的水印信号发送相应数量的Begin信元,隐藏服务通过判断stream_id是否已被使用从而判断是否向客户端发送Connected信元;共谋的守卫节点跟踪每一跳链路中Begin信元和Connected信元的方向序列并恢复水印信号,从而关联隐藏服务的Onion地址与真实IP地址;利用关联的隐藏服务的Onion地址与真实IP地址,对隐藏服务进行溯源。本发明具有比传统隐藏服务溯源方法更快、鲁棒性更强的优势,并具有优良的隐蔽性能。
-
公开(公告)号:CN108959242B
公开(公告)日:2021-07-27
申请号:CN201810431801.1
申请日:2018-05-08
Applicant: 中国科学院信息工程研究所
IPC: G06F40/295 , G06K9/62
Abstract: 本发明涉及一种基于中文字符词性特征的目标实体识别方法及装置。该方法包括:1)在训练文本中标记目标实体并进行分词及词性标注;2)将训练文本拆分为字符,得到字符序列,每个字符保留拆分之前的词性;3)将字符的词性与字符在分词中的位置进行拼接作为字符词性,得到字符词性序列;4)将对目标实体的标记映射至目标实体中的各个字符上,得到字符标注序列;5)将字符序列与字符词性序列作为特征,将字符标注序列作为训练目标值,输入机器学习模型中进行训练;6)将待识别文本的字符序列与字符词性序列输入训练好的机器学习模型,得到目标实体识别结果。本发明能够根据需求在中文文本中准确有效地对所需特定目标实体进行识别与提取。
-
公开(公告)号:CN105721631B
公开(公告)日:2019-04-30
申请号:CN201610182957.1
申请日:2016-03-28
Applicant: 中国科学院信息工程研究所
IPC: H04L29/12
Abstract: 本发明提供一种定向信息抓取场景中大规模IP地址资源使用方法。包括以下步骤:针对设置了访问频率限制的网络资源,建立包含IP地址集合L中全部IP地址的优先队列;分配可用IP地址时,取出优先队列中优先级最高的IP地址,并更新该IP地址的下次可访问该网络资源的时刻,若当前时刻大于或等于t,则当前任务可立即使用该IP地址;针对每个IP地址维护该IP地址的使用次数un和访问失败次数fn,当从优先队列中取出的优先级最高的IP地址时,以1‑fn/un的概率选用,fn/un的概率放弃。既实现IP地址访问能力充分利用;又提高网络信息获取任务的成功率。
-
公开(公告)号:CN118199927A
公开(公告)日:2024-06-14
申请号:CN202410203156.3
申请日:2024-02-23
Applicant: 中国科学院信息工程研究所
IPC: H04L9/40
Abstract: 本发明公开了一种基于主动探测的Tor桥节点的隐藏节点发现方法及系统,所述方法包括:在Tor网络中植入非出口的受控路由节点,所述受控路由节点具有记录Tor网络的链路日志的功能;受控客户端向建立成功的两跳链路发送内容为指定桥节点IP的payload包;其中,所述两跳链路中的第一跳为指定桥节点,第二跳为所述受控路由节点;受控路由节点通过识别所述内容为指定桥节点IP的payload包发现所述两跳链路后,结合链路日志判断所述指定桥节点是否与隐藏节点绑定。本发明可以准确检测Tor网络路由节点的隐藏节点。
-
公开(公告)号:CN107341183B
公开(公告)日:2021-06-22
申请号:CN201710397901.2
申请日:2017-05-31
Applicant: 中国科学院信息工程研究所
IPC: G06F16/951 , G06F16/35
Abstract: 本发明公开了一种基于暗网网站综合特征的网站分类方法。本方法为:1)爬取目标暗网网站,得到一带标注的暗网网站训练集合;2)提取该集合中每一网站信息进行分词,构建该网站的词的空间向量,并计算每一词的权重;将词与对应权重进行相乘后的空间向量作为网站的文本特征;3)提取该暗网网站训练集合中每一网站的标签,构建该网站的标签的空间向量,并计算每个标签的权重;将标签与对应权重相乘后的空间向量作为网站的结构特征;4)将每一网站的文本特征与结构特征结合得到该网站的综合特征;5)对各网站的综合特征进行训练,得到一分类模型;然后利用该分类模型对待分类网站进行预测,得到该待分类网站的类别。本发明提高了网站分类效率。
-
公开(公告)号:CN108959242A
公开(公告)日:2018-12-07
申请号:CN201810431801.1
申请日:2018-05-08
Applicant: 中国科学院信息工程研究所
CPC classification number: G06F17/278 , G06K9/6256
Abstract: 本发明涉及一种基于中文字符词性特征的目标实体识别方法及装置。该方法包括:1)在训练文本中标记目标实体并进行分词及词性标注;2)将训练文本拆分为字符,得到字符序列,每个字符保留拆分之前的词性;3)将字符的词性与字符在分词中的位置进行拼接作为字符词性,得到字符词性序列;4)将对目标实体的标记映射至目标实体中的各个字符上,得到字符标注序列;5)将字符序列与字符词性序列作为特征,将字符标注序列作为训练目标值,输入机器学习模型中进行训练;6)将待识别文本的字符序列与字符词性序列输入训练好的机器学习模型,得到目标实体识别结果。本发明能够根据需求在中文文本中准确有效地对所需特定目标实体进行识别与提取。
-
公开(公告)号:CN107341183A
公开(公告)日:2017-11-10
申请号:CN201710397901.2
申请日:2017-05-31
Applicant: 中国科学院信息工程研究所
IPC: G06F17/30
CPC classification number: G06F17/30864 , G06F17/30705
Abstract: 本发明公开了一种基于暗网网站综合特征的网站分类方法。本方法为:1)爬取目标暗网网站,得到一带标注的暗网网站训练集合;2)提取该集合中每一网站信息进行分词,构建该网站的词的空间向量,并计算每一词的权重;将词与对应权重进行相乘后的空间向量作为网站的文本特征;3)提取该暗网网站训练集合中每一网站的标签,构建该网站的标签的空间向量,并计算每个标签的权重;将标签与对应权重相乘后的空间向量作为网站的结构特征;4)将每一网站的文本特征与结构特征结合得到该网站的综合特征;5)对各网站的综合特征进行训练,得到一分类模型;然后利用该分类模型对待分类网站进行预测,得到该待分类网站的类别。本发明提高了网站分类效率。
-
公开(公告)号:CN118157909A
公开(公告)日:2024-06-07
申请号:CN202410127124.X
申请日:2024-01-30
Applicant: 中国科学院信息工程研究所
IPC: H04L9/40
Abstract: 本发明属于信息安全技术领域,具体涉及一种基于拒绝服务攻击的隐藏服务管控方法和系统。该方法包括:计算受害隐藏服务负责的HSDir节点,作为攻击目标;通过攻击机向所述攻击目标发送大量描述符,使得HSDir存储描述符的缓存溢出,并触发缓存清空机制;通过所述缓存清空机制清空HSDir保存的所有描述符,其中包含受害隐藏服务的描述符,使受害隐藏服务不能被客户端访问,从而实现受害隐藏服务的管控。采用本发明,由于客户端无法向负责的HSDir成功请求受害隐藏服务的描述符,因此无法联系受害隐藏服务,达到管控效果。本发明可对隐藏服务进行持续管控,从而阻止不法分子利用隐藏服务开展违法活动。
-
公开(公告)号:CN110866170A
公开(公告)日:2020-03-06
申请号:CN201910992292.4
申请日:2019-10-18
Applicant: 中国科学院信息工程研究所
IPC: G06F16/953 , G06F16/958
Abstract: 本发明公开了一种基于站点质量的Tor暗网服务的重要性评估方法、搜索方法及系统。本方法为:1)构建Tor暗网站点质量评估指标体系,确定评估指标及对应的权重;2)采集目标Tor暗网站点的网页信息,并根据采集信息确定该目标Tor暗网站点的审美评估的评估值、易用性评估的评估值、多媒体支持评估的评估值、内容丰富性评估的评估值;3)根据该目标Tor暗网站点中是否有用户反馈页面、网站是否被Tor2web服务收录以及暗网服务地址是否具有可读性确定该目标Tor暗网站点的网站声誉评估的评估值;4)根据该目标Tor暗网站点的各评估值及对应的权重,确定该目标Tor暗网站点的重要性。本发明能够准确评估站点的质量。
-
公开(公告)号:CN109194605A
公开(公告)日:2019-01-11
申请号:CN201810709596.0
申请日:2018-07-02
Applicant: 中国科学院信息工程研究所
IPC: H04L29/06
Abstract: 本发明涉及一种基于开源信息的可疑威胁指标主动验证方法和系统。该方法包括以下步骤:1)设计特定查询语句,所述特定查询语句是可疑威胁指标与特定场景的组合;2)收集和爬取根据所述特定查询语句在互联网上检索得到的结果信息;3)将所述结果信息中的相关开源信息进行结构化处理,得到结构化数据;4)利用所述结构化数据,充分学习其中的隐藏特征,训练相应的分类模型;5)利用所述分类模型验证在特定场景下的可疑威胁指标的恶意性,从而识别网络威胁。该系统包括查询设计模块、信息采集模块、数据处理模块、模型训练模块、指标验证模块。本发明能够高效准确地完成对可疑威胁指标的验证,帮助人们识别高级威胁攻击,保证网络安全。
-
-
-
-
-
-
-
-
-