-
公开(公告)号:CN119316395A
公开(公告)日:2025-01-14
申请号:CN202411445309.1
申请日:2024-10-16
Applicant: 中国电子信息产业集团有限公司第六研究所 , 哈尔滨工业大学(威海)
IPC: H04L61/5046 , H04L61/5007 , H04L101/69
Abstract: 本申请提供了DoH服务器的检测方法、装置、电子设备及存储介质,通过对目标网络端口的扫描,获取至少一个IP地址;针对于每一个IP地址,基于该IP地址所属的地址段信息、地理位置信息、自治系统信息以及组织信息,确定该IP地址的IP特征向量;将确定出的各个IP特征向量输入至预先训练好的DoH服务器分布评分模型,输出各个IP地址的地址评分;针对于地址评分大于预设评分阈值的至少一个目标IP地址,进行全量DoH服务器探测,确定DoH服务器的分布信息。这样,可以减少需要全量查询筛选的IP地址的数量,进而提升DoH服务器的检测效率。
-
公开(公告)号:CN119273300A
公开(公告)日:2025-01-07
申请号:CN202411315882.0
申请日:2024-09-20
Applicant: 中国电子信息产业集团有限公司第六研究所 , 远江盛邦(北京)网络安全科技股份有限公司
Abstract: 本申请提供了一种网络资产的管理方法、装置、电子设备及存储介质,该方法包括:从获取的多个原始网络资产数据中筛选出多个目标网络资产数据,以及确定每个目标网络资产数据的网页元数据;针对每个目标网络资产数据,根据该目标网络资产数据的网页元数据进行多特征编码融合处理,确定该目标网络资产数据的融合特征向量;根据所有目标网络资产数据的融合特征向量进行聚类处理,确定每个目标网络资产数据的资产簇标识;针对符合要求的每个目标网络资产数据,根据该目标网络资产数据的网页元数据以及资产簇标识,生成该目标网络资产数据的资产指纹,并进行存储。这样,通过本方案可简化了相关任务的工作量、提高资产识别的效率和准确度。
-
公开(公告)号:CN114448822A
公开(公告)日:2022-05-06
申请号:CN202210076280.9
申请日:2022-01-21
Applicant: 中国电子信息产业集团有限公司第六研究所
IPC: H04L43/04
Abstract: 本申请提供一种节点探测数据表示方法、装置、电子设备及存储介质,涉及网络空间测绘领域。方法包括:获取节点探测数据,所述节点探测数据包括节点的IP地址、所述节点的开放端口的端口号、所述节点的关联域名或主机名、所述开放端口的开放时间;对所述节点探测数据进行格式处理,以生成预设结构的数据文件;将所述数据文件以IP:PORT:HOST:TIME的格式存入数据库,以供用户获取与查询所述节点探测数据。由此,使得用户能够快速通过IP地址、端口号、域名及端口开放时间查找并获取所需要的节点探测数据,从而提高用户查找所需节点探测数据的查询效率及节点探测数据的获取效率。
-
公开(公告)号:CN113378088A
公开(公告)日:2021-09-10
申请号:CN202110707708.0
申请日:2021-06-24
Applicant: 中国电子信息产业集团有限公司第六研究所
IPC: G06F16/957 , G06F40/14
Abstract: 本申请提供了一种网页正文抽取方法、装置、设备及存储介质,该方法包括:从网页内容中抽取出网页正文段落,将抽取的网页正文段落添加至文本文件中,计算网页内容中每个起始标签和结束标签之间标点符号数量与包含字符数量的最小商值,得到的最小商值作为网页正文判定阈值,根据抽取模板中起始文本信息和结束文本信息,确定标签滑动窗口,根据标签滑动窗口遍历网页内容中标点符号数量与包含字符数量,抽取符合网页正文判定阈值的网页正文字段。本申请的有益效果在于:能够根据网页正文判定阈值从网页内容中精准的抽取出网页正文段落,提高了抽取精度、避免了抽取网页正文段落的冗余问题,以及通过滑动窗口算法,有效提高了抽取效率。
-
公开(公告)号:CN119341970B
公开(公告)日:2025-04-18
申请号:CN202411875500.X
申请日:2024-12-19
Applicant: 中国电子信息产业集团有限公司第六研究所
IPC: H04L45/033 , H04L45/74
Abstract: 本发明涉及计算机网络技术领域,尤其涉及边界骨干路由的确定方法、装置、电子设备及存储介质,基于测量和开源信息确定目标地理区域的网络拓扑结构;并基于IP地址的地理位置,确定第一候选边界IP地址;基于多个边界验证参数划分第一边界IP地址和第二候选边界IP地址;基于第一边界IP地址训练预测模型,对第二候选边界IP地址进行预测,得到其是否为边界IP地址的置信度;选出置信度高于置信度阈值的第二边界IP地址,并基于第一边界IP地址和路由器别名解析算法,确定目标地理区域的边界骨干路由。这样,通过多个边界验证参数对目标地理区域的网络边界进行全面验证,得到更加准确的边界IP地址,提高了边界骨干路由确定的准确性。
-
公开(公告)号:CN119341970A
公开(公告)日:2025-01-21
申请号:CN202411875500.X
申请日:2024-12-19
Applicant: 中国电子信息产业集团有限公司第六研究所
IPC: H04L45/033 , H04L45/74
Abstract: 本发明涉及计算机网络技术领域,尤其涉及边界骨干路由的确定方法、装置、电子设备及存储介质,基于测量和开源信息确定目标地理区域的网络拓扑结构;并基于IP地址的地理位置,确定第一候选边界IP地址;基于多个边界验证参数划分第一边界IP地址和第二候选边界IP地址;基于第一边界IP地址训练预测模型,对第二候选边界IP地址进行预测,得到其是否为边界IP地址的置信度;选出置信度高于置信度阈值的第二边界IP地址,并基于第一边界IP地址和路由器别名解析算法,确定目标地理区域的边界骨干路由。这样,通过多个边界验证参数对目标地理区域的网络边界进行全面验证,得到更加准确的边界IP地址,提高了边界骨干路由确定的准确性。
-
公开(公告)号:CN119276807A
公开(公告)日:2025-01-07
申请号:CN202411783223.X
申请日:2024-12-06
Applicant: 中国电子信息产业集团有限公司第六研究所
Abstract: 本申请提供一种网络探测系统及方法,涉及互联网技术领域。探测系统包括用户端、中控端、指令分发服务端和探测节点,其中,中控端响应用户端发送的探测任务需求指令,基于探测任务需求指令中用户端需求的探测任务的任务信息,确定出执行探测任务的至少一个目标探测节点;中控端生成探测任务执行指令并发送给指令分发服务端;指令分发服务端将探测任务执行指令所指示的探测任务加入目标探测节点对应的任务队列;探测节点向指令分发服务端发送探测任务获取指令,以从该探测节点对应的任务队列中获取该探测节点所要执行的探测任务,用以提高探测系统的资源利用率,以及面对复杂环境的适应能力。
-
公开(公告)号:CN119166612A
公开(公告)日:2024-12-20
申请号:CN202411210222.6
申请日:2024-08-30
Applicant: 中国电子信息产业集团有限公司第六研究所
Abstract: 本申请提供了一种异构数据的迁移方法、迁移装置、设备及介质,所述方法包括:根据源集群确定读取路径,并基于所述读取路径从所述源集群中获取待迁移的源数据;根据当前数据迁移场景确定所需的目标数据映射规则;基于所述源集群的数据类型和目标集群的数据类型构建中间映射模型,利用所述目标数据映射规则将所述源数据的字段映射到所述中间映射模型的映射字段,得到转换后的源数据;采用批量加载的方式将所述转换后的源数据加载到所述目标集群中,以完成所述源数据的迁移。通过所述方法及装置,支持多种异构数据库环境下的数据迁移,有效提高了异构集群环境中数据迁移同步的效率。
-
公开(公告)号:CN118055095A
公开(公告)日:2024-05-17
申请号:CN202410451609.4
申请日:2024-04-16
Applicant: 中国电子信息产业集团有限公司第六研究所
IPC: H04L61/4511 , H04L67/02 , H04L67/06
Abstract: 本申请提供了权威域名服务器的确定方法、装置、电子设备及存储介质,包括:获取到目标服务器响应域名逆向解析请求的第一逆向解析记录;基于第一逆向解析记录初步确定出目标服务器是否为自身逆向域名的权威域名服务器;若初步确定出为自身逆向域名的权威域名服务器,则基于递归解析服务器进一步验证目标服务器是否为自身逆向域名的权威域名服务器;若初步确定出不为自身逆向域名的权威域名服务器,则确定出逆向解析记录之中是否存在未知域名,若是,则基于递归解析服务器对未知域名的权威服务器域名以及未知域名的权威域名服务器的IP地址集合进行确定。提高了权威域名服务器验证的准确性和可靠性,并扩大对权威域名服务器的探测范围。
-
公开(公告)号:CN113378088B
公开(公告)日:2024-01-19
申请号:CN202110707708.0
申请日:2021-06-24
Applicant: 中国电子信息产业集团有限公司第六研究所
IPC: G06F16/957 , G06F40/14
Abstract: 本申请提供了一种网页正文抽取方法、装置、设备及存储介质,该方法包括:从网页内容中抽取出网页正文段落,将抽取的网页正文段落添加至文本文件中,计算网页内容中每个起始标签和结束标签之间标点符号数量与包含字符数量的最小商值,得到的最小商值作为网页正文判定阈值,根据抽取模板中起始文本信息和结束文本信息,确定标签滑动窗口,根据标签滑动窗口遍历网页内容中标点符号数量与包含字符数量,抽取符合网页正文判定阈值的网页正文字段。本申请的有益效果在于:能够根据网页正文判定阈值从网页内容中精准的抽取出网页正文段落,提高了抽取精度、避免了抽取网页正文段落的冗余问题,以及通过滑动窗口算法,有效提高了抽取效率。(56)对比文件Ahmet Selman Bozkir 等.Layout-basedcomputation of web page similarity ranks.《International Journal of Human-ComputerStudies》.2018,第110卷95-114.
-
-
-
-
-
-
-
-
-