-
公开(公告)号:CN114169390B
公开(公告)日:2024-11-05
申请号:CN202111231657.5
申请日:2021-10-22
Applicant: 中国科学院信息工程研究所
IPC: G06F18/214 , G06F18/10 , G06F18/21 , G06F18/2431 , G06N20/20 , G06N5/01 , G06N3/04 , G06N3/082 , G06N3/084 , H04L9/40
Abstract: 本发明公开一种集成GBDT与神经网络的网络异常检测方法,属于网络信息安全和机器学习的交叉技术领域。为了克服网络异常检测任务中传统机器学习算法和深度学习算法在处理表格数据上的不足,本发明选用专为表格数据设计的TabTransformer结构,同时为了应对网络异常检测中的类别不平衡问题,本发明采取了代价敏感的思想,引入了专门针对不平衡问题设计的Focal Loss损失函数,采取自适应学习策略,从参数搜索空间中自动选取Focal Loss的最佳参数。本发明既适用于二分类问题又适用于多分类问题。
-
公开(公告)号:CN118886006A
公开(公告)日:2024-11-01
申请号:CN202410900563.X
申请日:2024-07-05
Applicant: 中国科学院信息工程研究所
IPC: G06F21/56 , G06N20/20 , G06F18/243
Abstract: 本发明公开了一种基于元数据和代码特征的伪装App识别方法及系统,属于软件安全领域。本发明通过获取App的元数据进行预处理,通过不同的过滤方式过滤出可疑App,然后计算可疑App与伪装App样本库中家族代表在代码结构和代码内容上的相似度,并结合可疑App的代码内容统计特征,通过随机森林分类器识别出伪装App和良性App。本发明在提高伪装App识别效率的同时获得较高的召回率和精确率。
-
公开(公告)号:CN112347334B
公开(公告)日:2023-05-23
申请号:CN202011001392.5
申请日:2020-09-22
Applicant: 中国科学院信息工程研究所
IPC: G06F16/953 , G06F16/955 , H04N21/647
Abstract: 本发明公开一种主被动结合的音视频网站用户入口标识方法及系统,属于互联网信息技术领域,通过用户输入的域名查询全局节目标识表中是否存在该域名,如果不存在,则获取域名网站主页的候选子页面URL;通过主动访问,判断页面中是否存在音视频节目,提取所有包含音视频节目的子页面URL;根据候选子页面URL的数量及其与包含音视频节目的子页面URL的数量占比关系,判断该网站是否为音视频网站;如果是音视频网站,则获得节目标识,并将网站信息和节目标识更新至全局节目标识表中;如果不是,则将该网站信息更新至全局节目标识表中;将是否为音视频网站和音视频网站的节目标识作为查询结果返回给用户。
-
公开(公告)号:CN114780891A
公开(公告)日:2022-07-22
申请号:CN202210247792.7
申请日:2022-03-14
Applicant: 中国科学院信息工程研究所
IPC: G06F16/958
Abstract: 本发明公开了一种基于页面渲染贡献度的网站关键资源分析方法和装置,所述方法包括:获取网站与用户交互时的网站资源;根据所述网站资源进行页面渲染,获取页面渲染过程中的网站资源行为及网站资源引用链;基于所述网站资源、网站资源行为及网站资源引用链,进行网站关键资源的分析,得到资源分析结果。本发明能够自动化地从网站资源集合中找出影响网站正常显示和功能的关键资源,减少资源分析的人力成本,帮助网站管理员维护网站安全。
-
公开(公告)号:CN107515901B
公开(公告)日:2020-12-04
申请号:CN201710606580.2
申请日:2017-07-24
Applicant: 中国科学院信息工程研究所
IPC: G06F16/22 , G06F16/2455
Abstract: 本发明公开了一种链式日志存储结构及其哈希索引结构、数据操作方法及服务器、介质。本发明的链式日志存储结构,包括多个存储段和一数组,每一存储段的存储单元为一日志项,日志项包括初始大小字段、索引位置字段、键长度字段、Key字段和Value字段;其中Value字段用于存储数据,Key字段用于存储数据的键,初始大小字段用于存储日志项的初始大小,索引位置字段用于存储日志项的索引在哈希表中的位置;所述数组用于存储各存储段的元信息。本发明的哈希索引结构包括多个哈希桶,每一哈希桶的数据结构包括:索引数字段、有效标志字段、标签字段、偏移量字段和扩展桶字段。本发明能够保持整个结构内存的紧密连续性,降低碎片率。
-
公开(公告)号:CN106899308B
公开(公告)日:2020-05-22
申请号:CN201710043942.1
申请日:2017-01-19
Applicant: 中国科学院信息工程研究所
Abstract: 本发明公开了一种软硬件结合的自适应实时gzip数据解压缩方法及系统。本方法为:1)自适应选择器从压缩流量中获取待解压的压缩数据长度,并获取系统当前的CPU负载状态信息以及从模块控制器获取硬件解压模块状态;2)自适应选择器根据获取的信息和设定的自适应策略确定对当前待解压的压缩数据进行软件解压或硬件解压,然后将确定结果发送给模块控制器;3)模块控制器根据该确定结果将压缩数据送至相应解压模块。本发明提出的自适应gzip数据解压方法的平均解压性能加速比可达5至7倍。
-
公开(公告)号:CN109905288A
公开(公告)日:2019-06-18
申请号:CN201811571323.0
申请日:2018-12-21
Applicant: 中国科学院信息工程研究所
Abstract: 本发明公开一种应用服务分类方法及装置,该方法的步骤包括:获取CDN/云厂商域名集合;获取访问应用服务资源的流量,提取流量特征;建立应用服务与CDN/云的使用关系,根据该使用关系构建CDN/云使用图谱;提取CDN/云使用图谱中的各节点特征和图结构,构建特征模型;基于该特征模型,识别特定类型应用服务,对应用服务进行分类。
-
公开(公告)号:CN119884179A
公开(公告)日:2025-04-25
申请号:CN202411738743.9
申请日:2024-11-29
Applicant: 中国科学院信息工程研究所
IPC: G06F16/2455 , G06F16/25 , G06F18/213
Abstract: 本发明属于数据校验技术领域,涉及一种基于多阶段保序对齐的可回溯校验方法和系统。本发明通过版本号属性的附加和版本号图谱的构建,实现了对数据的动态回溯校验,能够有效应对传输过程中可能出现的错位、丢失或篡改等问题。本发明基于多阶段保序对齐机制,解决了多区域版本不一致从而校验困难的问题,使得在全网范围内的版本一致性校验变得更加简便高效。本发明通过版本号回溯校验技术,可以快速准确地追溯到之前的状态,并进行比对验证,从而实现了对系统异常的快速定位和修复,提高了系统的稳定性和安全性。本发明保证了数据的完整性和一致性,避免了数据传输过程中的数据丢失或损坏,从而提升了用户体验,保障了数据传输的顺畅和可靠。
-
公开(公告)号:CN119520434A
公开(公告)日:2025-02-25
申请号:CN202311059768.1
申请日:2023-08-22
Applicant: 中国科学院信息工程研究所
IPC: H04L47/6275 , H04L47/62 , H04L47/125 , H04L45/655
Abstract: 本发明属于计算机网络领域,涉及一种面向智能网卡的四层负载均衡器加速的方法及系统。该方法将智能网卡和智能网卡对应的x86服务器作为数据平面,共同处理四层负载均衡器的包处理及转发任务;在控制平面对流表进行管理,由控制平面决定网络流量由智能网卡进行处理或者在智能网卡对应的x86服务器上进行处理。本发明采用优先级控制的思想,根据流的长短对卸载的执行顺序进行控制,由智能网卡和网卡对应的x86服务器共同向外提供四层负载均衡功能,在面向具有大量新建连接的重负载场景时,将长流进行优先卸载,进而提升在该场景下的转发性能。
-
公开(公告)号:CN116471035A
公开(公告)日:2023-07-21
申请号:CN202310111676.7
申请日:2023-02-14
Applicant: 中国科学院信息工程研究所
IPC: H04L9/40 , H04L61/4511 , H04L61/4594 , H04L61/58 , H04L101/668
Abstract: 本发明公开了一种基于细粒度缓存探测的用户类型识别方法及系统。本方法为:1)获取目标网络范围内的解析器地址或访问路径;2)根据解析器地址或访问路径,探测每一解析器的缓存模式及缓存结构;3)根据域名分类列表和每一解析器的缓存结构,探测每一解析器的域名列表中各域名资源记录在对应解析器缓存中的缓存情况;将域名资源记录在解析器的缓存命中情况转换为特征向量,生成对应解析器的指纹;4)将各解析器的指纹作为对应解析器的特征,将各解析器的已知缓存域名类别为对应解析器的类型标签,构造一训练数据集训练用户分类模型;5)对于一待识别解析器,将其指纹输入训练后的用户分类模型,得到该待识别解析器服务的用户类型。
-
-
-
-
-
-
-
-
-