-
公开(公告)号:CN110413958B
公开(公告)日:2020-12-04
申请号:CN201910505446.2
申请日:2019-06-12
Applicant: 中国科学院信息工程研究所
IPC: G06F40/151 , G06F16/903
Abstract: 本发明提供一种用于自动机空间压缩的线性同余字符集变换方法,步骤包括:将模式串集构建成自动机,并生成状态转移矩阵;读取状态转移矩阵的各个状态行,计算最佳变换参数和最大有效后继状态;根据状态转移矩阵和最佳变换参数,记录数据结构,将状态行替换为变换后的有效状态行;读取目标文本的字符,根据字符当前状态,利用线性同余函数进行字符变换,得到变换后的字符,符合条件下得到后继状态,实现变换。本发明还提供一种用于自动机空间压缩的线性同余字符集变换系统,包括规则编译器、变换参数生成器、状态行变换器、比较器、压缩自动机存储器、状态寄存器、字符集变换器及文本扫描器。
-
公开(公告)号:CN107402959B
公开(公告)日:2020-01-17
申请号:CN201710451043.5
申请日:2017-06-15
Applicant: 中国科学院信息工程研究所
IPC: G06F16/958 , G06F16/955 , G06F16/901
Abstract: 本发明提供URL匹配方法、URL匹配设备及存储介质,该方法通过将输入的待匹配的原始URL数据在URL结果缓存中查询是否已存储过其对应的信息,若是则查询标志位及已命中规则表得到以前是否匹配的信息,输出匹配结果;否则在模式匹配引擎中进行匹配,并进行存储URL数据。该方法对大量重复的URL数据去重,以降低URL数据重复匹配次数,提高匹配速度。同时本发明采用比实际串匹配复杂度低的多项式散列算法,但不仅限于多项式散列算法。在增添数据去重操作后可以减少重复的URL数据的匹配次数,达到去重和降低匹配时间的目的。
-
公开(公告)号:CN110413958A
公开(公告)日:2019-11-05
申请号:CN201910505446.2
申请日:2019-06-12
Applicant: 中国科学院信息工程研究所
IPC: G06F17/22 , G06F16/903
Abstract: 本发明提供一种一种用于自动机空间压缩的线性同余字符集变换方法,步骤包括:将模式串集构建成自动机,并生成状态转移矩阵;读取状态转移矩阵的各个状态行,计算最佳变换参数和最大有效后继状态;根据状态转移矩阵和最佳变换参数,记录数据结构,将状态行替换为变换后的有效状态行;读取目标文本的字符,根据字符当前状态,利用线性同余函数进行字符变换,得到变换后的字符,符合条件下得到后继状态,实现变换。本发明还提供一种用于自动机空间压缩的线性同余字符集变换系统,包括规则编译器、变换参数生成器、状态行变换器、比较器、压缩自动机存储器、状态寄存器、字符集变换器及文本扫描器。
-
公开(公告)号:CN104809161B
公开(公告)日:2018-08-21
申请号:CN201510152316.7
申请日:2015-04-01
Applicant: 中国科学院信息工程研究所
IPC: G06F17/30
Abstract: 本发明涉及一种对稀疏矩阵进行压缩和查询的方法及系统。该方法对k2‑tree方法进行了改进:一是rank操作的改变,二是对于一般矩阵和非零一矩阵的处理。首先对待处理的稀疏矩阵进行预处理,得到单元值为0或1且为方阵的稀疏矩阵A;然后采用k2‑tree算法得到数组T(tree)和L(leaves),根据T(tree)中的信息对Rank数组间隔固定位数进行存储,得出Rank(tree),并根据L(leaves)和对应的原稀疏矩阵得到V(leaves)和rank(leaves)值,输入查询单元的坐标后,可查询得出稀疏矩阵A中存储的数值。本发明可以有效地压缩稀疏矩阵,使查询速度更快,存储空间更节省。
-
公开(公告)号:CN107402959A
公开(公告)日:2017-11-28
申请号:CN201710451043.5
申请日:2017-06-15
Applicant: 中国科学院信息工程研究所
IPC: G06F17/30
Abstract: 本发明提供URL匹配方法、URL匹配设备及存储介质,该方法通过将输入的待匹配的原始URL数据在URL结果缓存中查询是否已存储过其对应的信息,若是则查询标志位及已命中规则表得到以前是否匹配的信息,输出匹配结果;否则在模式匹配引擎中进行匹配,并进行存储URL数据。该方法对大量重复的URL数据去重,以降低URL数据重复匹配次数,提高匹配速度。同时本发明采用比实际串匹配复杂度低的多项式散列算法,但不仅限于多项式散列算法。在增添数据去重操作后可以减少重复的URL数据的匹配次数,达到去重和降低匹配时间的目的。
-
公开(公告)号:CN106570391A
公开(公告)日:2017-04-19
申请号:CN201610990079.6
申请日:2016-11-10
Applicant: 中国科学院信息工程研究所
CPC classification number: G06F21/45 , G06F21/31 , G06F21/46 , G06F21/602 , H04L63/083
Abstract: 本发明公开了一种基于记忆组块的密码猜测集生成方法及数字密码破解方法。本方法为:1)对训练集中的数字密码按记忆组块进行分割,提取数字密码的组成结构和组成片段;2)根据每种记忆组块在该训练集中的频数,计算得到每种记忆组块在训练集中的概率,以及每个数字密码的组合方式的概率;3)将每个数字密码最大概率的组合方式作为该数字密码的分割方式,然后根据记忆组块的频数更新该记忆组块的概率并计算组成结构的概率;4)将记忆组块应用到PCFGs语法中:将组成结构作为非终端结构,将记忆组块作为终端词;5)根据步骤4)得到的基于记忆组块的PCFGs语法,按照概率降序生成密码猜测集;6)根据该密码猜测集进行密码破解。
-
公开(公告)号:CN103634394B
公开(公告)日:2016-08-17
申请号:CN201310618731.8
申请日:2013-11-28
Applicant: 中国科学院信息工程研究所
Abstract: 本发明涉及一种面向数据流处理的弹性可扩展资源管理方法及系统,包括本地管理器实时监控其对应的执行实例的资源利用率和输入负载情况,周期性地向给弹性管理器发送监控报告;所述弹性管理器分析所有本地管理器发送来的监控报告,当发现某一子集群中的某个执行实例出现负载问题时,生成相应的负载均衡策略,启动窗口重构协议或状态重构协议,重新确定上游相关执行实例原来将要发送给出现负载问题的执行实例的元组的去向;本发明所述系统需要具有可扩展性,即可根据当前的数据流负载情况,动态增加、减少节点数量或者在已有节点间均衡负载输入,以实现在保证服务质量的前提下提高资源的利用率。
-
公开(公告)号:CN103634394A
公开(公告)日:2014-03-12
申请号:CN201310618731.8
申请日:2013-11-28
Applicant: 中国科学院信息工程研究所
Abstract: 本发明涉及一种面向数据流处理的弹性可扩展资源管理方法及系统,包括本地管理器实时监控其对应的执行实例的资源利用率和输入负载情况,周期性地向给弹性管理器发送监控报告;所述弹性管理器分析所有本地管理器发送来的监控报告,当发现某一子集群中的某个执行实例出现负载问题时,生成相应的负载均衡策略,启动窗口重构协议或状态重构协议,重新确定上游相关执行实例原来将要发送给出现负载问题的执行实例的元组的去向;本发明所述系统需要具有可扩展性,即可根据当前的数据流负载情况,动态增加、减少节点数量或者在已有节点间均衡负载输入,以实现在保证服务质量的前提下提高资源的利用率。
-
公开(公告)号:CN116170168B
公开(公告)日:2025-05-06
申请号:CN202210253611.1
申请日:2022-03-15
Applicant: 中国科学院信息工程研究所
IPC: H04L9/40 , H04L61/4511
Abstract: 本发明公开一种基于深度支持向量数据描述的DGA域名检测方法及系统,涉及网络安全领域,为解决解决已有工作检测未知DGA家族方法单一、检测率低的问题,本发明首先从真实DNS流量获取不可解析域名作为待检测域名,然后对不可解析域名提取特征向量,最后将特征向量输入至深度支持向量数据描述算法模型中,判别每个不可解析域名是否是DGA域名。
-
公开(公告)号:CN113627164B
公开(公告)日:2024-03-01
申请号:CN202110784458.0
申请日:2021-07-12
Applicant: 中国科学院信息工程研究所
IPC: G06F40/279 , G06F40/216 , G06F18/23213 , G06F18/214 , G06F18/2411
Abstract: 本发明公开了一种状态爆炸型正则表达式的识别方法及系统。本方法为:1)对于一待识别的正则表达式,生成其对应的NFA图,得到该正则表达式对应的NFA图集合;2)对于NFA图集合中的每一NFA图,提取该NFA图中的所有根子图并将其输入graph2vec模型,训练得到该NFA图的嵌入表示;3)利用分类模型处理该NFA图的嵌入化表示,判定该正则表达式是否为状态爆炸型正则表达式。该方法可高效快速的批量处理正则表达式,满足在线系统的高效处理性能与较低空间消耗的需求。
-
-
-
-
-
-
-
-
-