-
公开(公告)号:CN106326475A
公开(公告)日:2017-01-11
申请号:CN201610793354.5
申请日:2016-08-31
Applicant: 中国科学院信息工程研究所
IPC: G06F17/30
Abstract: 本发明涉及一种高效的静态哈希表实现方法及系统。该方法包括以下步骤:1)设定哈希桶大小hash_bit,生成多个数据对,将key[i]和value[i]对应于关键字和值;2)根据key[i]值,利用rank操作构建哈希表,并计算C表和D表;3)根据C表和D表计算rank(h),并根据rank(h)的值存储相应的key[i]和value[i];4)根据所要查询的值key判断哈希表中是否存在该元素,若存在则在对应存储位置查询并返回value值,否则访问失败;5)根据步骤4)所得的结果返回结果信息。本发明利用Rank-select算法实现新型静态哈希表的构建与访问,可用于内容过滤、信息安全等领域。
-
公开(公告)号:CN104809161A
公开(公告)日:2015-07-29
申请号:CN201510152316.7
申请日:2015-04-01
Applicant: 中国科学院信息工程研究所
IPC: G06F17/30
Abstract: 本发明涉及一种对稀疏矩阵进行压缩和查询的方法及系统。该方法对k2-tree方法进行了改进:一是rank操作的改变,二是对于一般矩阵和非零一矩阵的处理。首先对待处理的稀疏矩阵进行预处理,得到单元值为0或1且为方阵的稀疏矩阵A;然后采用k2-tree算法得到数组T(tree)和L(leaves),根据T(tree)中的信息对Rank数组间隔固定位数进行存储,得出Rank(tree),并根据L(leaves)和对应的原稀疏矩阵得到V(leaves)和rank(leaves)值,输入查询单元的坐标后,可查询得出稀疏矩阵A中存储的数值。本发明可以有效地压缩稀疏矩阵,使查询速度更快,存储空间更节省。
-
公开(公告)号:CN111753150B
公开(公告)日:2023-10-13
申请号:CN202010412344.9
申请日:2020-05-15
Applicant: 中国科学院信息工程研究所
IPC: G06F16/9032
Abstract: 本发明公开一种基于图搜索方法加速epsilon闭包计算的方法及系统,涉及计算机领域,针对传统闭包计算整体消耗时间长的缺陷,为了优化闭包算法,利用图搜索的方法,在NFA构造DFA的过程中对现有的方法进行优化,加速了DFA的构造过程。
-
公开(公告)号:CN116668076A
公开(公告)日:2023-08-29
申请号:CN202310469493.2
申请日:2023-04-27
Applicant: 中国科学院信息工程研究所
IPC: H04L9/40 , H04L61/4511
Abstract: 本发明公开了一种基于异质图鲁棒对抗学习的恶意域名检测方法和装置。所述方法包括:将DNS场景建模为一个原始异质图;其中,所述原始异质图中的节点包括:域名、客户端和IP地址;对原始异质图进行攻击注入,以得到若干个受攻击图;基于DoDe‑CL模型和多层感知机,计算原始异质图和受攻击图中的域名嵌入表示后,对同一域名进行域名嵌入表示组合,并根据组合后的域名嵌入表示,得到所述DNS场景中的恶意域名检测结果。本发明可以提升模型面对基于异质图的攻击时的鲁棒性。
-
公开(公告)号:CN116170168A
公开(公告)日:2023-05-26
申请号:CN202210253611.1
申请日:2022-03-15
Applicant: 中国科学院信息工程研究所
IPC: H04L9/40 , H04L61/4511
Abstract: 本发明公开一种基于深度支持向量数据描述的DGA域名检测方法及系统,涉及网络安全领域,为解决解决已有工作检测未知DGA家族方法单一、检测率低的问题,本发明首先从真实DNS流量获取不可解析域名作为待检测域名,然后对不可解析域名提取特征向量,最后将特征向量输入至深度支持向量数据描述算法模型中,判别每个不可解析域名是否是DGA域名。
-
公开(公告)号:CN113627164A
公开(公告)日:2021-11-09
申请号:CN202110784458.0
申请日:2021-07-12
Applicant: 中国科学院信息工程研究所
IPC: G06F40/279 , G06F40/216 , G06K9/62
Abstract: 本发明公开了一种状态爆炸型正则表达式的识别方法及系统。本方法为:1)对于一待识别的正则表达式,生成其对应的NFA图,得到该正则表达式对应的NFA图集合;2)对于NFA图集合中的每一NFA图,提取该NFA图中的所有根子图并将其输入graph2vec模型,训练得到该NFA图的嵌入表示;3)利用分类模型处理该NFA图的嵌入化表示,判定该正则表达式是否为状态爆炸型正则表达式。该方法可高效快速的批量处理正则表达式,满足在线系统的高效处理性能与较低空间消耗的需求。
-
公开(公告)号:CN108399152B
公开(公告)日:2021-05-07
申请号:CN201810119184.1
申请日:2018-02-06
Applicant: 中国科学院信息工程研究所
Abstract: 本发明涉及一种数字查找树的压缩表示方法、系统、存储介质及规则匹配装置。该方法包括:采用完全矩阵表示法建立数字查找树的结点,并建立状态转换表;建立基值表,并利用数组记录叶子结点状态中对应的规则编号;利用基值表对状态行进行归一化,生成归一化矩阵;利用数组来记录归一化矩阵的状态,对归一化矩阵的状态进行去重,得到约简的状态转移矩阵;利用位图对约简的状态转移矩阵进行修正,使其中的元素能够用一个字节来表示;利用基值表、记录归一化矩阵状态的数组、位图和修正后的矩阵进行状态的匹配,并输出匹配结果。本发明以完全矩阵表示法为原型,能够保证结点间状态转移的时间复杂度为O(1),同时可大幅度减少数据结构的存储空间。
-
公开(公告)号:CN107515897B
公开(公告)日:2021-02-02
申请号:CN201710589808.1
申请日:2017-07-19
Applicant: 中国科学院信息工程研究所
IPC: G06F16/903
Abstract: 本发明涉及一种串匹配场景下数据集生成方法、设备和可读存储介质。该方法包括以下步骤:1)独立地生成模式串的每个字符,形成预设规模和预设长度的随机模式串集合;2)根据已生成的随机模式串集合,构造指定命中水平的文本数据集;3)输出生成的随机模式串集合和文本数据集。该设备包括通过总线连接的接收器、处理器、存储器和发送器,所述存储器用于存储串匹配场景下数据集生成指令。本发明能够生成预设规模预设长度的随机模式串集合,根据已生成的随机模式串集合可以构造指定命中水平的文本数据集,该随机模式串集合和文本数据集能够用于串匹配算法的功能测试和性能测试,对串匹配算法的进一步研究和性能提升有重要的作用。
-
公开(公告)号:CN110401451B
公开(公告)日:2020-12-04
申请号:CN201910505421.2
申请日:2019-06-12
Applicant: 中国科学院信息工程研究所
Abstract: 本发明提供一种基于字符集变换的自动机空间压缩方法,步骤包括:将模式串集构建成自动机,并生成状态转移矩阵;读取状态转移矩阵的各个状态行,计算最佳变换参数、最小有效后继状态和最大有效后继状态;根据状态转移矩阵和最佳变换参数,记录数据结构,将状态行替换为变换后的有效状态行;读取目标文本的字符,根据字符当前状态,利用双射函数进行字符变换,得到变换后的字符,符合条件下得到后继状态,实现压缩。本发明还提供一种基于字符集变换的自动机空间压缩系统,包括规则编译器、变换参数生成器、状态行变换器、比较器、压缩自动机存储器、状态寄存器、字符集变换器及文本扫描器。
-
公开(公告)号:CN106469218B
公开(公告)日:2019-11-19
申请号:CN201610811459.9
申请日:2016-09-08
Applicant: 中国科学院信息工程研究所
IPC: G06F16/22
Abstract: 本发明公开了一种基于位图的布尔表达式存储、匹配方法和系统。本发明存储阶段:针对多个布尔表达式的各个子项,对其相应的布尔表达式序号和所在位置进行存储,并按照子项值的大小升序排序,同时记录每个布尔表达式子项数目;对子项值建立索引。匹配阶段:开辟数组位向量bitmap存储每个布尔表达式的匹配情况,将每个能匹配的布尔表达式所对应的位置置为1,判断bitmap中1的个数是否与其子项数目一致,若一致,则输出对应序号,并将bitmap[k]置为‑1以防止重复匹配该布尔表达式,否则继续匹配下一文本项。本系统包括系统预处理部件、存储子项部件、构建索引部件、访问信息部件和返回信息部件。本发明大大提高了查询效率。
-
-
-
-
-
-
-
-
-