-
公开(公告)号:CN108090115A
公开(公告)日:2018-05-29
申请号:CN201711070628.9
申请日:2017-11-03
Applicant: 中国科学院信息工程研究所
CPC classification number: G06F17/30097 , G06F17/30153 , H04L67/02 , H04L67/06
Abstract: 本发明提出一种针对Gzip压缩数据的过滤方法,根据Gzip压缩数据的特点,并结合KR多模式匹配算法,提升Gzip压缩数据的过滤速度,同时提高处理的实时性和安全性。本发明还提出一种针对Gzip压缩数据的过滤系统,用于执行该方法。
-
公开(公告)号:CN106469218A
公开(公告)日:2017-03-01
申请号:CN201610811459.9
申请日:2016-09-08
Applicant: 中国科学院信息工程研究所
IPC: G06F17/30
Abstract: 本发明公开了一种基于位图的布尔表达式存储、匹配方法和系统。本发明存储阶段:针对多个布尔表达式的各个子项,对其相应的布尔表达式序号和所在位置进行存储,并按照子项值的大小升序排序,同时记录每个布尔表达式子项数目;对子项值建立索引。匹配阶段:开辟数组位向量bitmap存储每个布尔表达式的匹配情况,将每个能匹配的布尔表达式所对应的位置置为1,判断bitmap中1的个数是否与其子项数目一致,若一致,则输出对应序号,并将bitmap[k]置为-1以防止重复匹配该布尔表达式,否则继续匹配下一文本项。本系统包括系统预处理部件、存储子项部件、构建索引部件、访问信息部件和返回信息部件。本发明大大提高了查询效率。
-
公开(公告)号:CN111753144B
公开(公告)日:2023-10-17
申请号:CN202010412343.4
申请日:2020-05-15
Applicant: 中国科学院信息工程研究所
IPC: G06F16/903
Abstract: 本发明提出一种基于Warshall方法加速epsilon闭包计算的方法及系统,针对传统闭包计算整体消耗时间长的缺陷,涉及计算机领域,为了优化闭包算法,利用Warshall方法,在NFA构造DFA的过程中对现有的方法进行了优化,加速了DFA的构造过程。
-
公开(公告)号:CN111753150A
公开(公告)日:2020-10-09
申请号:CN202010412344.9
申请日:2020-05-15
Applicant: 中国科学院信息工程研究所
IPC: G06F16/9032
Abstract: 本发明公开一种基于图搜索方法加速epsilon闭包计算的方法及系统,涉及计算机领域,针对传统闭包计算整体消耗时间长的缺陷,为了优化闭包算法,利用图搜索的方法,在NFA构造DFA的过程中对现有的方法进行优化,加速了DFA的构造过程。
-
公开(公告)号:CN110401451A
公开(公告)日:2019-11-01
申请号:CN201910505421.2
申请日:2019-06-12
Applicant: 中国科学院信息工程研究所
Abstract: 本发明提供一种基于字符集变换的自动机空间压缩方法,步骤包括:将模式串集构建成自动机,并生成状态转移矩阵;读取状态转移矩阵的各个状态行,计算最佳变换参数、最小有效后继状态和最大有效后继状态;根据状态转移矩阵和最佳变换参数,记录数据结构,将状态行替换为变换后的有效状态行;读取目标文本的字符,根据字符当前状态,利用双射函数进行字符变换,得到变换后的字符,符合条件下得到后继状态,实现压缩。本发明还提供一种基于字符集变换的自动机空间压缩系统,包括规则编译器、变换参数生成器、状态行变换器、比较器、压缩自动机存储器、状态寄存器、字符集变换器及文本扫描器。
-
公开(公告)号:CN107515897A
公开(公告)日:2017-12-26
申请号:CN201710589808.1
申请日:2017-07-19
Applicant: 中国科学院信息工程研究所
IPC: G06F17/30
CPC classification number: G06F16/90344
Abstract: 本发明涉及一种串匹配场景下数据集生成方法、设备和可读存储介质。该方法包括以下步骤:1)独立地生成模式串的每个字符,形成预设规模和预设长度的随机模式串集合;2)根据已生成的随机模式串集合,构造指定命中水平的文本数据集;3)输出生成的随机模式串集合和文本数据集。该设备包括通过总线连接的接收器、处理器、存储器和发送器,所述存储器用于存储串匹配场景下数据集生成指令。本发明能够生成预设规模预设长度的随机模式串集合,根据已生成的随机模式串集合可以构造指定命中水平的文本数据集,该随机模式串集合和文本数据集能够用于串匹配算法的功能测试和性能测试,对串匹配算法的进一步研究和性能提升有重要的作用。
-
-
-
-
-