-
公开(公告)号:CN115424025A
公开(公告)日:2022-12-02
申请号:CN202210927391.6
申请日:2022-08-03
Applicant: 中国科学院信息工程研究所
Abstract: 本发明涉及一种稠密子图抽取方法和系统,属于计算机软件技术领域。该方法包括:对原图采用Mas策略进行子图分割,得到节点序列L;对节点序列L进行合并检查,无法通过合并检查的结点重新回到原图做后续的分割;对通过合并检查的子图结点进行合并,构成K边联通子图。本发明在图分解框架中使用了最大S‑T流解决路径数搜索问题,对现有Mas策略的不足提出了改进方法,使得本方法在K‑ECC抽取工作中提高了现有工作的准确率。
-
公开(公告)号:CN111753144A
公开(公告)日:2020-10-09
申请号:CN202010412343.4
申请日:2020-05-15
Applicant: 中国科学院信息工程研究所
IPC: G06F16/903
Abstract: 本发明提出一种基于Warshall方法加速epsilon闭包计算的方法及系统,针对传统闭包计算整体消耗时间长的缺陷,涉及计算机领域,为了优化闭包算法,利用Warshall方法,在NFA构造DFA的过程中对现有的方法进行了优化,加速了DFA的构造过程。
-
公开(公告)号:CN110943936A
公开(公告)日:2020-03-31
申请号:CN201911086763.1
申请日:2019-11-08
Applicant: 中国科学院信息工程研究所
IPC: H04L12/861
Abstract: 本发明涉及一种高效的基于动态数组的网络流量处理方法及系统。该方法为每个线程分配一个缓存管理器,所述缓存管理器申请以超级块为单位的内存块,每个超级块包含多个基本块;设置动态数组,通过所述动态数组将网络流的扫描结果存储在所属线程的缓存管理器申请的超级块中。在初始化阶段创建所需线程,初始化缓存管理器、线程中的网络流以及动态数组;在内存使用阶段进行申请内存、获取下一元素以及归还内存的操作。本发明能够减少内存空间的浪费,满足在线系统的高效处理性能与较低空间消耗的需求。
-
公开(公告)号:CN106326475B
公开(公告)日:2019-12-27
申请号:CN201610793354.5
申请日:2016-08-31
Applicant: 中国科学院信息工程研究所
IPC: G06F16/22
Abstract: 本发明涉及一种高效的静态哈希表实现方法及系统。该方法包括以下步骤:1)设定哈希桶大小hash_bit,生成多个数据对,将key[i]和value[i]对应于关键字和值;2)根据key[i]值,利用rank操作构建哈希表,并计算C表和D表;3)根据C表和D表计算rank(h),并根据rank(h)的值存储相应的key[i]和value[i];4)根据所要查询的值key判断哈希表中是否存在该元素,若存在则在对应存储位置查询并返回value值,否则访问失败;5)根据步骤4)所得的结果返回结果信息。本发明利用Rank‑select算法实现新型静态哈希表的构建与访问,可用于内容过滤、信息安全等领域。
-
公开(公告)号:CN108399152A
公开(公告)日:2018-08-14
申请号:CN201810119184.1
申请日:2018-02-06
Applicant: 中国科学院信息工程研究所
Abstract: 本发明涉及一种数字查找树的压缩表示方法、系统、存储介质及规则匹配装置。该方法包括:采用完全矩阵表示法建立数字查找树的结点,并建立状态转换表;建立基值表,并利用数组记录叶子结点状态中对应的规则编号;利用基值表对状态行进行归一化,生成归一化矩阵;利用数组来记录归一化矩阵的状态,对归一化矩阵的状态进行去重,得到约简的状态转移矩阵;利用位图对约简的状态转移矩阵进行修正,使其中的元素能够用一个字节来表示;利用基值表、记录归一化矩阵状态的数组、位图和修正后的矩阵进行状态的匹配,并输出匹配结果。本发明以完全矩阵表示法为原型,能够保证结点间状态转移的时间复杂度为O(1),同时可大幅度减少数据结构的存储空间。
-
公开(公告)号:CN108073679A
公开(公告)日:2018-05-25
申请号:CN201711103789.3
申请日:2017-11-10
Applicant: 中国科学院信息工程研究所
IPC: G06F17/30
Abstract: 本发明涉及一种串匹配场景下随机模式串集合生成方法、设备和可读存储介质。该方法包括以下步骤:1)获取基于字符出现的频率建立的基于马尔可夫链的模型;2)利用基于马尔可夫链的模型生成指定长度和规模的随机模式串集合。该设备包括接收器、处理器、存储器和发送器。本发明生成的随机模式串集合符合现实世界的概率分布特征,能够依据真实模式串集合的概率分布特征生成任意长度、任意规模、特定类型的随机模式串集合,从而用于串匹配算法的功能测试和性能测试。
-
公开(公告)号:CN115587223A
公开(公告)日:2023-01-10
申请号:CN202211065691.4
申请日:2022-09-01
Applicant: 中国科学院信息工程研究所
IPC: G06F16/903 , G06F16/35 , G06F16/33 , G06F40/216
Abstract: 本发明提出一种面向相似文本的正则表达式自动生成方法、系统及介质,涉及自然语言处理领域和信息安全领域,对于输入的相似文本,采用文本嵌入表示方法获得相似文本的嵌入表示;再将同类的相似文本聚为同一类别;对于每类相似文本,抽取出其中的公共部分和差异部分;将抽取的公共部分和差异部分进行组合,生成每类相似文本对应的正则表达式。本发明可高效快速地批量处理大量相似文本,不需人工参与,生成每类相似文本的正则表达式。
-
公开(公告)号:CN110413958B
公开(公告)日:2020-12-04
申请号:CN201910505446.2
申请日:2019-06-12
Applicant: 中国科学院信息工程研究所
IPC: G06F40/151 , G06F16/903
Abstract: 本发明提供一种用于自动机空间压缩的线性同余字符集变换方法,步骤包括:将模式串集构建成自动机,并生成状态转移矩阵;读取状态转移矩阵的各个状态行,计算最佳变换参数和最大有效后继状态;根据状态转移矩阵和最佳变换参数,记录数据结构,将状态行替换为变换后的有效状态行;读取目标文本的字符,根据字符当前状态,利用线性同余函数进行字符变换,得到变换后的字符,符合条件下得到后继状态,实现变换。本发明还提供一种用于自动机空间压缩的线性同余字符集变换系统,包括规则编译器、变换参数生成器、状态行变换器、比较器、压缩自动机存储器、状态寄存器、字符集变换器及文本扫描器。
-
公开(公告)号:CN107402959B
公开(公告)日:2020-01-17
申请号:CN201710451043.5
申请日:2017-06-15
Applicant: 中国科学院信息工程研究所
IPC: G06F16/958 , G06F16/955 , G06F16/901
Abstract: 本发明提供URL匹配方法、URL匹配设备及存储介质,该方法通过将输入的待匹配的原始URL数据在URL结果缓存中查询是否已存储过其对应的信息,若是则查询标志位及已命中规则表得到以前是否匹配的信息,输出匹配结果;否则在模式匹配引擎中进行匹配,并进行存储URL数据。该方法对大量重复的URL数据去重,以降低URL数据重复匹配次数,提高匹配速度。同时本发明采用比实际串匹配复杂度低的多项式散列算法,但不仅限于多项式散列算法。在增添数据去重操作后可以减少重复的URL数据的匹配次数,达到去重和降低匹配时间的目的。
-
公开(公告)号:CN110413958A
公开(公告)日:2019-11-05
申请号:CN201910505446.2
申请日:2019-06-12
Applicant: 中国科学院信息工程研究所
IPC: G06F17/22 , G06F16/903
Abstract: 本发明提供一种一种用于自动机空间压缩的线性同余字符集变换方法,步骤包括:将模式串集构建成自动机,并生成状态转移矩阵;读取状态转移矩阵的各个状态行,计算最佳变换参数和最大有效后继状态;根据状态转移矩阵和最佳变换参数,记录数据结构,将状态行替换为变换后的有效状态行;读取目标文本的字符,根据字符当前状态,利用线性同余函数进行字符变换,得到变换后的字符,符合条件下得到后继状态,实现变换。本发明还提供一种用于自动机空间压缩的线性同余字符集变换系统,包括规则编译器、变换参数生成器、状态行变换器、比较器、压缩自动机存储器、状态寄存器、字符集变换器及文本扫描器。
-
-
-
-
-
-
-
-
-