-
公开(公告)号:CN102831051A
公开(公告)日:2012-12-19
申请号:CN201110161094.7
申请日:2011-06-15
Applicant: 中国科学院计算技术研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F11/36
Abstract: 本发明公开了一种对WuManber算法进行测试的方法和系统。所述方法,包括下列步骤:根据模式串集合以及WuManber算法使用的散列函数,设计生成能够使WuManber算法验证次数最多的测试数据;对WuManber算法使用所述测试数据进行测试,获得WuManber算法的最低运算速度。
-
公开(公告)号:CN101739431A
公开(公告)日:2010-06-16
申请号:CN200810227158.7
申请日:2008-11-24
Applicant: 中国科学院计算技术研究所
IPC: G06F17/30
Abstract: 本发明涉及一种可自调参数的串匹配方法和系统。该方法包括:步骤1,实时监测模式串匹配算法应用环境的特征指标,获取该特征指标的变化状况;步骤2,依据模式串匹配算法应用环境的特征指标的变化状况和调整策略决定是否调整算法参数,如果是,执行步骤3,否则继续执行步骤1;步骤3,重新计算算法参数,依据该算法参数和模式串匹配算法应用环境的特征指标的值对算法进行更新。本发明能够解决在线系统中算法的自动更新问题,在不需要人工干预的情况下,可以自动根据环境的变化而调整自身的参数,并在系统可支持的情况下自动更新。
-
公开(公告)号:CN101916259A
公开(公告)日:2010-12-15
申请号:CN201010226250.9
申请日:2010-07-06
Applicant: 中国科学院计算技术研究所
IPC: G06F17/30
Abstract: 本发明提供一种确定自动机状态转换表的空间压缩方法,包括:将确定自动机状态转换表表示为一个m×n的矩阵A,其中m代表确定自动机中的状态的个数,n代表字符集的大小;定义一个大小为m的列向量X和一个大小为n的行向量Y;对所述的列向量X和所述的列向量Y做迭代计算,直到对于任意的1≤i≤m,X[i]是多重集Di.中频率最高的元素,并且对于任意的1≤j≤n,Y[j]是多重集D.j中频率最高的元素;其中,所述的Di.={A[i,j]-Y[j]|1≤j≤n},所述的D.j={A[i,j]-X[i]|1≤i≤m};由所述的矩阵A、列向量X和行向量Y计算稀疏矩阵R,并压缩所得到的稀疏矩阵R;其中,R[i,j]=A[i,j]-X[i]-Y[j]。本发明的确定自动机状态转换表的空间压缩方法在减少内存中所占用空间的同时,大大减少了空间开销。
-
公开(公告)号:CN101140593A
公开(公告)日:2008-03-12
申请号:CN200710175751.7
申请日:2007-10-11
Applicant: 中国科学院计算技术研究所
IPC: G06F17/30
Abstract: 本发明公开了一种关键词匹配方法和系统。首先读入关键词文件,统计关键词个数,设置多个过滤散列表和一个校验散列表的掩码或大小;根据关键词和上述散列表掩码或大小构造该过滤散列表和该校验散列表;根据过滤散列表和校验散列表对输入的文本进行扫描匹配,将匹配结果存储在指定的内存结构或者外部文件中。本发明的方法和系统不仅有效提高关键词匹配的速度,还非常节约内存,并可以实现大规模关键词匹配。
-
公开(公告)号:CN102831051B
公开(公告)日:2014-11-19
申请号:CN201110161094.7
申请日:2011-06-15
Applicant: 中国科学院计算技术研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F11/36
Abstract: 本发明公开了一种对WuManber算法进行测试的方法和系统。所述方法,包括下列步骤:根据模式串集合以及WuManber算法使用的散列函数,设计生成能够使WuManber算法验证次数最多的测试数据;对WuManber算法使用所述测试数据进行测试,获得WuManber算法的最低运算速度。
-
公开(公告)号:CN101630323B
公开(公告)日:2012-01-25
申请号:CN200910090556.3
申请日:2009-08-20
Applicant: 中国科学院计算技术研究所
IPC: G06F17/30
Abstract: 本发明提供一种确定自动机的空间压缩方法,包括:对确定自动机中的各个状态做分簇操作,得到多个用于表示状态集合的簇;将确定自动机中各个状态的转移边按簇分类,得到多个簇矩阵、与所述簇矩阵对应的位图以及一个剩余矩阵;其中,所述簇矩阵包括指向同一簇的转移边,所述位图用于描述所对应簇矩阵中相关元素的有效性;所述剩余矩阵包括确定自动机中未被包含到所述簇矩阵中的剩余转移边;为所述簇矩阵中的各行提取基值,然后将所述簇矩阵转换成一个偏移量矩阵,再将偏移量矩阵中的各行合并,增加用于标记可合并状态的索引数组,得到所述簇矩阵的压缩矩阵。本发明不仅在压缩效果上有所提高,而且在实现正则表达式匹配时在匹配速度上有很大的提高。
-
公开(公告)号:CN101916259B
公开(公告)日:2012-07-11
申请号:CN201010226250.9
申请日:2010-07-06
Applicant: 中国科学院计算技术研究所
IPC: G06F17/30
Abstract: 本发明提供一种确定自动机状态转换表的空间压缩方法,包括:将确定自动机状态转换表表示为一个m×n的矩阵A,其中m代表确定自动机中的状态的个数,n代表字符集的大小;定义一个大小为m的列向量X和一个大小为n的行向量Y;对所述的列向量X和所述的列向量Y做迭代计算,直到对于任意的1≤i≤m,X[i]是多重集Di.中频率最高的元素,并且对于任意的1≤j≤n,Y[j]是多重集D.j中频率最高的元素;其中,所述的Di.={A[i,j]-Y[j]|1≤j≤n},所述的D.j={A[i,j]-X[i]|1≤i≤m};由所述的矩阵A、列向量X和行向量Y计算稀疏矩阵R,并压缩所得到的稀疏矩阵R;其中,R[i,j]=A[i,j]-X[i]-Y[j]。本发明的确定自动机状态转换表的空间压缩方法在减少内存中所占用空间的同时,大大减少了空间开销。
-
公开(公告)号:CN102243656A
公开(公告)日:2011-11-16
申请号:CN201110162453.0
申请日:2011-06-16
Applicant: 中国科学院计算技术研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F17/30
Abstract: 本发明提供一种基于散列的串匹配方法及其选择模式串子窗口的方法。通过选择每个模式串的最优子窗口来计算该模式串的散列值,并以此来建立散列表。从而在大量的模式串有相同的前缀、后缀或子串的情况下,确保模式串尽量均匀地散列到散列表中,提高散列表的均匀性,保证基于散列的串匹配方法的高效运行。
-
公开(公告)号:CN101630323A
公开(公告)日:2010-01-20
申请号:CN200910090556.3
申请日:2009-08-20
Applicant: 中国科学院计算技术研究所
IPC: G06F17/30
Abstract: 本发明提供一种确定自动机的空间压缩方法,包括:对确定自动机中的各个状态做分簇操作,得到多个用于表示状态集合的簇;将确定自动机中各个状态的转移边按簇分类,得到多个簇矩阵、与所述簇矩阵对应的位图以及一个剩余矩阵;其中,所述簇矩阵包括指向同一簇的转移边,所述位图用于描述所对应簇矩阵中相关元素的有效性;所述剩余矩阵包括确定自动机中未被包含到所述簇矩阵中的剩余转移边;为所述簇矩阵中的各行提取基值,然后将所述簇矩阵转换成一个偏移量矩阵,再将偏移量矩阵中的各行合并,增加用于标记可合并状态的索引数组,得到所述簇矩阵的压缩矩阵。本发明不仅在压缩效果上有所提高,而且在实现正则表达式匹配时在匹配速度上有很大的提高。
-
公开(公告)号:CN100530194C
公开(公告)日:2009-08-19
申请号:CN200710175751.7
申请日:2007-10-11
Applicant: 中国科学院计算技术研究所
IPC: G06F17/30
Abstract: 本发明公开了一种关键词匹配方法和系统。首先读入关键词文件,统计关键词个数,设置多个过滤散列表和一个校验散列表的掩码或大小;根据关键词和上述散列表掩码或大小构造该过滤散列表和该校验散列表;根据过滤散列表和校验散列表对输入的文本进行扫描匹配,将匹配结果存储在指定的内存结构或者外部文件中。本发明的方法和系统不仅有效提高关键词匹配的速度,还非常节约内存,并可以实现大规模关键词匹配。
-
-
-
-
-
-
-
-
-