一种可自调参数的串匹配方法和系统

    公开(公告)号:CN101739431A

    公开(公告)日:2010-06-16

    申请号:CN200810227158.7

    申请日:2008-11-24

    Abstract: 本发明涉及一种可自调参数的串匹配方法和系统。该方法包括:步骤1,实时监测模式串匹配算法应用环境的特征指标,获取该特征指标的变化状况;步骤2,依据模式串匹配算法应用环境的特征指标的变化状况和调整策略决定是否调整算法参数,如果是,执行步骤3,否则继续执行步骤1;步骤3,重新计算算法参数,依据该算法参数和模式串匹配算法应用环境的特征指标的值对算法进行更新。本发明能够解决在线系统中算法的自动更新问题,在不需要人工干预的情况下,可以自动根据环境的变化而调整自身的参数,并在系统可支持的情况下自动更新。

    确定自动机状态转换表的空间压缩方法

    公开(公告)号:CN101916259A

    公开(公告)日:2010-12-15

    申请号:CN201010226250.9

    申请日:2010-07-06

    Abstract: 本发明提供一种确定自动机状态转换表的空间压缩方法,包括:将确定自动机状态转换表表示为一个m×n的矩阵A,其中m代表确定自动机中的状态的个数,n代表字符集的大小;定义一个大小为m的列向量X和一个大小为n的行向量Y;对所述的列向量X和所述的列向量Y做迭代计算,直到对于任意的1≤i≤m,X[i]是多重集Di.中频率最高的元素,并且对于任意的1≤j≤n,Y[j]是多重集D.j中频率最高的元素;其中,所述的Di.={A[i,j]-Y[j]|1≤j≤n},所述的D.j={A[i,j]-X[i]|1≤i≤m};由所述的矩阵A、列向量X和行向量Y计算稀疏矩阵R,并压缩所得到的稀疏矩阵R;其中,R[i,j]=A[i,j]-X[i]-Y[j]。本发明的确定自动机状态转换表的空间压缩方法在减少内存中所占用空间的同时,大大减少了空间开销。

    一种关键词匹配方法和系统

    公开(公告)号:CN101140593A

    公开(公告)日:2008-03-12

    申请号:CN200710175751.7

    申请日:2007-10-11

    Abstract: 本发明公开了一种关键词匹配方法和系统。首先读入关键词文件,统计关键词个数,设置多个过滤散列表和一个校验散列表的掩码或大小;根据关键词和上述散列表掩码或大小构造该过滤散列表和该校验散列表;根据过滤散列表和校验散列表对输入的文本进行扫描匹配,将匹配结果存储在指定的内存结构或者外部文件中。本发明的方法和系统不仅有效提高关键词匹配的速度,还非常节约内存,并可以实现大规模关键词匹配。

    确定自动机的空间压缩方法

    公开(公告)号:CN101630323B

    公开(公告)日:2012-01-25

    申请号:CN200910090556.3

    申请日:2009-08-20

    Abstract: 本发明提供一种确定自动机的空间压缩方法,包括:对确定自动机中的各个状态做分簇操作,得到多个用于表示状态集合的簇;将确定自动机中各个状态的转移边按簇分类,得到多个簇矩阵、与所述簇矩阵对应的位图以及一个剩余矩阵;其中,所述簇矩阵包括指向同一簇的转移边,所述位图用于描述所对应簇矩阵中相关元素的有效性;所述剩余矩阵包括确定自动机中未被包含到所述簇矩阵中的剩余转移边;为所述簇矩阵中的各行提取基值,然后将所述簇矩阵转换成一个偏移量矩阵,再将偏移量矩阵中的各行合并,增加用于标记可合并状态的索引数组,得到所述簇矩阵的压缩矩阵。本发明不仅在压缩效果上有所提高,而且在实现正则表达式匹配时在匹配速度上有很大的提高。

    确定自动机状态转换表的空间压缩方法

    公开(公告)号:CN101916259B

    公开(公告)日:2012-07-11

    申请号:CN201010226250.9

    申请日:2010-07-06

    Abstract: 本发明提供一种确定自动机状态转换表的空间压缩方法,包括:将确定自动机状态转换表表示为一个m×n的矩阵A,其中m代表确定自动机中的状态的个数,n代表字符集的大小;定义一个大小为m的列向量X和一个大小为n的行向量Y;对所述的列向量X和所述的列向量Y做迭代计算,直到对于任意的1≤i≤m,X[i]是多重集Di.中频率最高的元素,并且对于任意的1≤j≤n,Y[j]是多重集D.j中频率最高的元素;其中,所述的Di.={A[i,j]-Y[j]|1≤j≤n},所述的D.j={A[i,j]-X[i]|1≤i≤m};由所述的矩阵A、列向量X和行向量Y计算稀疏矩阵R,并压缩所得到的稀疏矩阵R;其中,R[i,j]=A[i,j]-X[i]-Y[j]。本发明的确定自动机状态转换表的空间压缩方法在减少内存中所占用空间的同时,大大减少了空间开销。

    确定自动机的空间压缩方法

    公开(公告)号:CN101630323A

    公开(公告)日:2010-01-20

    申请号:CN200910090556.3

    申请日:2009-08-20

    Abstract: 本发明提供一种确定自动机的空间压缩方法,包括:对确定自动机中的各个状态做分簇操作,得到多个用于表示状态集合的簇;将确定自动机中各个状态的转移边按簇分类,得到多个簇矩阵、与所述簇矩阵对应的位图以及一个剩余矩阵;其中,所述簇矩阵包括指向同一簇的转移边,所述位图用于描述所对应簇矩阵中相关元素的有效性;所述剩余矩阵包括确定自动机中未被包含到所述簇矩阵中的剩余转移边;为所述簇矩阵中的各行提取基值,然后将所述簇矩阵转换成一个偏移量矩阵,再将偏移量矩阵中的各行合并,增加用于标记可合并状态的索引数组,得到所述簇矩阵的压缩矩阵。本发明不仅在压缩效果上有所提高,而且在实现正则表达式匹配时在匹配速度上有很大的提高。

    一种关键词匹配方法和系统

    公开(公告)号:CN100530194C

    公开(公告)日:2009-08-19

    申请号:CN200710175751.7

    申请日:2007-10-11

    Abstract: 本发明公开了一种关键词匹配方法和系统。首先读入关键词文件,统计关键词个数,设置多个过滤散列表和一个校验散列表的掩码或大小;根据关键词和上述散列表掩码或大小构造该过滤散列表和该校验散列表;根据过滤散列表和校验散列表对输入的文本进行扫描匹配,将匹配结果存储在指定的内存结构或者外部文件中。本发明的方法和系统不仅有效提高关键词匹配的速度,还非常节约内存,并可以实现大规模关键词匹配。

Patent Agency Ranking