快速内容分析的多关键词匹配方法

    公开(公告)号:CN1508721A

    公开(公告)日:2004-06-30

    申请号:CN02157881.8

    申请日:2002-12-20

    Abstract: 本发明一种快速内容分析的多关键词匹配方法,包括如下步骤:1)对关键词进行预处理;2)根据字符在关键词中出现的概率,建立每个字符的哈夫曼编码,然后把每个关键词编码为一个整数;3)使用全部关键词建立一张检测表;4)对文本进行扫描;5)使用该检测表,快速的进行文本内容分析。它能根据关键词中的每个字的出现频率,进行动态调整,从而提高多关键词匹配的速度。与传统的文件内容分析相比,本发明的特点是:针对大量短关键词集合设计了新的基于哈夫曼编码的多关键词匹配算法(Huff-Match)。使用这种新算法,提高了内容分析系统的性能。本发明适用于高性能网络信息过滤、入侵检测、信息监控、病毒检测等领域。

    一种能够抵御垃圾邮件的分布式邮件系统

    公开(公告)号:CN101212470B

    公开(公告)日:2011-05-04

    申请号:CN200610171517.2

    申请日:2006-12-30

    Inventor: 沙瀛 谭建龙

    Abstract: 本发明公开了一种能够抵御垃圾邮件的分布式电子邮件系统,该系统包括:至少两个用于用户申请获得电子邮件帐号、查询获得电子邮件接收者的网络地址、发送和接收电子邮件的节点单元;至少一个用于响应用户申请电子邮件帐号的请求、分配相应电子邮件帐号,并将与节点单元相邻用户电子邮件帐号及其网络地址传递给用户的目录服务单元;所述节点单元与所述目录服务单元之间通信连接。所述节点单元包括申请电子邮件帐号单元,查询其他帐号网络地址单元,发送电子邮件单元,接收电子邮件单元和存储单元。本发明的优点是:彻底解决垃圾邮件问题,省掉原有邮件服务器之间的转发和由此带来的延迟。

    确定自动机状态转换表的空间压缩方法

    公开(公告)号:CN101916259A

    公开(公告)日:2010-12-15

    申请号:CN201010226250.9

    申请日:2010-07-06

    Abstract: 本发明提供一种确定自动机状态转换表的空间压缩方法,包括:将确定自动机状态转换表表示为一个m×n的矩阵A,其中m代表确定自动机中的状态的个数,n代表字符集的大小;定义一个大小为m的列向量X和一个大小为n的行向量Y;对所述的列向量X和所述的列向量Y做迭代计算,直到对于任意的1≤i≤m,X[i]是多重集Di.中频率最高的元素,并且对于任意的1≤j≤n,Y[j]是多重集D.j中频率最高的元素;其中,所述的Di.={A[i,j]-Y[j]|1≤j≤n},所述的D.j={A[i,j]-X[i]|1≤i≤m};由所述的矩阵A、列向量X和行向量Y计算稀疏矩阵R,并压缩所得到的稀疏矩阵R;其中,R[i,j]=A[i,j]-X[i]-Y[j]。本发明的确定自动机状态转换表的空间压缩方法在减少内存中所占用空间的同时,大大减少了空间开销。

    一种关键词匹配方法和系统

    公开(公告)号:CN101140593A

    公开(公告)日:2008-03-12

    申请号:CN200710175751.7

    申请日:2007-10-11

    Abstract: 本发明公开了一种关键词匹配方法和系统。首先读入关键词文件,统计关键词个数,设置多个过滤散列表和一个校验散列表的掩码或大小;根据关键词和上述散列表掩码或大小构造该过滤散列表和该校验散列表;根据过滤散列表和校验散列表对输入的文本进行扫描匹配,将匹配结果存储在指定的内存结构或者外部文件中。本发明的方法和系统不仅有效提高关键词匹配的速度,还非常节约内存,并可以实现大规模关键词匹配。

    一种可自调参数的串匹配方法和系统

    公开(公告)号:CN101739431A

    公开(公告)日:2010-06-16

    申请号:CN200810227158.7

    申请日:2008-11-24

    Abstract: 本发明涉及一种可自调参数的串匹配方法和系统。该方法包括:步骤1,实时监测模式串匹配算法应用环境的特征指标,获取该特征指标的变化状况;步骤2,依据模式串匹配算法应用环境的特征指标的变化状况和调整策略决定是否调整算法参数,如果是,执行步骤3,否则继续执行步骤1;步骤3,重新计算算法参数,依据该算法参数和模式串匹配算法应用环境的特征指标的值对算法进行更新。本发明能够解决在线系统中算法的自动更新问题,在不需要人工干预的情况下,可以自动根据环境的变化而调整自身的参数,并在系统可支持的情况下自动更新。

    计算滑动窗口下数据流最大值和最小值的方法和系统

    公开(公告)号:CN100487698C

    公开(公告)日:2009-05-13

    申请号:CN200610075648.0

    申请日:2006-04-17

    Abstract: 本发明是一种计算滑动窗口下数据流最大值和最小值的方法和系统,其方法将当前数据拟合一条波形曲线,计算最高波峰值或波谷值和窗口内最新数据的值,取值在两者之间,属于波形曲线下坡或上坡的数据保存为历史数据。当有新的数据添加或旧数据删除时,此数据需要与当前保存的历史数据比较就直接输出当前数据的最大值或最小值,并对保存的历史数据做相应的调整。系统包括计算最大和最小值装置、历史数据存储器、更新历史数据装置。与传统方法相比,本发明不需要保存全部历史数据,计算新最大最小值时,不需要扫描全部保存下来的历史数据。本发明能提高数据分析系统性能,适用于证券信息统计分析、网站日志内容统计分析等领域。

    计算滑动窗口下数据流最大值和最小值的方法和系统

    公开(公告)号:CN101059802A

    公开(公告)日:2007-10-24

    申请号:CN200610075648.0

    申请日:2006-04-17

    Abstract: 本发明是一种计算滑动窗口下数据流最大值和最小值的方法和系统,其方法将当前数据拟合一条波形曲线,计算最高波峰值或波谷值和窗口内最新数据的值,取值在两者之间,属于波形曲线下坡或上坡的数据保存为历史数据。当有新的数据添加或旧数据删除时,此数据需要与当前保存的历史数据比较就直接输出当前数据的最大值或最小值,并对保存的历史数据做相应的调整。系统包括计算最大和最小值装置、历史数据存储器、更新历史数据装置。与传统方法相比,本发明不需要保存全部历史数据,计算新最大最小值时,不需要扫描全部保存下来的历史数据。本发明能提高数据分析系统性能,适用于证券信息统计分析、网站日志内容统计分析等领域。

    确定自动机状态转换表的空间压缩方法

    公开(公告)号:CN101916259B

    公开(公告)日:2012-07-11

    申请号:CN201010226250.9

    申请日:2010-07-06

    Abstract: 本发明提供一种确定自动机状态转换表的空间压缩方法,包括:将确定自动机状态转换表表示为一个m×n的矩阵A,其中m代表确定自动机中的状态的个数,n代表字符集的大小;定义一个大小为m的列向量X和一个大小为n的行向量Y;对所述的列向量X和所述的列向量Y做迭代计算,直到对于任意的1≤i≤m,X[i]是多重集Di.中频率最高的元素,并且对于任意的1≤j≤n,Y[j]是多重集D.j中频率最高的元素;其中,所述的Di.={A[i,j]-Y[j]|1≤j≤n},所述的D.j={A[i,j]-X[i]|1≤i≤m};由所述的矩阵A、列向量X和行向量Y计算稀疏矩阵R,并压缩所得到的稀疏矩阵R;其中,R[i,j]=A[i,j]-X[i]-Y[j]。本发明的确定自动机状态转换表的空间压缩方法在减少内存中所占用空间的同时,大大减少了空间开销。

Patent Agency Ranking