-
公开(公告)号:CN101359325B
公开(公告)日:2010-06-16
申请号:CN200710119845.2
申请日:2007-08-01
Applicant: 北京启明星辰信息技术股份有限公司
IPC: G06F17/30
Abstract: 本发明公开了一种快速内容分析的多关键词匹配方法。所述发明方法包括预处理阶段和模式匹配阶段。其中,所述的预处理阶段包括关键词特征串裁剪和关键词特征分片集合的构建、基于关键词特征分片集合的Bloom Filte(布隆过滤器)构造,以及原始关键词集合线性表构造,所述关键词匹配阶段包括:依据Bloom Filter实现当前窗口中文本串不与任何关键词特征分片匹配的快速判定;只在判定失败情况下通过字符串比较操作实现与候选关键词的精确匹配;将文本匹配窗口连续多字节快速跳跃。本发明充分利用了待匹配文本与关键词匹配成功概率异常低的特点,可实现大数量关键词场景下的高速匹配,非常适合病毒检测等在线病毒扫描应用。
-
公开(公告)号:CN101471818A
公开(公告)日:2009-07-01
申请号:CN200710303985.5
申请日:2007-12-24
Applicant: 北京启明星辰信息技术股份有限公司
Abstract: 本发明涉及一种恶意注入脚本网页检测方法和系统,属于计算网络技术领域。本发明所述的恶意注入脚本网页检测方法包括使用网页爬虫遍历并下载被扫描网站所有网页的步骤、对下载网页进行聚类分析并提取网页簇模板的步骤以及利用网页簇模板检测簇中各网页是否包含恶意注入脚本的步骤。所述的恶意注入脚本网页检测系统包括网页爬虫模块、动态内容网页过滤模块、动态内容网页聚类模块、网页簇模板提取模块和恶意注入脚本网页检测模块。
-