-
公开(公告)号:CN101470731B
公开(公告)日:2012-06-20
申请号:CN200710304224.1
申请日:2007-12-26
Applicant: 中国科学院自动化研究所
IPC: G06F17/30
Abstract: 本发明一种可个性化定制的网页过滤方法,包括步骤:用户实例网页和训练网页库特征提取;基于半监督学习的用户兴趣类属性挖掘;用户兴趣类的特征提取和特征选择;基于贝叶斯分类器的个性化网页过滤。本发明提出了一种新型的实例驱动的网页过滤框架,用户的过滤需求通过网页实例来表达,用户实例可以是任何类型或者多类型复合的网页,并借助半监督学习构造出符合用户个性化需求的网页过滤器,克服了传统网页过滤方法仅限于过滤单一或有限类型网页,难以实现个性化定制的缺点。本发明并具有高精确度、鲁棒性和运行速度的优点,具有很好的应用前景。
-
公开(公告)号:CN101872346A
公开(公告)日:2010-10-27
申请号:CN200910082086.6
申请日:2009-04-22
Applicant: 中国科学院自动化研究所
Abstract: 本发明公开了一种自动生成视频导航系统的方法,包括:使用双阈值的镜头切割算法将视频切割成多个镜头;使用主导集聚类算法提取镜头的关键帧;使用主导集聚类算法将镜头聚类成镜头组;然后将镜头组构造成场景。本发明大大提高了视频的结构化程度,制作了视频的层次目录,极大方便了用户对视频内容的获取和浏览。本发明可以方便的制作DVD的目录,为视频检索技术提供支持。在视频已经融入人们生活的今天,具有极大的实用价值和应用前景。
-
公开(公告)号:CN101763502A
公开(公告)日:2010-06-30
申请号:CN200810240942.1
申请日:2008-12-24
Applicant: 中国科学院自动化研究所
Abstract: 本发明公开一种高效的敏感图像的检测方法及其系统,包括:收集敏感图像样本和正常图像样本建立训练集并提取兴趣点,结合肤色模型对兴趣点进行过滤,去掉或保留与肤色无关或相关的兴趣点,提取兴趣点处的局部不变量特征并进行聚类,建立数据驱动的树形金字塔模型,在此基础上针对每一幅图像提取多分辨率直方图特征;采用金字塔匹配算法计算任意两幅图像的相似度,并生成核函数矩阵;利用得到的核函数矩阵对支持向量机分类器进行训练,得到分类器参数,并对新图像样本进行检测,判定其是否为敏感图像。本发明可以高效的对互联网上的敏感图像进行检测并过滤,使广大青少年在享受互联网所带来的便利同时免受不良信息的毒害。
-
公开(公告)号:CN101751424A
公开(公告)日:2010-06-23
申请号:CN200810239328.3
申请日:2008-12-10
Applicant: 中国科学院自动化研究所
Abstract: 本发明涉及计算机网络技术领域,一种在线讨论区话题检测与跟踪方法,包括步骤:采用HTML解析模块对讨论区帖子进行预处理及线索重构;利用帖子和线索的信息度测量模块对新输入的帖子和相关线索进行信息度检查,并对线索特征向量进行更新;对线索数据库中的线索的内容文本进行分析;对线索数据库中的线索的用户行为进行分析;将线索的内容文本和用户行为的分析结果进行融合,判断线索的话题分类。本发明鉴于在线讨论区的复杂性,本发明通过结合内容和用户行为的方法较好的解决了在线讨论区话题检测与跟踪问题,具有很好的应用前景。
-
公开(公告)号:CN101470731A
公开(公告)日:2009-07-01
申请号:CN200710304224.1
申请日:2007-12-26
Applicant: 中国科学院自动化研究所
IPC: G06F17/30
Abstract: 本发明一种可个性化定制的网页过滤方法,包括步骤:用户实例网页和训练网页库特征提取;基于半监督学习的用户兴趣类属性挖掘;用户兴趣类的特征提取和特征选择;基于贝叶斯分类器的个性化网页过滤。本发明提出了一种新型的实例驱动的网页过滤框架,用户的过滤需求通过网页实例来表达,用户实例可以是任何类型或者多类型复合的网页,并借助半监督学习构造出符合用户个性化需求的网页过滤器,克服了传统网页过滤方法仅限于过滤单一或有限类型网页,难以实现个性化定制的缺点。本发明并具有高精确度、鲁棒性和运行速度的优点,具有很好的应用前景。
-
公开(公告)号:CN101872346B
公开(公告)日:2012-07-04
申请号:CN200910082086.6
申请日:2009-04-22
Applicant: 中国科学院自动化研究所
Abstract: 本发明公开了一种自动生成视频导航系统的方法,包括:使用双阈值的镜头切割算法将视频切割成多个镜头;使用主导集聚类算法提取镜头的关键帧;使用主导集聚类算法将镜头聚类成镜头组;然后将镜头组构造成场景。本发明大大提高了视频的结构化程度,制作了视频的层次目录,极大方便了用户对视频内容的获取和浏览。本发明可以方便的制作DVD的目录,为视频检索技术提供支持。在视频已经融入人们生活的今天,具有极大的实用价值和应用前景。
-
公开(公告)号:CN100565523C
公开(公告)日:2009-12-02
申请号:CN200710065181.6
申请日:2007-04-05
Applicant: 中国科学院自动化研究所
Abstract: 本发明公开基于多分类器融合的敏感网页过滤系统及方法,处理对象是一幅网页,其处理结果是该网页是否包含敏感内容,此处的敏感可以定义为色情,反动,暴力等危害社会的不健康互联网内容。系统包括数据流的获取与预处理单元、图像与文本流过滤单元、图像过滤器与文本过滤器的信息融合单元,系统基于多个分类器的协作,在给定网页的统一资源定位器的条件下,获取该网页的源代码,在预处理阶段进行文本和图像的分流,获取文本信息和有效图像信息;利用决策树算法将输入网页分为三种样式;利用连续文本分类器、离散敏感文本分类器和图像分类器对网页进行识别,根据各分类器识别的输出结果进行融合计算,给出判别因子,将最终结果返回给浏览器。
-
公开(公告)号:CN101281521A
公开(公告)日:2008-10-08
申请号:CN200710065181.6
申请日:2007-04-05
Applicant: 中国科学院自动化研究所
Abstract: 本发明公开基于多分类器融合的敏感网页过滤系统及方法,处理对象是一幅网页,其处理结果是该网页是否包含敏感内容,此处的敏感可以定义为色情,反动,暴力等危害社会的不健康互联网内容。系统包括数据流的获取与预处理单元、图像与文本流过滤单元、图像过滤器与文本过滤器的信息融合单元,系统基于多个分类器的协作,在给定网页的统一资源定位器的条件下,获取该网页的源代码,在预处理阶段进行文本和图像的分流,获取文本信息和有效图像信息;利用决策树算法将输入网页分为三种样式;利用连续文本分类器、离散敏感文本分类器和图像分类器对网页进行识别,根据各分类器识别的输出结果进行融合计算,给出判别因子,将最终结果返回给浏览器。
-
公开(公告)号:CN101055621A
公开(公告)日:2007-10-17
申请号:CN200610073172.7
申请日:2006-04-10
Applicant: 中国科学院自动化研究所
Abstract: 本发明公开一种基于内容的敏感网页识别方法,包括步骤:在给定网页的统一资源定位器的条件下,获取该网页的源码,数据分流和预处理,获取文本信息和有效图像信息;利用连续敏感文本分类器对文本信息处理,如果分类器输出结果为敏感,则处理完毕。否则利用离散敏感文本分类器对文本信息处理,如果分类器输出结果大于事先给定阈值,识别结果为敏感,则处理完毕。否则利用图像分类器对图像识别,识别结果与离散分类器输出结果融合。本发明采用连续敏感文本识别器、离散文本识别器和敏感图像识别器三者结合的方案解决现有技术的问题,本发明利用web结构信息及构造了一个图像集合识别问题来进行信息融合,提高对敏感网页的识别率。
-
公开(公告)号:CN101763502B
公开(公告)日:2012-07-25
申请号:CN200810240942.1
申请日:2008-12-24
Applicant: 中国科学院自动化研究所
Abstract: 本发明公开一种高效的敏感图像的检测方法及其系统,包括:收集敏感图像样本和正常图像样本建立训练集并提取兴趣点,结合肤色模型对兴趣点进行过滤,去掉或保留与肤色无关或相关的兴趣点,提取兴趣点处的局部不变量特征并进行聚类,建立数据驱动的树形金字塔模型,在此基础上针对每一幅图像提取多分辨率直方图特征;采用金字塔匹配算法计算任意两幅图像的相似度,并生成核函数矩阵;利用得到的核函数矩阵对支持向量机分类器进行训练,得到分类器参数,并对新图像样本进行检测,判定其是否为敏感图像。本发明可以高效的对互联网上的敏感图像进行检测并过滤,使广大青少年在享受互联网所带来的便利同时免受不良信息的毒害。
-
-
-
-
-
-
-
-
-