一种利用标志检测进行电视节目内部自动分割的方法

    公开(公告)号:CN102098449B

    公开(公告)日:2016-08-03

    申请号:CN201010574074.8

    申请日:2010-12-06

    Inventor: 董远 肖国锐

    Abstract: 本发明涉及视频处理和模式识别技术领域,提出了一种利用标志检测进行电视节目内部自动分割的方法。目前,电视节目的内部分割具有迫切需求;节目标志的时间不连续性使得节目具有良好的结构性。本发明所述方法主要包括以下步骤:(1)对节目视频分割镜头,每个镜头提取关键帧及节目标志所在区域的子图;(2)提取子图的特征向量,使用针对节目标志的SVM分类器进行分类;(3)统计标志分类结果,标定每个镜头的标志属性;(4)在相邻镜头的标志属性切变点分割视频。本发明在标志检测过程中,只对关键帧做处理,从而提高了方法的效率;另外,本发明主要应用对象是节目标志具有不连续性的电视节目,对节目内容类型无要求,增强了方法应用的普适性。

    一种用于人脸识别的局部特征提取方法

    公开(公告)号:CN101976339B

    公开(公告)日:2015-07-15

    申请号:CN201010541111.5

    申请日:2010-11-12

    Inventor: 董远 魏喆

    Abstract: 本发明属于模式识别技术领域,具体涉及一种用于人脸识别的特征提取方法。该特征主要用于人脸识别。利用该方法提取的特征的不仅可以大大减少用于人脸识别的特征维数,还能保证一定的识别性能。采用的技术方案:在配备有数字图像处理软件的计算机程序辅助下,先定位人脸局部器官的位置,在局部器官附近对各个像素点按照提取灰度值,再对灰度值进行量化,编码形成最终的特征。该特征容易提取,能够较好对抗光照变化,提高了人脸识别率。

    基于主场景镜头关键帧的体育视频分类方法

    公开(公告)号:CN101604325B

    公开(公告)日:2012-06-20

    申请号:CN200910089358.5

    申请日:2009-07-17

    Inventor: 董远 黄煜斌

    Abstract: 本发明提出一个基于主场景镜头关键帧的体育视频分类方法。该方法只采用主场景进行体育分类,而不是整个视频的帧来代表体育视频来做分类,有效的降低了视频分类的计算量。首先对视频按照镜头自动分割成多个片段,所有片段的关键帧经过基于图理论的自适应阈值聚类后,聚成了包括远景、中景、特写镜头等多个大类,中景镜头类被选取当作该体育视频的主场景镜头,这个过程不用依赖于任何先验信息,就能自动的有效的提取体育视频的主场景信息-中景镜头,剔除体育视频中多种干扰(如裁判员,观众特写,一些转播效果以及广告等镜头),最后用SVM分类器对主场景镜头关键帧进行分类,具有很高的体育视频分类准确性。

    四层结构的体育视频中足球项目检测系统及实现

    公开(公告)号:CN102073864A

    公开(公告)日:2011-05-25

    申请号:CN201010567763.6

    申请日:2010-12-01

    Inventor: 董远 张纪伟

    Abstract: 本发明提出了四层结构的体育视频中足球项目检测系统及实现。该系统首先采用镜头边界检测对整个视频进行分析,将相同切换方式和运动特征的相邻片段归为一类称为视频夹,同时统计视频片段的持续时间,映射到码本上做成直方图,与已有模板进行比对实现第一层分类。第二阶段对片段提取关键帧,然后提取局部和全局特征,使用多码本的方式进行特征映射,使用SVM进行主场景的分类,得到相应的基于关键帧的图片打分;第三阶段将关键帧代表的片段映射到相应的视频夹中进行加权,得到相应的分类结果;最后与第一次分类的结果进行后融合得到最终结果。本发明具有较高的识别精度和速度,可以有效的进行体育类型的识别,适用于体育节目机器标注、广告推荐等。

    一种自动检测音频模板并对视频分章的方法

    公开(公告)号:CN102024033A

    公开(公告)日:2011-04-20

    申请号:CN201010567970.1

    申请日:2010-12-01

    Inventor: 董远 王乐滋

    Abstract: 一种自动检测音频模板并对视频分章的方法。它利用每周的节目音频数据,采用声纹特征快速学习出内容上重复出现的片段,再将片段融合、归类作为候选模板,统计片段长度、出现次数、时间分布信息来标定模板类型以及筛选模板文件,并利用模板对新节目自动分章。本发明基于音频的检索并动态地建立模板库,克服了基于视频的方法的计算量大,检测速度慢,节目片段具有相同的音频内容时图像内容不同的缺点,同时也解决了数据库中“静态”模板为的问题。

    视频高层特征检索系统及其实现

    公开(公告)号:CN101650728A

    公开(公告)日:2010-02-17

    申请号:CN200910091511.8

    申请日:2009-08-26

    Inventor: 董远 刘继晴

    Abstract: 本发明提出了一个基于颜色、边缘、纹理、特征点等多种底层特征和支持向量机(SVM)的视频高层特征检索系统。首先对视频片段进行镜头边界检测,然后等间隔抽取镜头中有代表性的几帧作为关键帧。对于抽取出的关键帧,我们提取了基于颜色、边缘、纹理、以及特征点的多种鲁棒性底层特征。多类底层特征的采用为视频的高层语义特征提供了多方面的描述,由于它们具有很强的互补性,对于不同的语义概念能够分别显示出很强的区分力,这就使得系统对于各中不同概念的检测性能都能得到有效的保证。然后所提取特征被分别送到支持向量机(SVM)中进行分类,形成多支子系统。在概念分类阶段我们选择了支持向量机(SVM)作为分类器,并且首次使用了基于稠密最近邻(Condensed Nearest Neighbor)的方法选取训练参数,有效解决了训练过程中普遍存在的正负样本不均衡问题。为了充分利用多个子系统提供的描述信息,对于多支系统的分类得分,我们采用了两级融合策略,并引入了逻辑回归(Logistic Regression)的方法来学习到最佳的融合策略,使得融合系统的准确率与召回率大大提高。

    一种自动检测音频模板并对视频分章的方法

    公开(公告)号:CN102024033B

    公开(公告)日:2016-01-20

    申请号:CN201010567970.1

    申请日:2010-12-01

    Inventor: 董远 王乐滋

    Abstract: 一种自动检测音频模板并对视频分章的方法。它利用每周的节目音频数据,采用声纹特征快速学习出内容上重复出现的片段,再将片段融合、归类作为候选模板,统计片段长度、出现次数、时间分布信息来标定模板类型以及筛选模板文件,并利用模板对新节目自动分章。本发明基于音频的检索并动态地建立模板库,克服了基于视频的方法的计算量大,检测速度慢,节目片段具有相同的音频内容时图像内容不同的缺点,同时也解决了数据库中“静态”模板为的问题。

    一种电视节目内部自动生成主要人物摘要的方法

    公开(公告)号:CN102799637A

    公开(公告)日:2012-11-28

    申请号:CN201210215951.1

    申请日:2012-06-27

    Inventor: 董远 秦钢

    Abstract: 本发明提出一种电视节目内部自动生成主要人物摘要的方法。该法结合视频中图像特征和无监督聚类方法,实现对节目视频主要人物的提取、采访者和受访者的标记,并生成主要人物摘要预览,提升用户体验感。首先基于有标志的视频段落,均匀时间间隔提取关键帧并做人脸检测、特征提取,基于特征对人脸图像进行线性聚类,利用人脸图像的时间信息和空间信息得到粗略的人物类别,再通过基于图论的聚类得到精细的聚类结果,使用自适应的方法过滤出单独段落的主要人物类别,最后综合所有段落过滤结果,二次应用基于图论的聚类,基于规则判断出采访者与受访者,标记并生成各段落主要人物摘要。本发明基于无监督聚类方法,结构简单、易于实现,具有较强的普适性和鲁棒性。

    一种利用标志检测进行电视节目内部自动分割的方法

    公开(公告)号:CN102098449A

    公开(公告)日:2011-06-15

    申请号:CN201010574074.8

    申请日:2010-12-06

    Inventor: 董远 肖国锐

    Abstract: 本发明涉及图像处理和模式识别技术领域,提出了一种利用标志检测进行电视节目内部自动分割的方法。目前,电视节目的内部分割具有迫切需求;节目中标志的时间不连续性使得节目具有良好的结构性。本发明所述方法主要包括以下步骤:(1)对节目视频分割镜头,在每个镜头关键帧上提取标志所在区域的子图;(2)提取子图的特征向量,利用针对此标志检测的SVM分类器进行分类;(3)统计分类结果,标定每个镜头的标志属性;(4)在相邻镜头的标志属性切变点分割视频。本发明在标志检测过程中,只对关键帧做处理,从而提高了方法的效率;另外,本发明的应用对象是节目中标志具有不连续性的电视节目,对节目内容类型无要求,增强了方法应用的普适性。

    四层结构的中文文本正则化体系及实现

    公开(公告)号:CN101661462A

    公开(公告)日:2010-03-03

    申请号:CN200910089359.X

    申请日:2009-07-17

    Inventor: 董远 周涛

    Abstract: 本发明提出了一种全新的适用于中文文本的正则化方法。该方法采用机器学习与规则相结合的方法,大大提高了中文文本正则化的准确率。首先对指定语料库中非标准词进行分析。归纳非标准词的种类,并利用有限自动机的方法构建词典,以用来识别真实文本中的非标准词。然后选取其中占绝大多数的几个类别,选取特征,建立模板,利用条件随机场算法建模,其余部分利用适当规则进行处理,并且给予其子分类,进一步提高非标准词识别的准确率,消去其歧义。同时针对上面识别时遇到的错误,利用错误驱动的规则学习方法,选取最优规则,进一步提高其准确率。最后通过标准读音生成模块产生非标准词的正确读音。基于上述的方法,本发明构思了一种四层结构的中文文本正则化体系。这种四层体系可以大大提高中文文本正则化的准确性和高效性。

Patent Agency Ranking