-
公开(公告)号:CN101316328A
公开(公告)日:2008-12-03
申请号:CN200710099726.5
申请日:2007-05-29
Applicant: 中国科学院计算技术研究所
Abstract: 本发明公开了一种基于时空条带模式分析的新闻主播检测方法,包括:从经过编辑的新闻视频中截取连续的N帧作为一组,并提取水平时空条带和垂直时空条带;提取水平时空条带和垂直时空条带中所对应的图像特征,得到相应的特征向量;通过聚类方法对特征向量分别聚类,并将同一类中时间连续的水平或垂直时空条带分别合并,作为类中的新元素,得到最终的水平聚类结果和垂直聚类结果;将水平聚类结果中包含有最多元素的类和垂直聚类结果中包含有最多元素的类进行融合,根据融合结果检测新闻主播镜头。本发明的优点是对各类新闻视频主播检测准确率高,通用性强,计算复杂度低。避免了现有方法过于依赖准确的镜头分割和其他模态信息的缺点。
-
公开(公告)号:CN101316327A
公开(公告)日:2008-12-03
申请号:CN200710099725.0
申请日:2007-05-29
Applicant: 中国科学院计算技术研究所
IPC: H04N5/262
Abstract: 本发明公开了一种多模态融合的采访镜头检测方法,包括:输入未编辑的原始视频,对视频进行预处理,得到原始视频的视频流和音频流,以及视频流中的镜头、各个镜头的关键帧;根据视频预处理操作所得到的音频流建立人声模型,并依赖所建立的人声模型判断镜头是否为包含人声的镜头;根据视频预处理操作所得到的视频流建立人脸模型,并依赖人脸模型判断镜头是否为包含人脸的镜头;融合人声检测结果和人脸检测结果,如果一个镜头中同时包含人声和人脸信息,则镜头为采访镜头。本发明的优点是通过融合视频和音频信息,建立通用的基于镜头的采访检测模型,并实现了对未经编辑的原始视频的概念检测和标注。
-
公开(公告)号:CN101441717B
公开(公告)日:2010-12-08
申请号:CN200710177875.9
申请日:2007-11-21
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供一种色情视频检测方法,包括:在待检测视频的视频帧中,利用肤色模型和非肤色模型,计算视频帧的各个象素点的肤色概率值与非肤色概率值;根据视频帧中象素点的肤色概率值与非肤色概率值,为视频帧建立模版图像;根据模版图像,从视频帧中提取图像特征;将连续视频帧中的图像特征组成观测序列,将所述观测序列输入到色情镜头模型中以检测待检测视频是否为色情视频。本发明还提供了一种与色情视频检测方法相适应的检测系统。本发明在检测过程中采用了相邻视频帧的时序特性,使得整个视频检测方法的鲁棒性更强,检测准确率更高。
-
公开(公告)号:CN101316327B
公开(公告)日:2010-05-26
申请号:CN200710099725.0
申请日:2007-05-29
Applicant: 中国科学院计算技术研究所
IPC: H04N5/262
Abstract: 本发明公开了一种多模态融合的采访镜头检测方法,包括:输入未编辑的原始视频,对视频进行预处理,得到原始视频的视频流和音频流,以及视频流中的镜头、各个镜头的关键帧;根据视频预处理操作所得到的音频流建立人声模型,并依赖所建立的人声模型判断镜头是否为包含人声的镜头;根据视频预处理操作所得到的视频流建立人脸模型,并依赖人脸模型判断镜头是否为包含人脸的镜头;融合人声检测结果和人脸检测结果,如果一个镜头中同时包含人声和人脸信息,则镜头为采访镜头。本发明的优点是通过融合视频和音频信息,建立通用的基于镜头的采访检测模型,并实现了对未经编辑的原始视频的概念检测和标注。
-
公开(公告)号:CN101441717A
公开(公告)日:2009-05-27
申请号:CN200710177875.9
申请日:2007-11-21
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供一种色情视频检测方法,包括:在待检测视频的视频帧中,利用肤色模型和非肤色模型,计算视频帧的各个像素点的肤色概率值与非肤色概率值;根据视频帧中像素点的肤色概率值与非肤色概率值,为视频帧建立模版图像;根据模版图像,从视频帧中提取图像特征;将连续视频帧中的图像特征组成观测序列,将所述观测序列输入到色情镜头模型中以检测待检测视频是否为色情视频。本发明还提供了一种与色情视频检测方法相适应的检测系统。本发明在检测过程中采用了相邻视频帧的时序特性,使得整个视频检测方法的鲁棒性更强,检测准确率更高。
-
公开(公告)号:CN100559879C
公开(公告)日:2009-11-11
申请号:CN200710099727.X
申请日:2007-05-29
Applicant: 中国科学院计算技术研究所
Abstract: 本发明公开了一种基于故事情节发展模型分析的电影动作场景检测方法,包括:对视频做预处理操作;计算各个镜头的镜头长度;计算镜头的平均运动强度;利用镜头长度和镜头平均运动强度计算电影编辑因子;计算每个音频帧的短时音频能量以及镜头的平均音频能量;计算镜头的平均运动分散度;利用镜头平均音频能量和镜头平均运动分散度,计算人类感知因子;根据电影编辑因子和人类感知因子,建立故事情节发展模型,并按照时间顺序生成故事情节发展流图;根据故事情节发展模型检测电影中的动作场景。本发明的优点在于从电影编辑手法和人类感知两个角度考虑视觉和听觉因素,建立故事情节发展模型,从而模拟情节发展变化,实现了电影中动作场景的准确检测。
-
公开(公告)号:CN100548030C
公开(公告)日:2009-10-07
申请号:CN200710099726.5
申请日:2007-05-29
Applicant: 中国科学院计算技术研究所
Abstract: 本发明公开了一种基于时空条带模式分析的新闻主播检测方法,包括:从经过编辑的新闻视频中截取连续的N帧作为一组,并提取水平时空条带和垂直时空条带;提取水平时空条带和垂直时空条带中所对应的图像特征,得到相应的特征向量;通过聚类方法对特征向量分别聚类,并将同一类中时间连续的水平或垂直时空条带分别合并,作为类中的新元素,得到最终的水平聚类结果和垂直聚类结果;将水平聚类结果中包含有最多元素的类和垂直聚类结果中包含有最多元素的类进行融合,根据融合结果检测新闻主播镜头。本发明的优点是对各类新闻视频主播检测准确率高,通用性强,计算复杂度低。避免了现有方法过于依赖准确的镜头分割和其他模态信息的缺点。
-
公开(公告)号:CN101316362A
公开(公告)日:2008-12-03
申请号:CN200710099727.X
申请日:2007-05-29
Applicant: 中国科学院计算技术研究所
Abstract: 本发明公开了一种基于故事情节发展模型分析的电影动作场景检测方法,包括:对视频做预处理操作;计算各个镜头的镜头长度;计算镜头的平均运动强度;利用镜头长度和镜头平均运动强度计算电影编辑因子;计算每个音频帧的短时音频能量以及镜头的平均音频能量;计算镜头的平均运动分散度;利用镜头平均音频能量和镜头平均运动分散度,计算人类感知因子;根据电影编辑因子和人类感知因子,建立故事情节发展模型,并按照时间顺序生成故事情节发展流图;根据故事情节发展模型检测电影中的动作场景。本发明的优点在于从电影编辑手法和人类感知两个角度考虑视觉和听觉因素,建立故事情节发展模型,从而模拟情节发展变化,实现了电影中动作场景的准确检测。
-
公开(公告)号:CN101453575B
公开(公告)日:2010-07-21
申请号:CN200710178831.8
申请日:2007-12-05
Applicant: 中国科学院计算技术研究所
IPC: H04N5/278
Abstract: 本发明提供一种视频字幕信息提取方法,包括:对需要提取字幕的视频图像进行预处理;对预处理后的视频图像进行多尺度的字幕区域检测,得到代表字幕区域大小与位置的矩形块;利用所述的矩形块,对检测到的字幕区域进行分割;对分割得到的字幕区域增强对比度;采用K均值聚类的方法实现对字幕的提取。本发明对字幕的不同语言类型、字体、尺寸以及视频节目类型都具有通用性;具有字幕区域检测和文字识别准确率高,速度快的优点;在字幕区域检测时不需要进行模型的训练,减少了模型训练不好影响预测结果的可能性。
-
公开(公告)号:CN101453575A
公开(公告)日:2009-06-10
申请号:CN200710178831.8
申请日:2007-12-05
Applicant: 中国科学院计算技术研究所
IPC: H04N5/278
Abstract: 本发明提供一种视频字幕信息提取方法,包括:对需要提取字幕的视频图像进行预处理;对预处理后的视频图像进行多尺度的字幕区域检测,得到代表字幕区域大小与位置的矩形块;利用所述的矩形块,对检测到的字幕区域进行分割;对分割得到的字幕区域增强对比度;采用K均值聚类的方法实现对字幕的提取。本发明对字幕的不同语言类型、字体、尺寸以及视频节目类型都具有通用性;具有字幕区域检测和文字识别准确率高,速度快的优点;在字幕区域检测时不需要进行模型的训练,减少了模型训练不好影响预测结果的可能性。
-
-
-
-
-
-
-
-
-