-
公开(公告)号:CN101453575B
公开(公告)日:2010-07-21
申请号:CN200710178831.8
申请日:2007-12-05
Applicant: 中国科学院计算技术研究所
IPC: H04N5/278
Abstract: 本发明提供一种视频字幕信息提取方法,包括:对需要提取字幕的视频图像进行预处理;对预处理后的视频图像进行多尺度的字幕区域检测,得到代表字幕区域大小与位置的矩形块;利用所述的矩形块,对检测到的字幕区域进行分割;对分割得到的字幕区域增强对比度;采用K均值聚类的方法实现对字幕的提取。本发明对字幕的不同语言类型、字体、尺寸以及视频节目类型都具有通用性;具有字幕区域检测和文字识别准确率高,速度快的优点;在字幕区域检测时不需要进行模型的训练,减少了模型训练不好影响预测结果的可能性。
-
公开(公告)号:CN101453575A
公开(公告)日:2009-06-10
申请号:CN200710178831.8
申请日:2007-12-05
Applicant: 中国科学院计算技术研究所
IPC: H04N5/278
Abstract: 本发明提供一种视频字幕信息提取方法,包括:对需要提取字幕的视频图像进行预处理;对预处理后的视频图像进行多尺度的字幕区域检测,得到代表字幕区域大小与位置的矩形块;利用所述的矩形块,对检测到的字幕区域进行分割;对分割得到的字幕区域增强对比度;采用K均值聚类的方法实现对字幕的提取。本发明对字幕的不同语言类型、字体、尺寸以及视频节目类型都具有通用性;具有字幕区域检测和文字识别准确率高,速度快的优点;在字幕区域检测时不需要进行模型的训练,减少了模型训练不好影响预测结果的可能性。
-