一种视频字幕信息提取方法

    公开(公告)号:CN101453575B

    公开(公告)日:2010-07-21

    申请号:CN200710178831.8

    申请日:2007-12-05

    Abstract: 本发明提供一种视频字幕信息提取方法,包括:对需要提取字幕的视频图像进行预处理;对预处理后的视频图像进行多尺度的字幕区域检测,得到代表字幕区域大小与位置的矩形块;利用所述的矩形块,对检测到的字幕区域进行分割;对分割得到的字幕区域增强对比度;采用K均值聚类的方法实现对字幕的提取。本发明对字幕的不同语言类型、字体、尺寸以及视频节目类型都具有通用性;具有字幕区域检测和文字识别准确率高,速度快的优点;在字幕区域检测时不需要进行模型的训练,减少了模型训练不好影响预测结果的可能性。

    一种视频字幕信息提取方法

    公开(公告)号:CN101453575A

    公开(公告)日:2009-06-10

    申请号:CN200710178831.8

    申请日:2007-12-05

    Abstract: 本发明提供一种视频字幕信息提取方法,包括:对需要提取字幕的视频图像进行预处理;对预处理后的视频图像进行多尺度的字幕区域检测,得到代表字幕区域大小与位置的矩形块;利用所述的矩形块,对检测到的字幕区域进行分割;对分割得到的字幕区域增强对比度;采用K均值聚类的方法实现对字幕的提取。本发明对字幕的不同语言类型、字体、尺寸以及视频节目类型都具有通用性;具有字幕区域检测和文字识别准确率高,速度快的优点;在字幕区域检测时不需要进行模型的训练,减少了模型训练不好影响预测结果的可能性。

Patent Agency Ranking