专利检索 ap:("华中科技大学") AND inv:"周慧华" 第 1 页

1.

发明公开
基于视觉特征的单音节语言唇读识别系统失效

公开(公告)号：CN101101752A

公开(公告)日：2008-01-09

申请号：CN200710052795.0

申请日：2007-07-19

申请人： 华中科技大学

发明人： 王天江 , 刘芳 , 周慧华 , 龚立宇 , 陈刚

IPC分类号： G10L15/24 , G06K9/00

摘要： 基于视觉特征的单音节语言唇读识别系统，属于计算机智能识别技术，根据视频中人物说话时的唇动变化，识别说话内容，目的在于仅利用视频信息，解决如汉语等单音节语言的唇读识别问题。本发明包括视频解码模块、唇部定位模块、唇动分割模块、特征提取模块、语料库、模型建立模块和唇语识别模块；本发明所采用的语料库内容丰富，易于扩充，本发明只需处理视频图像，不需要音频数据进行辅助识别，能够对avi、wmv、rmvb、mpg等视频文件进行处理，满足无声条件下说话内容识别的要求。本发明的唇动分割部分以单音节为识别目标进行机器智能分割，与定长时间分割和手工分割相比，实用性更强，识别准确率得到极大提高。

2.

发明授权
基于视觉特征的单音节语言唇读识别系统失效

公开(公告)号：CN101101752B

公开(公告)日：2010-12-01

申请号：CN200710052795.0

申请日：2007-07-19

申请人： 华中科技大学

发明人： 王天江 , 刘芳 , 周慧华 , 龚立宇 , 陈刚

IPC分类号： G10L15/24 , G06K9/00

摘要： 基于视觉特征的单音节语言唇读识别系统，属于计算机智能识别技术，根据视频中人物说话时的唇动变化，识别说话内容，目的在于仅利用视频信息，解决如汉语等单音节语言的唇读识别问题。本发明包括视频解码模块、唇部定位模块、唇动分割模块、特征提取模块、语料库、模型建立模块和唇语识别模块；本发明所采用的语料库内容丰富，易于扩充，本发明只需处理视频图像，不需要音频数据进行辅助识别，能够对avi、wmv、rmvb、mpg等视频文件进行处理，满足无声条件下说话内容识别的要求。本发明的唇动分割部分以单音节为识别目标进行机器智能分割，与定长时间分割和手工分割相比，实用性更强，识别准确率得到极大提高。