发明授权
CN101101752B 基于视觉特征的单音节语言唇读识别系统
失效 - 权利终止
- 专利标题: 基于视觉特征的单音节语言唇读识别系统
- 专利标题(英): Monosyllabic language lip-reading recognition system based on vision character
-
申请号: CN200710052795.0申请日: 2007-07-19
-
公开(公告)号: CN101101752B公开(公告)日: 2010-12-01
- 发明人: 王天江 , 刘芳 , 周慧华 , 龚立宇 , 陈刚
- 申请人: 华中科技大学
- 申请人地址: 湖北省武汉市洪山区珞喻路1037号
- 专利权人: 华中科技大学
- 当前专利权人: 华中科技大学
- 当前专利权人地址: 湖北省武汉市洪山区珞喻路1037号
- 代理机构: 华中科技大学专利中心
- 代理商 方放
- 主分类号: G10L15/24
- IPC分类号: G10L15/24 ; G06K9/00
摘要:
基于视觉特征的单音节语言唇读识别系统,属于计算机智能识别技术,根据视频中人物说话时的唇动变化,识别说话内容,目的在于仅利用视频信息,解决如汉语等单音节语言的唇读识别问题。本发明包括视频解码模块、唇部定位模块、唇动分割模块、特征提取模块、语料库、模型建立模块和唇语识别模块;本发明所采用的语料库内容丰富,易于扩充,本发明只需处理视频图像,不需要音频数据进行辅助识别,能够对avi、wmv、rmvb、mpg等视频文件进行处理,满足无声条件下说话内容识别的要求。本发明的唇动分割部分以单音节为识别目标进行机器智能分割,与定长时间分割和手工分割相比,实用性更强,识别准确率得到极大提高。
公开/授权文献
- CN101101752A 基于视觉特征的单音节语言唇读识别系统 公开/授权日:2008-01-09