-
公开(公告)号:CN109858412A
公开(公告)日:2019-06-07
申请号:CN201910049839.7
申请日:2019-01-18
Applicant: 东北大学
Abstract: 本发明提供一种基于混合卷积神经网络的唇语识别方法。本发明方法,包括如下步骤:对采集到的待识别视频进行预处理,获取每帧待识别视频的唇部图像序列;将预处理后的唇部图像序列作为输入,馈送入构建的混合卷积神经网络进行短期时空特征和长期时空特征提取;将所述长期时空特征输入连接时序分类器获得识别概率结果,对所述识别概率结果进行解码处理,获得唇语识别结果。本发明通过混合卷积神经网络同时学习唇部运动的空间和时间特征,同时通过两层Bi-GRU网络将短期时空特征和长期时空特征结合起来,并使用连接时序分类训练网络,提高了唇语识别的速度与精确度。