-
公开(公告)号:CN1952850A
公开(公告)日:2007-04-25
申请号:CN200510086646.7
申请日:2005-10-20
Applicant: 中国科学院自动化研究所
IPC: G06F3/00
Abstract: 本发明公开了一种基于动态基元选取的语音驱动人脸动画方法,将输入的任何用户的任何语言的语音转换成语音和三维人脸动画的同步输出。此方法基于采用运动实时捕获系统建立的多模态数据库,对多模态数据进行音视频分析,分别获得相应的特征向量;以音素为基元单位对多模态数据进行同步分割;对用户给定的语音序列,计算每个基元的音频匹配误差和前后基元间的视觉匹配误差,最后在候选的基元中动态地选择一条最佳路径,输出与语音序列同步的人脸动画参数序列,以驱动三维人脸动画模型。本发明的方法,使得系统输出的动画序列保持较好的真实度和自然度,并适用于多用户和多语言的语音驱动。