-
公开(公告)号:CN102176313B
公开(公告)日:2012-07-25
申请号:CN200910235647.1
申请日:2009-10-10
Applicant: 北京理工大学
IPC: G10L21/06
Abstract: 本发明为一种基于共振峰频率的汉语普通话单韵母语音可视化方法,包括对原始语音信号分帧、加窗,提取每帧信号的短时能量、共振峰频率、基音频率,采用中值平滑方法纠正共振峰频率、基音频率个别数值的错误;利用共振峰频率将不同发音映射为不同色彩方面并修正:在图像上反应发音时间、能量、音调基音频率的变化趋势,利用色彩来区分不同汉语普通话单韵母发音。本发明只提取语音信号的短时能量、共振峰频率、基音频率几个简单的语音声学参数,易于实现;引入软判决,对于每个发音不做硬性判决,而是采用不同色彩表示,不同发音人同一个音的可视化效果求大同而存小异,这使得对于发音的判决更符合人的主观感知。
-
公开(公告)号:CN102044254B
公开(公告)日:2012-11-07
申请号:CN200910235643.3
申请日:2009-10-10
Applicant: 北京理工大学
IPC: G10L21/06
Abstract: 本发明为一种用于语音可视化的语谱图彩色增强方法,包括对原始语音信号分帧、加窗,提取每帧信号在各个特征频带内的短时能量值;将语音信号的有效频带平均分为N个特征频带,分别计算每帧语音信号在N个特征频带内的能量值;以各个特征频带内的能量值为参数对相应特征频带预先设定的色彩饱和度进行修正;对N个频带内的能量值进行归一化处理;利用归一化后的能量值对N特征频带既定色彩的饱和度进行修正;将语音信号N个特征频带的修正后的色相、饱和度、亮度利用色彩学转换公式转化为RGB三原色值;绘制直方图。本发明语音信号色彩生成模块,通过不同色彩反映语音信号频谱的能量集中区域,易于辨识;动态反映出发音的帧间变化,符合发音规律。
-
公开(公告)号:CN102176313A
公开(公告)日:2011-09-07
申请号:CN200910235647.1
申请日:2009-10-10
Applicant: 北京理工大学
IPC: G10L21/06
Abstract: 本发明为一种基于共振峰频率的汉语普通话单韵母语音可视化方法,包括对原始语音信号分帧、加窗,提取每帧信号的短时能量、共振峰频率、基音频率,采用中值平滑方法纠正共振峰频率、基音频率个别数值的错误;利用共振峰频率将不同发音映射为不同色彩方面并修正:在图像上反应发音时间、能量、音调基音频率的变化趋势,利用色彩来区分不同汉语普通话单韵母发音。本发明只提取语音信号的短时能量、共振峰频率、基音频率几个简单的语音声学参数,易于实现;引入软判决,对于每个发音不做硬性判决,而是采用不同色彩表示,不同发音人同一个音的可视化效果求大同而存小异,这使得对于发音的判决更符合人的主观感知。
-
公开(公告)号:CN102044254A
公开(公告)日:2011-05-04
申请号:CN200910235643.3
申请日:2009-10-10
Applicant: 北京理工大学
IPC: G10L21/06
Abstract: 本发明为一种用于语音可视化的语谱图彩色增强方法,包括对原始语音信号分帧、加窗,提取每帧信号在各个特征频带内的短时能量值;将语音信号的有效频带平均分为N个特征频带,分别计算每帧语音信号在N个特征频带内的能量值;以各个特征频带内的能量值为参数对相应特征频带预先设定的色彩饱和度进行修正;对N个频带内的能量值进行归一化处理;利用归一化后的能量值对N特征频带既定色彩的饱和度进行修正;将语音信号N个特征频带的修正后的色相、饱和度、亮度利用色彩学转换公式转化为RGB三原色值;绘制直方图。本发明语音信号色彩生成模块,通过不同色彩反映语音信号频谱的能量集中区域,易于辨识;动态反映出发音的帧间变化,符合发音规律。
-
-
-