注意力自适应音频时域调整方法

    公开(公告)号:CN105741852A

    公开(公告)日:2016-07-06

    申请号:CN201410757585.1

    申请日:2014-12-11

    IPC分类号: G10L21/043

    摘要: 本发明公开了一种注意力自适应音频时域调整方法,其中,包括如下步骤:步骤a:实时视频中用户头部三维运动参数计算,包括初始化和运动参数计算;步骤b:初始化过程,检测正面人脸,选择具有最大面积的人脸作为初始化对象;步骤c:运动参数计算中,使用图像注册方法计算头部三维运动参数,包括俯仰角pitch、偏航角yaw和横滚角roll,标记为τ(pitch,yaw,roll);步骤d:参数τ通过函数F1(τ)转换成注意力表征参数α;步骤e:参数α通过函数F2(α)转换成音频信号时域控制参数β;步骤f:依据音频信号时域控制参数β调整音频信号播放速度。本发明的有益效果是:提供更合理更人性化的语音信息获取方法,具有良好的人机交互合理性和人性化设计特征。

    一种音频频域连续性图谱计算方法

    公开(公告)号:CN105139863A

    公开(公告)日:2015-12-09

    申请号:CN201510362518.4

    申请日:2015-06-26

    IPC分类号: G10L25/18

    摘要: 本发明公开了一种音频频域连续性图谱计算方法,其中,包括如下步骤:步骤a、将一时长为T′的音频文件分割为时长为T的片段,所有音频片段标记为Ai,i=1,…,k,k为片段总数;步骤b、对每个Ai以窗长2L进行傅里叶变换计算,提取前半部分长度为L的傅里叶变换因子,所有音频片段的长度为L的傅里叶变换因子标记为Fi,j,i=1,...,k,j=1,...,L;步骤c、计算Fi,j的行平均向量,标记为mF;步骤d、计算Fi,j中的所有行向量Fi,:与向量mF的向量相关性,得到所有的相关系数标记为Ci,i=1,...,k;步骤e、在二维图谱中绘制Ci。本发明的有益效果是:提出一种音频频域连续性分析的计算方法,以及呈现音频频率域连续性的图谱表征方法。

    基于相似环境录音频谱统计计算的录音设备识别方法

    公开(公告)号:CN105741834A

    公开(公告)日:2016-07-06

    申请号:CN201410753671.5

    申请日:2014-12-10

    IPC分类号: G10L15/06 G10L15/02

    摘要: 本发明公开了一种基于相似环境录音频谱统计计算的录音设备识别方法,其中,包括如下步骤:步骤a:选择常见的同类录音设备,比如录音笔等,构建同类录音设备库,录音设备数量为n;步骤b:了解待检录音声称的录制设备、录音环境和录制参数,把待检录音声称的录制设备加入录音设备库中;步骤c:使用录音设备库中的录音设备在相似的录制环境和录制参数条件下录制实验录音,录音时长大于等于t;步骤d:对待检录音和步骤c中录制的实验录音进行频谱统计特征计算;步骤e:使用支持向量机方法对步骤d中计算的实验录音频谱统计特征进行针对录音设备库中设备分类的分类器训练;步骤f:使用步骤e计算的分类器对步骤d中计算的待检录音频谱统计特征进行分类;步骤g:对步骤f的分类结果进行统计计算,根据分类结果判别准则识别和验证待检录音的录制设备。本发明的有益效果是:从相似环境录音信号的频谱统计计算角度出发,结合同类录音设备库构建,解决录音设备识别问题,提供更准确和更科学的司法取证和鉴定应用技术方法。