-
公开(公告)号:CN113990344A
公开(公告)日:2022-01-28
申请号:CN202111004878.9
申请日:2021-08-30
Applicant: 同济大学
Abstract: 本发明涉及一种基于声纹特征的多人语音分离方法、设备及介质,该方法包括:S1:获取目标说话人的声纹特征Xref以及对混合音频采用短时傅里叶变换提取其频谱特征Xmix;S2:通过拼接混合音频的频谱特征Xmix与目标说话人的声纹特征Xref得到参考声纹特征的频谱特征X′mix,并将频谱特征X′mix输入到用于捕获低级别音频特征的扩张卷积层,得到语音分离模型的输入特征Xinput;S3:通过基于语音分离模型获取频谱掩膜,并将其与混合音频的频谱特征Xmix相乘,得到预测出的目标说话人的纯净音频的频谱;通过参考混合音频的相位谱并结合短时傅里叶逆变换,得到预测出的目标说话人在时域上的纯净音频。与现有技术相比,本发明具有语音分离精度高的优点。
-
公开(公告)号:CN112164459A
公开(公告)日:2021-01-01
申请号:CN202010972386.8
申请日:2020-09-16
Applicant: 同济大学
Abstract: 本发明公开了一种抑郁症状的信息评估方法,分析来访者与心理医生的面谈内容,并从面谈音频和文字译本中语音特征与文字嵌入特征进行融合,对来访者对应的抑郁症相关心理量表评分,提高在不限制面谈内容的情况下评估的准确度。本发明能够为心理医生提供客观的抑郁症辅助评估方法以及快速、有效和经济的抑郁症状自我评估。
-