-
公开(公告)号:CN117979218A
公开(公告)日:2024-05-03
申请号:CN202410092438.0
申请日:2024-01-23
Applicant: 中国科学院声学研究所
IPC: H04R29/00 , G10L19/093 , G10L25/51
Abstract: 本发明公开了一种基于听觉感知特性的头相关传输函数客观评价方法及系统,该方法包括:对输入目标和参考的头相关冲激响应分别进行去除双耳时间差及中耳滤波处理,获得相应的头相关传输函数;对目标和参考的头相关传输函数分别进行内耳感知分析,获得相应的伽玛通特征;利用固定的听觉感知阈值对目标伽玛通特征和参考伽玛通特征之间的误差进行调整,得到调整后的目标伽玛通特征;利用调整后的目标伽玛通特征和参考伽玛通特征计算各频段下的平均误差和对应的包络相似度;对平均误差和包络相似度进行加权求和;利用人耳在不同水平方向下的感知特点对求和值进行调整,并建模得到感知评分,从而实现了基于听觉感知特性的头相关传输函数客观评价。
-
公开(公告)号:CN118885872B
公开(公告)日:2025-04-25
申请号:CN202410911218.6
申请日:2024-07-09
Applicant: 中国科学院声学研究所
IPC: G06F18/241 , A61B5/372 , A61B5/38 , G06F18/214 , G06F18/213 , G06F18/10 , G06N3/0464 , G06N3/084
Abstract: 本发明涉及脑机接口技术领域,公开了一种听觉方位注意解码方法及装置,方法包括:采集听者的脑电信号,得到一段脑电信号;预处理所述一段脑电信号,得到预处理后的脑电信号;对预处理后的脑电信号进行时频变换,得到脑电信号的时频能量谱;对得到的时频能量谱进行分帧处理,得到决策窗集合;把决策窗集合依次输入训练好的听觉方位注意解码模型,得到脑电信号的空间方位注意的分类概率;听觉方位注意解码模型包括:特征提取器、平均池化层、由全连接网络和Softmax激活函数构成的分类器。因为将脑电信号的时频能量谱作为输入,使解码模型更容易捕捉对听觉方位注意较为重要的脑电能量分布线索,所以有利于提高跨试次脑电数据解码的准确率。
-
公开(公告)号:CN117372624A
公开(公告)日:2024-01-09
申请号:CN202311520131.8
申请日:2023-11-15
Applicant: 中国科学院声学研究所
IPC: G06T17/00 , G06F30/27 , G06F119/02
Abstract: 本发明提供了一种个性化头相关传输函数预测方法及系统,该方法包括:通过鼻尖和双耳耳屏特征点位的坐标对包含被试者肩部、头部和耳部的三维扫描数据进行姿态标定;将三维扫描数据输入生理特征提取模型,得到生理结构特征;将生理结构特征输入垂面HRTF共享特征生成模型,生成垂面HRTF共享特征;将垂面HRTF共享特征输入HRTF预测模型,预测各垂面目标HRTF幅度谱。本发明的优势在于:通过深度学习的方法从包含被试肩部、头部和耳部的三维扫描数据中提取生理特征,最终建立生理结构与全空间目标HRTF幅度谱之间的映射关系,使得给定包含被试肩部、头部和耳部的三维扫描数据,实现对全空间个性化HRTF幅度谱的预测。
-
公开(公告)号:CN109637550B
公开(公告)日:2020-11-24
申请号:CN201811613487.5
申请日:2018-12-27
Applicant: 中国科学院声学研究所
Abstract: 本申请提供了一种声源高度角控制方法和系统,其中所述方法包括:计算HRTF数据库中每个频点的幅度值随高度角变化的相关系数;通过对相关系数计算,得到至少一个中心频率;通过计算至少一个中心频率,得到至少一个滤波器组,然后将至少一个滤波器组与不同高度角的HRTF进行卷积,并进行建模,得到子带能量模型;将给定高度角的声源输入所述子带能量模型,计算出目标高度角信号与给定高度角信号的子带能量比,然后通过调节给定高度角的声源的子带能量,使声源感知角度为目标高度角。本发明通过将声源频带的划分更加符合HRTF频谱随高度角变化的特性,使得与高度角相关性大的频段具有更高的频率分辨率,实现更好的声源高度角控制效果。
-
公开(公告)号:CN109637550A
公开(公告)日:2019-04-16
申请号:CN201811613487.5
申请日:2018-12-27
Applicant: 中国科学院声学研究所
Abstract: 本申请提供了一种声源高度角控制方法和系统,其中所述方法包括:计算HRTF数据库中每个频点的幅度值随高度角变化的相关系数;通过对相关系数计算,得到至少一个中心频率;通过计算至少一个中心频率,得到至少一个滤波器组,然后将至少一个滤波器组与不同高度角的HRTF进行卷积,并进行建模,得到子带能量模型;将给定高度角的声源输入所述子带能量模型,计算出目标高度角信号与给定高度角信号的子带能量比,然后通过调节给定高度角的声源的子带能量,使声源感知角度为目标高度角。本发明通过将声源频带的划分更加符合HRTF频谱随高度角变化的特性,使得与高度角相关性大的频段具有更高的频率分辨率,实现更好的声源高度角控制效果。
-
公开(公告)号:CN119964593A
公开(公告)日:2025-05-09
申请号:CN202510145356.2
申请日:2025-02-10
Applicant: 中国科学院声学研究所
IPC: G10L21/0272 , G10L21/028 , G10L25/27
Abstract: 本申请提供了一种基于子带包络特征的语音分离后滤波方法及系统,该方法包括:设计m倍频程带通滤波器组,对分离后的估计声源信号和原始混合信号进行子带分解,获取其频带划分表示;对估计声源信号和原始混合信号的各子带,执行希尔伯特变换,构建解析信号,计算其瞬时幅度并通过低通滤波去除高频分量,获得相应的子带包络;计算初始掩蔽值,以设定下界阈值对初始掩蔽值进行限制,通过正弦函数对初始掩蔽值进行非线性映射,得到包络掩蔽系数;将包络掩蔽系数应用于估计声源的对应子带信号;对经掩蔽处理的各子带信号进行全频带重构,获得增强后的目标声源信号。本申请的优势在于:有效提升了复杂声学环境下语音分离系统的性能。
-
公开(公告)号:CN114337908B
公开(公告)日:2024-04-12
申请号:CN202210011028.X
申请日:2022-01-05
Applicant: 中国科学院声学研究所
Abstract: 本申请公开了一种目标语音信号的干扰信号生成方法及装置,方法包括:获取待干扰的目标语音信号;对目标语音信号进行分帧处理,获得至少一个语音帧;对其中的每个语音帧进行处理,包括对其进行第一处理、第二处理和/或第三处理,获得频域包络反转信号、时域反转信号和/或时域包络反转信号;根据频域包络反转信号、时域反转信号和/或时域包络反转信号以及与其分别对应的预设权重系数,确定目标语音信号的干扰信号。本申请通过构造三种与目标语音信号相关的频域包络反转信号、时域反转信号、时域包络反转信号,并根据构造的三种信号以及与其对应的预设权重系数,获得目标语音信号的干扰信号进一步提高了干扰信号对目标语音信号的干扰作用。
-
公开(公告)号:CN114067832A
公开(公告)日:2022-02-18
申请号:CN202111332717.2
申请日:2021-11-11
Applicant: 中国科学院声学研究所
Abstract: 本申请涉及一种头相关传输函数(HRTF)的预测方法,包括:将被试的生理参数与HRTF的角度输入自动编码器进行编码,得到混合向量特征;将所述混合向量特征输入映射模型得到对应的HRTF幅度谱特征;所述映射模型为深度神经网络;将所述HRTF幅度谱特征输入变分自动编码器进行解码,获得个性化HRTF幅度谱,实现个性化HRTF的预测。能够通过深度学习方法建立生理参数、角度与HRTF频域特性之间的联系,使得给定期望方向和对应生理参数即可生成对应的个性化HRTF,实现个性化HRTF的快速预测。
-
公开(公告)号:CN118885872A
公开(公告)日:2024-11-01
申请号:CN202410911218.6
申请日:2024-07-09
Applicant: 中国科学院声学研究所
IPC: G06F18/241 , A61B5/372 , A61B5/38 , G06F18/214 , G06F18/213 , G06F18/10 , G06N3/0464 , G06N3/084
Abstract: 本发明涉及脑机接口技术领域,公开了一种听觉方位注意解码方法及装置,方法包括:采集听者的脑电信号,得到一段脑电信号;预处理所述一段脑电信号,得到预处理后的脑电信号;对预处理后的脑电信号进行时频变换,得到脑电信号的时频能量谱;对得到的时频能量谱进行分帧处理,得到决策窗集合;把决策窗集合依次输入训练好的听觉方位注意解码模型,得到脑电信号的空间方位注意的分类概率;听觉方位注意解码模型包括:特征提取器、平均池化层、由全连接网络和Softmax激活函数构成的分类器。因为将脑电信号的时频能量谱作为输入,使解码模型更容易捕捉对听觉方位注意较为重要的脑电能量分布线索,所以有利于提高跨试次脑电数据解码的准确率。
-
公开(公告)号:CN116506795A
公开(公告)日:2023-07-28
申请号:CN202310505876.0
申请日:2023-05-06
Applicant: 中国科学院声学研究所
IPC: H04S7/00 , G10L25/30 , G06N3/045 , G06N3/0464 , G06N3/08
Abstract: 本发明提供一种基于稀疏测量的个性化头相关传输函数预测方法及装置。该方法包括:首先基于若干方向上测量的头相关冲激响应,确定稀疏测量的头相关传输函数HRTF幅度谱;然后利用声学特征提取网络处理所述稀疏测量的HRTF幅度谱,获得相应的声学特征;利用维度增广网络将目标方向的维度进行增广,得到增广目标方向向量;最后利用谱预测神经网络处理所述声学特征和所述增广目标方向向量,预测出目标个性化HRTF幅度谱。该装置包括:幅度谱获取模块,声学特征获取模块,方向向量获取模块,和目标个性化幅度谱获取模块。如此,可以实现给定新被试的少量HRTF幅度谱与目标方位的方位角和俯仰角,即可通过三个神经网络模块生成目标个性化HRTF幅度谱,实现对全空间个性化HRTF幅度谱的预测。
-
-
-
-
-
-
-
-
-