音频处理方法、装置、设备及介质

    公开(公告)号:CN118248160B

    公开(公告)日:2024-08-06

    申请号:CN202410620986.6

    申请日:2024-05-20

    摘要: 本申请实施例公开一种音频处理方法、装置、设备及介质。通过将接收到的远端信号与接收到的近端输入信号对齐,得到对齐后的目标远端信号;根据目标远端信号对近端输入信号中的回声信号进行线性滤波处理,得到输出信号;根据目标远端信号和输出信号,确定出输出信号中线性滤波后的第一残留回声信号的第一功率谱密度;根据目标远端信号对应的回声估计信号的历史功率谱密度的分布,确定输出信号中未经过线性滤波处理的第二残留回声信号的第二功率谱密度;根据输出信号的功率谱密度、第一功率谱密度和第二功率谱密度确定出输出信号的增益参数,并根据增益参数对输出信号进行增益,得到输出到远端的目标输出信号。以此来提升语音通信的信号质量。

    音频处理方法、装置、设备及介质

    公开(公告)号:CN118248160A

    公开(公告)日:2024-06-25

    申请号:CN202410620986.6

    申请日:2024-05-20

    摘要: 本申请实施例公开一种音频处理方法、装置、设备及介质。通过将接收到的远端信号与接收到的近端输入信号对齐,得到对齐后的目标远端信号;根据目标远端信号对近端输入信号中的回声信号进行线性滤波处理,得到输出信号;根据目标远端信号和输出信号,确定出输出信号中线性滤波后的第一残留回声信号的第一功率谱密度;根据目标远端信号对应的回声估计信号的历史功率谱密度的分布,确定输出信号中未经过线性滤波处理的第二残留回声信号的第二功率谱密度;根据输出信号的功率谱密度、第一功率谱密度和第二功率谱密度确定出输出信号的增益参数,并根据增益参数对输出信号进行增益,得到输出到远端的目标输出信号。以此来提升语音通信的信号质量。

    音频分享方法、装置、计算机设备和存储介质

    公开(公告)号:CN117896469B

    公开(公告)日:2024-05-31

    申请号:CN202410298526.6

    申请日:2024-03-15

    发明人: 高毅

    摘要: 本申请涉及一种音频分享方法、装置、计算机设备、存储介质和计算机程序产品。所述方法涉及人工智能技术,包括:在语音通话的过程中,确定第一终端的待分享音频数据;待分享音频数据和由第二终端向第一终端发送的远端通话音频数据,在第一终端的本地端分别通过不同本地播放设备进行播放;获取在第一终端的本地端采集的本地音频数据;本地音频数据包括分享音频回声数据和近端通话音频数据;基于本地音频数据将待分享音频数据延迟对齐,得到与分享音频回声数据对齐的延迟音频数据;将本地音频数据与延迟音频数据进行混合,并将混合音频数据基于语音通话发送到第二终端进行播放。采用本方法能够降低分享音频的回声影响,提高所分享音频的质量。

    回声消除方法、装置、电子设备及存储介质

    公开(公告)号:CN117651096A

    公开(公告)日:2024-03-05

    申请号:CN202410120919.8

    申请日:2024-01-29

    发明人: 苏祥 高毅 陈静聪

    摘要: 本申请公开了一种回声消除方法、装置、电子设备及存储介质。本发明实施例可应用于各种场景,包括但不限于云技术、人工智能、智慧交通、辅助驾驶等。该方法包括:分别对近端语音信号以及近端语音信号对应的远端语音信号进行移频处理以及下采样处理,得到远端语音信号对应的目标远端复信号以及近端语音信号对应的目标近端复信号;根据目标远端复信号以及目标近端复信号,确定近端语音信号与远端语音信号之间的互相关函数;根据互相关函数,确定回声信号的回声延迟;基于回声信号的回声延迟,对近端语音信号进行回声消除。通过本申请的方法,实现了近端语音信号的回声消除。

    回声信号消除方法、装置、电子设备及可读存储介质

    公开(公告)号:CN117373469A

    公开(公告)日:2024-01-09

    申请号:CN202210778876.3

    申请日:2022-06-30

    发明人: 高毅 杨清山

    IPC分类号: G10L21/0208 G10L25/03

    摘要: 本申请公开了一种回声信号消除方法、装置、电子设备及可读存储介质,属于多媒体信息处理技术领域。方法包括:对第一设备的第一音频信号和第二设备的第二音频信号进行特征提取,分别得到第一音频特征和第二音频特征;基于第一音频特征和第二音频特征,确定第一音频信号和第二音频信号之间的相似度;当该相似度大于相似度阈值时,将第一音频信号作为回声信号进行消除。由于当该相似度大于相似度阈值时,能表明第一音频信号和第二音频信号对应同一个声音,因此,通过消除作为回声信号的第一音频信号,可以避免回声现象的产生。

    一种回声消除模型的训练方法、装置、设备及存储介质

    公开(公告)号:CN117219107A

    公开(公告)日:2023-12-12

    申请号:CN202311480839.5

    申请日:2023-11-08

    摘要: 本申请提供了一种回声消除模型的训练方法、装置及计算机可读存储介质;方法包括:获取语音样本,其中,语音样本包括远端语音信号、回音消除语音信号和传感器信号;通过远端语音信号、回音消除语音信号和传感器信号调用回声消除模型,得到预测频谱;确定目标频谱和预测频谱对应第一均方误差损失函数的第一均方误差损失值,并确定对应第二均方误差损失函数的第二均方误差损失值;确定第一均方误差损失值和第二均方误差损失值的组合损失值;根据组合损失值更新回声消除模型的参数,基于更新的参数生成训练后的回声消除模型。通过本申请,能够使回声消除模型在训练过程中快速收敛并提升回声消除模型的泛化能力。

    一种音频处理方法、装置、电子设备和存储介质

    公开(公告)号:CN116566963A

    公开(公告)日:2023-08-08

    申请号:CN202310850039.1

    申请日:2023-07-12

    IPC分类号: H04L65/75 H04L65/80

    摘要: 本申请涉及多媒体技术领域,尤其涉及一种音频处理方法、装置、电子设备和存储介质,用以降低音频处理的资源耗费。其中,方法包括:基于承载应用程序的终端设备的配置信息,获得各初始音频信号各自对应的处理模式;分别基于各初始音频信号各自的处理模式,对初始音频信号进行处理,获得各目标音频信号,其中,输入音频信号经处理后,获得的目标音频信号为采集音频信号,输出音频信号经处理后获得的目标音频信号为共享音频信号;对各目标音频信号进行混音,并对混音后音频进行编码,获得待发送编码信号。本申请通过基于配置信息获得初始音频信号的处理模式,实现不同终端设备之间的音频共享,对处理后的音频信号混音后编码,节省计算资源。

    音频信号的处理方法、装置、电子设备及存储介质

    公开(公告)号:CN115831155A

    公开(公告)日:2023-03-21

    申请号:CN202111087468.5

    申请日:2021-09-16

    IPC分类号: G10L25/78 H04N7/15 G08B21/24

    摘要: 本申请公开了一种音频信号的处理方法、装置、电子设备及存储介质,属于音频技术领域。本申请通过在多人语音通话中处于话筒静音状态的情况下,仍采集用户的音频信号,但并不会发送采集到的音频信号,再对该音频信号进行信号分析和处理,利用该音频信号中多个音频帧分别在第一频带范围中多个频带上的增益参数,来判断出该音频信号中是否包含目标语音,如果该音频信号中包含目标语音,说明用户忘记了解除话筒静音状态就开始进行发言,从而对外输出提示消息,能够及时向用户提示解除话筒静音状态,提高了人机交互效率。

    异常回声延时识别方法、装置、终端及存储介质

    公开(公告)号:CN115706756A

    公开(公告)日:2023-02-17

    申请号:CN202110936165.X

    申请日:2021-08-16

    发明人: 高毅 罗程 李斌

    摘要: 本申请公开了一种异常回声延时识别方法、装置、终端及存储介质,涉及通话技术领域。该方法包括:对麦克风采集到的输入音频帧进行音频特征提取,得到第一音频特征;响应于达到目标延时,基于第一音频特征,从候选音频特征中确定第二音频特征,候选音频特征是输出音频帧对应的音频特征,输出音频帧用于扬声器播放,第二音频特征与第一音频特征匹配;确定第二音频特征对应输出音频帧的回声延时;响应于回声延时小于目标延时,确定存在异常回声延时。提出了一种检测回声消除过程中负延时的方式,避免回声消除模块在错误回声延时下继续进行回声消除工作,或避免由于无法计算出回声延时而导致无法进行回声消除的情况,从而可以提高回声消除的准确性。

    对回声路径的语音延时估计方法、装置和存储介质

    公开(公告)号:CN115620740A

    公开(公告)日:2023-01-17

    申请号:CN202110783456.X

    申请日:2021-07-12

    发明人: 高毅 罗程 李斌

    摘要: 本申请涉及一种对回声路径的语音延时估计方法、装置、计算机设备和存储介质。所述方法包括:获取回声路径中与接收器对应的接收点处的当前接收音频帧;提取当前接收音频帧的音频指纹,得到当前第一音频特征;获取存储的多个第二音频特征;多个第二音频特征为包括当前时刻在内的历史时间段内,对依次经过与播放器对应的参考点的参考音频帧提取音频指纹得到第二音频特征后,按照各参考音频帧的时间顺序对应存储得到;将当前第一音频特征与多个第二音频特征分别进行特征匹配处理,基于匹配结果从多个第二音频特征中确定目标第二音频特征;根据目标第二音频特征所对应的存储顺序,确定回声路径的延时。采用本方法能够提升回声路径的延时确定效率。