音频处理方法、装置、电子设备和存储介质

    公开(公告)号:CN112951265B

    公开(公告)日:2022-07-19

    申请号:CN202110107918.6

    申请日:2021-01-27

    摘要: 本申请提供一种音频处理方法、装置、电子设备和存储介质,该方法包括:获取干音音频中目标时间段的目标干音音频;根据该目标干音音频的全局能量特征和该目标干音音频对应的目标伴奏音频的全局掩蔽特征,确定伴奏音频对干音音频的目标掩蔽能力度量值;基于预先设置的伴奏对干音的掩蔽能力度量值与伴奏干音音量比的对应关系,确定上述目标掩蔽能力度量值对应的目标伴奏干音音量比,将伴奏音频与干音音频的音量比调节至目标伴奏干音音量比。本申请可以得到适合音乐作品的伴奏音频与干音音频的音量比,并将伴奏音频的音量与干音音频的音量调节至该音量比,节省用户的调音时间,调音过程简单并且调音效果好。

    一种音频检测方法、装置、电子设备及存储介质

    公开(公告)号:CN113611330B

    公开(公告)日:2024-05-03

    申请号:CN202110865067.1

    申请日:2021-07-29

    IPC分类号: G10L25/51 G10L25/78 G10L25/87

    摘要: 本公开涉及音频处理技术领域,尤其涉及一种音频检测方法、装置、电子设备及存储介质,从原始音频中确定出待处理音频,以及待处理音频的各音频帧对应的能量值和时域分布的时间点信息,并从待处理音频中确定出初始目标音频,从初始目标音频的各换气帧中最高换气帧,分别对待处理音频的各音频帧对应的能量值进行平滑处理,并从待处理音频的起始帧与最高换气帧之间的各音频帧中,确定出满足最低能量值条件的第一最低换气帧,并从最高换气帧与待处理音频的终止帧之间的各音频帧中,确定出满足最低能量值条件的第二最低换气帧,将第一最低换气帧和第二最低换气帧之间的各音频帧,作为原始音频的目标音频。这样,能够提高检测换气声的准确性。

    音频处理方法、装置、计算设备及介质

    公开(公告)号:CN115019814A

    公开(公告)日:2022-09-06

    申请号:CN202210524704.3

    申请日:2022-05-13

    IPC分类号: G10L21/003

    摘要: 本公开的实施方式提供了一种音频处理方法、装置、计算设备及介质。本公开通过在获取到待处理音频后,确定候选音频组中每个候选音频与待处理音频之间的音色相似度,其中,候选音频组所包括的音频两两之间的相似度之和,是每个音频组所包括的音频两两之间的相似度之和中最小的,从而使得候选音频组所包括的候选音频的音色更加多样,从而使得可以从更加多样的候选音频中实现目标音频的确定,以提高所确定出的目标音频的准确性,进而基于目标音频的预设调音参数,对待处理音频进行调音处理,实现对待处理音频的自动调音过程,无需相关技术人员手动操作,从而可以提高音频处理过程的调音效率。

    破音检测方法和装置、电子设备、存储介质

    公开(公告)号:CN116364115A

    公开(公告)日:2023-06-30

    申请号:CN202310348811.X

    申请日:2023-03-28

    IPC分类号: G10L25/60

    摘要: 本公开的实施方式提供了一种破音检测方法和装置、电子设备、存储介质,属于信号处理技术领域。该方法包括:将待检测音频信号划分为N个时域信号帧;根据每帧时域信号帧内信号幅值的统计分布情况,确定该帧对应的第一削波置信度,第一削波置信度用于区分正常音频信号和削波音频信号;根据连续M个时域信号帧的第一削波置信度,确定由连续M个时域信号帧形成的检测窗对应的第二削波置信度;响应于第二削波置信度大于预设第一阈值,确定对应的检测窗内存在破音。本公开解决了现有固定削波检测阈值带来的破音检测的误检率高和准确率低的问题。

    孪生网络模型训练、度量方法、装置、介质和设备

    公开(公告)号:CN112784130B

    公开(公告)日:2022-05-27

    申请号:CN202110113716.2

    申请日:2021-01-27

    摘要: 本公开涉及一种孪生网络模型训练、度量方法、装置、介质和设备。先预训练一个标签分类模型,然后利用训练出的标签分类模型,通过增加编码神经网络分支的方式,构造孪生网络模型,从而可以基于包括标签分类学习和度量学习的多任务学习的方式,训练得到用于推荐系统中的数据相似度度量的孪生网络模型。通过分阶段训练以及多任务学习约束的方式,可以有效提高模型的稳定性和泛化能力,并提高训练出的用于推荐系统中的数据相似度度量的孪生网络模型的准确性。进一步的,可以基于训练出的孪生网络模型进行数据相似度度量,有效提高数据相似度度量的准确性。将训练出的孪生网络模型用于歌曲相似度度量,即可以有效提高歌曲相似度度量的准确性。

    音频处理方法、装置、电子设备和存储介质

    公开(公告)号:CN112951265A

    公开(公告)日:2021-06-11

    申请号:CN202110107918.6

    申请日:2021-01-27

    摘要: 本申请提供一种音频处理方法、装置、电子设备和存储介质,该方法包括:获取干音音频中目标时间段的目标干音音频;根据该目标干音音频的全局能量特征和该目标干音音频对应的目标伴奏音频的全局掩蔽特征,确定伴奏音频对干音音频的目标掩蔽能力度量值;基于预先设置的伴奏对干音的掩蔽能力度量值与伴奏干音音量比的对应关系,确定上述目标掩蔽能力度量值对应的目标伴奏干音音量比,将伴奏音频与干音音频的音量比调节至目标伴奏干音音量比。本申请可以得到适合音乐作品的伴奏音频与干音音频的音量比,并将伴奏音频的音量与干音音频的音量调节至该音量比,节省用户的调音时间,调音过程简单并且调音效果好。

    齿音调整方法、装置、电子设备及计算机可读存储介质

    公开(公告)号:CN112951266B

    公开(公告)日:2024-02-06

    申请号:CN202110163186.2

    申请日:2021-02-05

    摘要: 本申请的实施方式提供了一种齿音调整方法、齿音调整装置、电子设备以及计算机可读存储介质,涉及音频处理技术领域。该方法包括:获取到录制的音频数据;对所述音频数据进行音量归一化并根据归一化结果确定用于表征音量变化程度的增益值;根据所述增益值和音量归一化前所述音频数据对应的原齿音特征值计算音量归一化后所述音频数据对应的目标齿音特征值;根据所述目标齿音特征值对所述音频数据进行齿音调整。可见,实施本申请实施例可以对音频数据进行音量归一化,从而得到用于表征音量变化程度的增益值,进而根据增益值可以确定出音量归一化后的音频数据对应的齿音特征,根据该齿音特征对音频数据进行个性化的齿音调整,可以改善齿音抑制效果。

    一种音频检测方法、装置、电子设备及存储介质

    公开(公告)号:CN113611330A

    公开(公告)日:2021-11-05

    申请号:CN202110865067.1

    申请日:2021-07-29

    IPC分类号: G10L25/51 G10L25/78 G10L25/87

    摘要: 本公开涉及音频处理技术领域,尤其涉及一种音频检测方法、装置、电子设备及存储介质,从原始音频中确定出待处理音频,以及待处理音频的各音频帧对应的能量值和时域分布的时间点信息,并从待处理音频中确定出初始目标音频,从初始目标音频的各换气帧中最高换气帧,分别对待处理音频的各音频帧对应的能量值进行平滑处理,并从待处理音频的起始帧与最高换气帧之间的各音频帧中,确定出满足最低能量值条件的第一最低换气帧,并从最高换气帧与待处理音频的终止帧之间的各音频帧中,确定出满足最低能量值条件的第二最低换气帧,将第一最低换气帧和第二最低换气帧之间的各音频帧,作为原始音频的目标音频。这样,能够提高检测换气声的准确性。

    齿音处理方法、装置、电子设备及存储介质

    公开(公告)号:CN116189696A

    公开(公告)日:2023-05-30

    申请号:CN202310179188.X

    申请日:2023-02-17

    IPC分类号: G10L21/013 G10L25/48

    摘要: 本申请提供了一种齿音处理方法、装置、电子设备及存储介质。该方法包括获取当前音频帧;确定当前音频帧的目标特征值;响应于当前音频帧的目标特征值满足预设条件,确定当前音频帧属于齿音的齿音帧,并确定齿音的调节参数,基于齿音的调节参数对当前音频帧进行齿音调节处理,从而可以逐帧对齿音进行齿音的检测以及调节处理,提高了齿音调节处理的实时性,不仅可以用于对实时性要求不高的录播场景中,还可以用于对实时性要求较高的实时场景中,实时地进行齿音调节处理。