语音增强方法、装置、设备及存储介质

    公开(公告)号:CN113571080B

    公开(公告)日:2024-11-08

    申请号:CN202110181389.4

    申请日:2021-02-08

    Inventor: 肖玮 史裕鹏 王蒙

    Abstract: 本申请涉及语音处理技术领域,具体提供了一种语音增强方法、装置、设备及存储介质,该方法包括:根据目标语音帧对应的复数频谱对所述目标语音帧进行预增强处理,得到第一复数频谱;根据所述第一复数频谱对所述目标语音帧进行语音分解,得到所述目标语音帧对应的声门参数、增益和激励信号;根据所述声门参数、所述增益和所述激励信号进行合成处理,得到所述目标语音帧对应的增强语音信号。本方案可以有效对语音进行增强,可以应用于云会议中。

    听觉辅助方法、装置、设备及计算机可读存储介质

    公开(公告)号:CN115831344A

    公开(公告)日:2023-03-21

    申请号:CN202111085866.3

    申请日:2021-09-16

    Abstract: 本申请提供了一种听觉辅助方法、装置、设备及计算机可读存储介质;该方法包括:响应于针对听觉辅助客户端的触发操作,呈现听觉辅助界面,所述听觉辅助界面至少包括用于远程问询的第一功能入口和用于近程辅听的第二功能入口;响应于针对所述第一功能入口的触发操作,呈现医生信息展示界面;响应于通过所述医生信息展示界面触发的选择操作,确定选择的目标医生信息和第一预约时间;响应于接收到的预约操作指令,向医生客户端发送远程问诊请求,所述远程问诊请求中携带有所述第一预约时间和进行实时音视频通话的入口链接。通过本申请,能够实现与医生的远程交流,提升听觉辅助效率。

    语音增强方法、装置、设备及存储介质

    公开(公告)号:CN113571081A

    公开(公告)日:2021-10-29

    申请号:CN202110182834.9

    申请日:2021-02-08

    Abstract: 本申请涉及语音处理技术领域,具体提供了一种语音增强方法、装置、设备及存储介质,该包括:根据目标语音帧对应的幅度谱对所述目标语音帧进行预增强处理,得到第一幅度谱;根据所述第一幅度谱对所述目标语音帧进行语音分解,得到所述目标语音帧对应的声门参数、增益和激励信号;根据所述声门参数、所述增益和所述激励信号进行合成处理,得到所述目标语音帧对应的增强语音信号;本申请的方案可以有效对语音进行增强,该方案可以应用于云会议中。

    音频编码方法、装置、设备、存储介质及程序产品

    公开(公告)号:CN119517050A

    公开(公告)日:2025-02-25

    申请号:CN202411430198.7

    申请日:2022-06-15

    Abstract: 本申请提供了一种音频编码方法、装置、设备、存储介质及计算机程序产品;方法包括:对音频信号进行第一层级的特征提取处理,得到第一层级的信号特征;针对N个层级中的第i层级,对音频信号和第(i‑1)层级的信号特征进行拼接处理,得到拼接特征,并对拼接特征进行第i层级的特征提取处理,得到第i层级的信号特征,其中,N和i为大于1的整数,i小于或等于N;对i进行遍历,得到N个层级中每个层级的信号特征,该信号特征的数据维度小于音频信号的数据维度;对第一层级的信号特征、以及N个层级中每个层级的信号特征,分别进行编码处理,得到音频信号在各层级的码流;通过本申请,能够提高音频编码效率并保证音频编码质量。

    音频解码、编码方法、装置、电子设备及存储介质

    公开(公告)号:CN119252268A

    公开(公告)日:2025-01-03

    申请号:CN202411672481.0

    申请日:2022-06-15

    Abstract: 本申请提供了一种音频解码、编码方法、装置、电子设备及存储介质,可以应用于车载场景;音频解码方法包括:获取码流,其中,所述码流是对音频信号进行编码得到的;对所述码流进行解码处理,得到所述音频信号的特征向量的预测值;对所述特征向量的预测值进行标签提取处理,得到用于信号增强的标签信息向量,其中,所述标签信息向量的维度与所述特征向量的预测值的维度相同;基于所述特征向量的预测值和所述标签信息向量进行信号重建;将通过所述信号重建得到的所述音频信号的预测值,作为所述码流的解码结果。通过本申请,能够有效抑制音频信号中的声学干扰,进而提高重建得到的音频信号的质量。

    音频处理方法、装置、电子设备、存储介质及程序产品

    公开(公告)号:CN115148217B

    公开(公告)日:2024-07-09

    申请号:CN202210681060.9

    申请日:2022-06-15

    Abstract: 本申请提供了一种音频处理方法、装置、电子设备、计算机可读存储介质及计算机程序产品;方法包括:对音频信号进行滤波处理,得到低频信号以及高频信号;对低频信号进行核心编码处理,得到核心码流;对低频信号进行频域变换处理,得到低频频谱,并对高频信号进行频域变换处理,得到高频频谱;对低频频谱以及高频频谱进行谱包络提取处理,得到谱包络信息,并对高频频谱进行谱平坦度提取处理,得到谱平坦度信息;对谱平坦度信息以及谱包络信息进行量化编码处理,得到频带拓展码流,并将频带拓展码流与核心码流组成编码码流。通过本申请,在编码时对谱平坦度信息进行编码,提高高频部分的编码完整度并降低复杂度,从而提高后续解码得到的音频质量。

    语音信号处理方法、装置、电子设备及存储介质

    公开(公告)号:CN113140225B

    公开(公告)日:2024-07-02

    申请号:CN202010065853.9

    申请日:2020-01-20

    Inventor: 肖玮 王蒙

    Abstract: 本申请提供了一种语音信号处理方法、装置、电子设备及存储介质,该方法包括:获取待处理语音信号的语音特征参数,语音特征参数包括待处理语音信号的初始频谱;基于语音特征参数,预测得到第一设定数量的子带频谱包络,其中,第一设定数量小于初始频谱所包含的初始频谱系数的数量,一个子带频谱包络与第二设定数量的初始频谱系数相对应;基于预测出的子带频谱包络对初始频谱进行调整,得到调整后的频谱;基于调整后的频谱,得到待处理语音信号对应的增强处理后的语音信号。通过本申请实施例所提供的方法,能够有效提供语音信号的优化效率,提高语音信号的质量。

    音频编码方法、音频解码方法、装置、设备及存储介质

    公开(公告)号:CN117219095A

    公开(公告)日:2023-12-12

    申请号:CN202310597138.3

    申请日:2023-05-24

    Abstract: 本申请提供了一种音频编码方法、音频解码方法、装置、设备及存储介质;涉及人工智能技术;方法包括:对音频信号进行下采样处理,得到音频信号的低频信号;对低频信号进行低频特征提取处理,得到音频信号的低频特征;对音频信号进行高频分析处理,得到音频信号的高频特征;其中,高频特征的特征维度低于低频特征的特征维度;对低频特征进行编码处理,得到音频信号的低频码流,并对高频特征进行编码处理,得到音频信号的高频码流。通过本申请,能够在保证音频质量的情况下,提高音频编码效率。

Patent Agency Ranking