基于自适应卷积的超轻量级语音增强神经网络系统及方法

    公开(公告)号:CN119673188A

    公开(公告)日:2025-03-21

    申请号:CN202411891387.4

    申请日:2024-12-20

    Abstract: 本发明公开了一种基于自适应卷积的超轻量级语音增强神经网络系统及方法。其系统包括编码器:频谱压缩模块,用于对含噪语音频谱进行动态范围和频率维度的压缩;自适应卷积注意力模块,用于通过自适应卷积层和时间通道注意力对压缩后的特征图做频率维度的降采样和特征的提取分析,然后将特征图送入增强器;增强器:双路径分组循环神经网络,用于对语音的子带时间特征和帧内频率特征进行建模;解码器:自适应转置卷积注意力模块,用于对增强器输出的特征图做频率维度的升采样和特征重建;频谱扩张模块,用于对自适应转置卷积注意力模块输出的特征图的频率维度进行扩张。本发明可以以极低的计算复杂度实现较高性能的语音增强。

    一种适用于语音增强的轻量级神经网络系统及其方法

    公开(公告)号:CN118230747A

    公开(公告)日:2024-06-21

    申请号:CN202410198267.X

    申请日:2024-02-22

    Abstract: 本发明公开了一种适用于语音增强的轻量级神经网络系统及其方法。其系统包括编码器、增强器和解码器,编码器包括:频谱压缩模块,用于对含噪语音频谱在频率维度进行压缩;卷积模块,用于对频谱压缩模块压缩后的特征图做特征提取和频率维度的降采样;分组膨胀卷积模块,用于对卷积模块输出的特征图做进一步特征提取和频率维度的降采样,然后将特征图送入增强器;解码器包括:分组膨胀反卷积模块,用于对经增强器增强后的特征图做特征重建和频率维度的升采样;反卷积模块,用于对特征图做进一步的特征重建和频率维度的升采样;频谱扩张模块,用于对特征图的频率维度进行扩张。本发明可以以较低的参数量和计算量开销实现较高性能的语音增强。

    一种基于主动学习的腹腔CT图像腹膜转移自动标记方法

    公开(公告)号:CN109191452B

    公开(公告)日:2021-10-08

    申请号:CN201811061701.0

    申请日:2018-09-12

    Abstract: 本发明公开了一种基于主动学习的腹腔CT图像腹膜转移自动标记方法,其步骤是:1)CT图像预处理,采用阈值法完成图像分割;2)提取图像特征,基于图像分割结果,选择图像颗粒提取灰度和纹理特征;3)采用随机游走分类法计算图像标记不确定性;4)基于标记不确定性和多样性选择CT图像供专家标记;返回步骤3)直至所有CT图像的标记已确定;5)输出确定标记的所有CT图像,其中阴性标记表示未发生腹膜转移,阳性标记表示发生了腹膜转移。本发明方法充分利用CT图像特点和肿瘤腹膜转移特征,应用主动学习思想,在少量专家标记的基础上,能够完成大量腹腔CT图像腹膜转移的自动标记,为恶性肿瘤诊疗提供依据。

    基于深度卷积神经网络的腹腔CT图像腹膜转移标记方法

    公开(公告)号:CN109087703A

    公开(公告)日:2018-12-25

    申请号:CN201810972458.1

    申请日:2018-08-24

    Abstract: 本发明公开了一种基于深度卷积神经网络的腹腔CT图像腹膜转移标记方法,其步骤是:1)CT图像预处理;2)采用分水岭法分割预处理后的CT图像,提取候选结节;3)为候选结节构建对应的神经网络输入;4)搭建深度卷积神经网络模型,使用已标记候选结节对应的神经网络输入训练神经网络模型;5)使用神经网络模型预测未标记候选结节为肿瘤结节的概率,最后输出确定标记的所有CT图像,其中阴性标记表示未发生肿瘤腹膜转移,阳性标记表示发生了腹膜转移。本发明方法能够完成大量腹腔CT图像腹膜转移的自动标记,为恶性肿瘤诊疗提供依据;易于理解、实施简易,适用于海量腹腔CT图像的自动标记,具有良好的扩展性、鲁棒性和实用性。

    一种平衡降噪量和语音音质的单通道语音增强方法

    公开(公告)号:CN116913308A

    公开(公告)日:2023-10-20

    申请号:CN202310707811.4

    申请日:2023-06-15

    Applicant: 南京大学

    Abstract: 本发明公开了一种平衡降噪量和语音音质的单通道语音增强方法。该方法步骤如下:(1)将含噪信号变换到时频域,并利用PEFAC方法估计基频;(2)计算后验信噪比,根据基频估计在倒谱域对其平滑,进而利用固定先验的方法估计后验语音存在概率;(3)根据后验语音存在概率估计噪声功率谱密度;(4)更新后验信噪比,计算语音功率谱密度的最大似然估计;(5)根据基频估计在倒谱域平滑语音功率谱密度,并增强基频,得到先验信噪比的估计;(6)利用自适应先验的方法再次估计后验语音存在概率;(7)计算基于广义伽马先验的对数谱幅度增益,并结合后验语音存在概率导出基于语音存在不确定性的增益估计;(8)增强语谱并变换回时域,得到增强信号。

    基于频谱压缩和神经网络的多阶段全频带语音增强方法

    公开(公告)号:CN115273884A

    公开(公告)日:2022-11-01

    申请号:CN202210684643.7

    申请日:2022-06-17

    Abstract: 本发明公开了一种基于频谱压缩和神经网络的多阶段全频带语音增强方法。其步骤为:设计全频带语音频谱压缩曲线,使用设计的参数初始化MHA‑DPCRN的频谱压缩模块;合成模拟含噪混响语音;对模拟含噪混响语音和对应的带混响纯净语音分别做短时傅里叶变换得到两者的短时傅里叶谱;使用短时傅里叶谱训练MHA‑DPCRN模型权重;(5)对待增强的含噪混响语音做短时傅里叶变换得到短时傅里叶谱;将含噪混响语音的短时傅里叶谱输入完成训练的模型,得到增强语音的短时傅里叶谱,并进行逆短时傅里叶变换得到增强语音的时域信号。本发明的方法能够在复杂噪声场景下对全频带语音进行较为彻底的噪声抑制,同时保留较好的语音音质。

    一种基于深度学习的CT图像和WSI图像联合识别方法

    公开(公告)号:CN115272238A

    公开(公告)日:2022-11-01

    申请号:CN202210907518.8

    申请日:2022-07-29

    Abstract: 本发明公开了一种基于深度学习的CT图像和WSI图像联合识别方法,其步骤是:1)WSI图像的归一化;2)进行无监督的训练以初始化网络结构;3)对初始化后的网络进行有监督的训练;4)分别得到的WSI图像和CT图像的特征后进行特征拼接;5)完成网络的训练,进行CT图像和WSI图像的协助识别。识别结果为患病则标记为阳性,否则标记为阴性。本发明方法充分利用CT图像特点和WSI图像特征,采用深度学习思想,运用较少的训练数据即可获得对患者的识别;本发明方法易于理解、计算开销小、算法迭代速度快,适用于海量患者的自动识别,具有良好的扩展性和鲁棒性。

    一种基于注意力机制的胃部CT图像深度识别方法

    公开(公告)号:CN115272233A

    公开(公告)日:2022-11-01

    申请号:CN202210905419.6

    申请日:2022-07-29

    Abstract: 本发明公开了一种基于注意力机制的胃部CT图像深度识别方法,其步骤是:1)CT图像预处理;2)对CT图像使用强化学习的方法进行数据增强;3)为CT图像构建对应的神经网络输入;4)搭建深度卷积神经网络模型,使用已标记CT图像对应的神经网络输入训练神经网络模型;5)使用神经网络模型预测CT图像和的协助识别。识别结果为患病则标记为阳性,否则标记为阴性。本本发明方法充分利用CT图像特点,采用深度学习思想,运用较少的训练数据即可获得对患者的识别;本发明方法易于理解、计算开销小、算法迭代速度快,适用于海量患者的自动识别,具有良好的扩展性和鲁棒性。

    基于深度卷积神经网络的腹腔CT图像腹膜转移标记方法

    公开(公告)号:CN109087703B

    公开(公告)日:2022-06-07

    申请号:CN201810972458.1

    申请日:2018-08-24

    Abstract: 本发明公开了一种基于深度卷积神经网络的腹腔CT图像腹膜转移标记方法,其步骤是:1)CT图像预处理;2)采用分水岭法分割预处理后的CT图像,提取候选结节;3)为候选结节构建对应的神经网络输入;4)搭建深度卷积神经网络模型,使用已标记候选结节对应的神经网络输入训练神经网络模型;5)使用神经网络模型预测未标记候选结节为肿瘤结节的概率,最后输出确定标记的所有CT图像,其中阴性标记表示未发生肿瘤腹膜转移,阳性标记表示发生了腹膜转移。本发明方法能够完成大量腹腔CT图像腹膜转移的自动标记,为恶性肿瘤诊疗提供依据;易于理解、实施简易,适用于海量腹腔CT图像的自动标记,具有良好的扩展性、鲁棒性和实用性。

    一种基于主动学习的腹腔CT图像腹膜转移自动标记方法

    公开(公告)号:CN109191452A

    公开(公告)日:2019-01-11

    申请号:CN201811061701.0

    申请日:2018-09-12

    Abstract: 本发明公开了一种基于主动学习的腹腔CT图像腹膜转移自动标记方法,其步骤是:1)CT图像预处理,采用阈值法完成图像分割;2)提取图像特征,基于图像分割结果,选择图像颗粒提取灰度和纹理特征;3)采用随机游走分类法计算图像标记不确定性;4)基于标记不确定性和多样性选择CT图像供专家标记;返回步骤3)直至所有CT图像的标记已确定;5)输出确定标记的所有CT图像,其中阴性标记表示未发生腹膜转移,阳性标记表示发生了腹膜转移。本发明方法充分利用CT图像特点和肿瘤腹膜转移特征,应用主动学习思想,在少量专家标记的基础上,能够完成大量腹腔CT图像腹膜转移的自动标记,为恶性肿瘤诊疗提供依据。

Patent Agency Ranking