-
公开(公告)号:CN117542367A
公开(公告)日:2024-02-09
申请号:CN202311517593.4
申请日:2023-11-15
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G10L21/0208 , G10L21/0216
Abstract: 本发明涉及降噪方法,尤其涉及一种轻量化多轴Transformer的单通道降噪方法。可以充分提取语音信号潜在的时频特征。采用多头动态局部自关注模块高效提取局部特征。本文提出的方法具有更少的网络参数和更低的计算成本,同时与最先进的方法相比,在语音信号的质量和可懂度方面具有竞争力。可以充分提取语音信号潜在的时频特征,能够有效降低计算机的资源消耗。提示块以使得模型更好学得频率特征信息。
-
公开(公告)号:CN117542342A
公开(公告)日:2024-02-09
申请号:CN202311517595.3
申请日:2023-11-15
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G10K11/178 , G10L21/0216 , G10L21/0208
Abstract: 本发明涉及声音处理技术领域,尤其涉及一种基于自适应滤波与神经网络的回声消除方法。该模型由两部分组成:用于消除线性回声的Speex算法,以及进一步消除回声的多尺度时频UNet。主要优点如下:(1)在自适应滤波之前进行了时间对齐,弥补了回声信号的延迟,提升了自适应滤波器的回声消除效果;(2)以UNet为基础,构建了一个能多尺度地提取时频维度特征的神经网络;(3)该多级回声消除模型可以在复杂的噪声、混响环境下实现优越的回声消除效果。
-
公开(公告)号:CN117496926A
公开(公告)日:2024-02-02
申请号:CN202311511710.6
申请日:2023-11-14
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
Abstract: 本发明涉及语言处理技术领域,尤其涉及一种基于大型预训练语言模型的音乐生成方法。通过使用数千个旋律MIDI文件对GPT‑3进行微调,然后使用微调后的模型来进行旋律生成。该方法的主要优点如下:(1)算法可以学习旋律的长期依赖结构,并生成富有长期结构和音乐性的音乐;(2)算法可以通过调整微调数据格式,模拟不同的旋律生成方法;(3)算法允许仅使用较少的数据,可以生成类似风格的旋律。
-
-