-
公开(公告)号:CN118173085A
公开(公告)日:2024-06-11
申请号:CN202410577904.4
申请日:2024-05-10
Applicant: 哈尔滨理工大学
Abstract: 本申请提供了一种基于Swin‑Transformer的音频分类方法,该方法包括:将原始音频数据输入到预先训练的音频分类网络模型的特征转换网络,以得到所述原始音频数据的音频频谱图;将所述音频频谱图输入到所述预先训练的音频分类网络模型的深度特征提取网络,以得到所述原始音频数据的网络深度特征;将所述原始音频数据的网络深度特征输入到所述预先训练的音频分类网络模型的分类网络,以得到所述原始音频数据的分类结果。该方法可以简化音频分类的操作,提高音频分类的效率。
-
公开(公告)号:CN119049455A
公开(公告)日:2024-11-29
申请号:CN202410577920.3
申请日:2024-05-10
Applicant: 哈尔滨理工大学
Abstract: 一种语音语义深度学习通信系统,属于通信领域。包括步骤:编码模块和解码模块;所述编码模块采用新的语义编码方法对源数据编码,获得数据流;所述解码模块采用新的语义度量方法对接收的数据流解码还原;所述系统利用训练出的深度学习模型,实现更好的去除环境噪声和传输噪声能力。本发明通过引入深层语义优化,解决了无线语音通信中的噪声干扰问题,实现了无线语音的高质量通信。本发明涉及一种语音语义深度学习通信系统,旨在解决无线语音通信中的噪声干扰问题,实现高质量的无线语音语义通信。该系统包括知识库模块和语义通信模块。通过深度学习技术,系统能够提取和传输关键语义信息,并在传输错误时最小化语义受损。
-