-
公开(公告)号:CN118588106A
公开(公告)日:2024-09-03
申请号:CN202410749233.5
申请日:2024-06-11
申请人: 清华大学
摘要: 本申请提供了一种基于入耳式降噪耳机的心音还原方法、装置、设备及存储介质,其中,该方法包括:对原始音频数据中的每一帧原始帧数据进行变换处理,生成每一帧原始帧数据的原始频谱图;通过心音重构神经网络对每一帧原始帧数据的原始频谱图进行重构,生成每一帧原始帧数据的心音频谱图;对每一帧原始帧数据的心音频谱图进行变换处理的逆操作,生成每一帧原始帧数据的心音帧数据;将每一帧原始帧数据的各心音帧数据进行拼接,得到原始音频数据中的心音数据。通过本申请实施例提供的一种基于入耳式降噪耳机的心音还原方法、装置、设备及存储介质,在还原心音的过程中不需要借助听诊器,降低了操作成本和操作的难度。
-
公开(公告)号:CN118588045A
公开(公告)日:2024-09-03
申请号:CN202410753762.2
申请日:2024-06-12
申请人: 长沙师范学院 , 湖南腾胜众艺文化传播有限公司
摘要: 本发明公开了一种基于声音识别的古筝训练教学方法和系统,属于声音识别领域,一种基于声音识别的古筝训练教学方法包括以下步骤:S1.进行数据采集与预处理;S2.进行特征提取与分析;S3.进行模型训练与优化;S4.进行系统集成;S5.进行实时反馈与评估S6.进行持续改进与优化。一种基于声音识别的古筝训练教学系统包括音频输入模块、声音识别模块、学习资源模块、用户界面模块、数据管理模块、音频输出模块和管理与设置模块。通过自适应特征选择和深度强化学习技术,系统能够动态调整特征的选择和权重,提供个性化的指导和实时反馈。创新的互动式学习系统为学生提供了丰富的学习体验,包括可视化界面和个性化路径规划。
-
公开(公告)号:CN116884417B
公开(公告)日:2024-09-03
申请号:CN202310866686.1
申请日:2023-07-14
申请人: 国网江苏省电力有限公司南京供电分公司
IPC分类号: G10L17/26 , G10L21/0216 , G10L19/02
摘要: 一种基于权重分配的变压器频谱特征增强方法及系统。首先进行变压器声学信号的采集、降噪及频谱分析;其次根据实际频谱中不同频率成分的幅值,将不同频段定义为干扰段和有效段两部分,并针对不同频段类型进行参考权重计算;最终基于参考权重计算结果对频谱特征进行增强处理,并基于增强前后状态预测准确性验证该方法的有效性。本发明通过对信号原始频谱中频率成分幅值大小、频带宽度等信息进行分析处理,形成了一种能根据实际频谱分析不同频率的参考权重,从而指导频谱特征增强的方法,优化了目前利用变压器声纹进行状态识别的模型,能有效提高状态识别的准确率。
-
公开(公告)号:CN111933161B
公开(公告)日:2024-09-03
申请号:CN202010685668.X
申请日:2020-07-16
申请人: 腾讯音乐娱乐科技(深圳)有限公司
发明人: 闫震海
摘要: 本发明公开了一种均衡器滤波参数的生成方法,包括:接收用户在已展示界面的预设区域内对频率参量的幅度值进行绘制曲线的操作,获取曲线的幅度值以及幅度值对应的目标频率点;生成包含目标频率点的幅度值的频响曲线信息;获取频响曲线信息表征的频响曲线的幅度响应值;确定相位响应值;利用幅度响应值和相位响应值,生成用于对音频信号进行滤波处理的滤波参数。本申请中未限定用户能够绘制幅度的频率,也就是说用户可以对任意的频率点的幅度进行绘制,这样可以充分的满足用户的实际需求,使得得到的频响曲线的精度得到了提升,那么基于通过频响曲线生成的用于进行音频处理的滤波参数更加符合用户的要求。
-
公开(公告)号:CN110992965B
公开(公告)日:2024-09-03
申请号:CN201911345336.0
申请日:2015-02-24
申请人: 三星电子株式会社
发明人: 朱基岘 , 安东·维克托罗维奇·普罗夫 , 康斯坦丁·谢尔盖耶维奇·奥斯波夫
摘要: 公开了一种信号分类方法和装置以及使用其的音频编码方法和装置。本发明涉及了一种音频编码,更具体地,涉及一种能够减小由于编码模式切换而导致的延迟同时提高重建的声音的质量的信号分类方法和装置以及使用所述信号分类方法和装置的音频编码方法和装置。所述信号分类方法可包括以下操作:将当前帧分类为语音信号和音乐信号中的一个;基于从多个帧获得的特征参数,确定对当前帧进行分类的结果是否包含错误;并且依据确定的结果,修正对当前帧进行分类的结果。通过基于修正参数修正音频信号的初始分类结果,本发明能够确定针对音频信号的特征的最优编码模式并且能够防止帧之间的频繁的编码模式切换。
-
公开(公告)号:CN118571261A
公开(公告)日:2024-08-30
申请号:CN202410721693.7
申请日:2024-06-05
申请人: 陕西千山航空电子有限责任公司
IPC分类号: G10L25/51 , G10L21/0272 , G10L21/0208 , G10L25/24 , G10L19/02
摘要: 本发明提供了一种飞参音频数据的快速判读方法、系统、设备及介质,方法包括:对原始飞参音频数据解密得到多个通道的单通道音频数据包;采用711编解码算法单通道音频数据包解码,采用高通滤波算法对解码后数据进行高噪音信号数据分离,得到话音数据集和异常音频数据集;采用训练的话音识别模型对话音数据集进行语义识别得到可播放格式音频文件;采用训练后飞机异常声音模型对所述异常音频数据集进行一次判读;采用飞参音频语义判读库,对所述可播放格式音频文件进行二次判读;融合两次判读结果,输出否有故障、故障类型和故障发生时间。本发明可以自动化程度高,提高飞机故障分析效率,可以提高地面维护效率。
-
公开(公告)号:CN118471239B
公开(公告)日:2024-08-30
申请号:CN202410937145.8
申请日:2024-07-12
申请人: 世优(北京)科技股份有限公司
发明人: 蒋正浩
摘要: 本申请提供了一种音频信号的处理方法及装置,其中,该方法包括:获取多路音频信号,并识别所述多路音频信号中的每路音频信号的编码方式和实际采样率;基于所述编码方式和所述实际采样率对所述每路音频信号的各频率分量进行频率校正处理,并基于所述编码方式和所述实际采样率对频率校正处理后的所述每路音频信号进行信号延迟补偿;将信号延迟补偿后的所述每路音频信号进行时钟恢复,将时钟恢复后的所述每路音频信号进行混音处理,得到混音处理后的音频信号。本申请解决了现有技术中音频信号存在信号失真的技术问题。
-
公开(公告)号:CN118538245A
公开(公告)日:2024-08-23
申请号:CN202410702211.3
申请日:2024-06-01
申请人: 郑州大学
摘要: 本发明涉及一种基于ResNet18和Transformer双支分支对音乐进行流派分类及其构建的方法,该方法包括:利用分割技术对音频数据进行数据增强;双分支分别利用librosa库对数据增强后的音频数据进行提取梅尔频谱图特征和利用不同长度的SincNet滤波器提取出更具有代表的三通道二维表征;分别将提取好的梅尔频谱图特征输入到Transformer Encoder中,将更具有代表性的三通道二维表征送到ResNet18,最后通过一个全连接层进行拼接然后进行分类。通过本发明可以解决音乐特征不全面、不具有代表性以及音乐数据量过大而分类不准确等问题,为以后构建更准确的音乐推荐系统,提升用户体验和满意度方面提供新思路。
-
公开(公告)号:CN118538229A
公开(公告)日:2024-08-23
申请号:CN202410539511.4
申请日:2024-04-30
申请人: 合肥工业大学
IPC分类号: G10L19/018 , G10L19/02 , G10L19/008 , G10L25/30 , G06N3/0455 , G06N3/0464 , G06N3/048 , G06N3/08
摘要: 本发明提供一种深浅层信息融合的轻量级AIGC音频水印嵌入、提取方法及系统、存储介质、电子设备,涉及数字水印领域。本发明采用双模式操作进行,包含嵌入模式和提取模式,由于相应构建的神经网络模型并未繁复堆叠多层神经网络,因而训练速度和推理速度极快。此外,正因为方案具有轻量级和高效性的特点,所以还可将轻量级AIGC音频水印嵌入、提取装置与现有的合成语音模型耦合,进行音频水印的嵌入与提取任务,且不影响原模型性能和语音自然性。
-
公开(公告)号:CN118486332A
公开(公告)日:2024-08-13
申请号:CN202410085402.X
申请日:2024-01-19
申请人: 南京邮电大学
摘要: 本发明提出了一种基于音频信号的轻量化多特征提取情感识别系统及方法,该系统包括:预处理模块,用于对原始的音频信号进行预处理,输出原始信号的频域信息;梅尔滤波器组处理模块,用于将原始信号的频域信息转换为梅尔时频谱图;多特征提取模块,用于提取梅尔时频谱图中的特征;金字塔Transformer,用于接收多特征提取模块输出的多特征并输出高维编码特征;及全连接层,用于对金字塔Transformer输出的高维编码特征进行最终分类。本发明可充分提取信号频谱图的特征信息,从而提升信号分类识别精度。
-
-
-
-
-
-
-
-
-