-
公开(公告)号:CN118098252A
公开(公告)日:2024-05-28
申请号:CN202311764705.6
申请日:2023-12-20
Applicant: 华南农业大学
IPC: G10L21/007 , G10L21/0216 , G10L21/0232 , G10L19/02 , G10L19/16
Abstract: 本申请涉及一种粤剧音频修复方法、装置、设备及介质,方法包括:获取待修复粤剧音频片段信号;基于特征工程对粤剧音频片段信号进行高维嵌入,在特征空间中采用短时傅立叶变换谱将粤剧音频片段信号转化为高维特征信号;调用预训练的粤剧音频修复模型,将高维特征信号输入至粤剧音频修复模型,以concat连接方式融合初始状态的纯噪声特征信号,采用模型中同一个生成器的复用逐渐进行逆扩散,以不断消除特征信号的噪声,直至输出修复后的高维特征信号;进行逆向特征工程,将生成的修复后高维特征信号转化为音频信号,输出修复后的粤剧音频信号,以完成粤剧音频的修复。本申请能够节约了大量的人力资源成本,大大提高了粤剧音频修复的工作效率。
-
公开(公告)号:CN114067788B
公开(公告)日:2024-12-31
申请号:CN202111313774.6
申请日:2021-11-08
Applicant: 华南农业大学
Abstract: 本发明提供了一种基于CNN和LSTM结合的粤剧唱腔分类方法,包括:构建分类网络模型:设置级联卷积神经网络Inception‑CNN为一级网络,设置CNN‑双层LSTM神经网络为二级网络,一级网络的输出连接二级网络的输入;利用分类网络模型进行粤剧唱腔分类:通过特征工程对各唱段粤剧音频信号的梅尔频谱提取梅尔频谱MFCC特征;将梅尔频谱MFCC特征输入至一级网络融合各唱段粤剧音频信号的浅层和深层特征;二级网络学习各唱段粤剧音频信号之间的内在特征,提取上下文关联语义,预测出粤剧唱腔类别。本发明基于多层特征级联卷积神经网络和长短时记忆单元结合的粤剧唱腔分类方法,更加贴合粤剧唱腔特性,充分提取粤剧特征,达到精准分类的效果,表达全面,更加符合实际应用需求。
-
公开(公告)号:CN114067788A
公开(公告)日:2022-02-18
申请号:CN202111313774.6
申请日:2021-11-08
Applicant: 华南农业大学
Abstract: 本发明提供了一种基于CNN和LSTM结合的粤剧唱腔分类方法,包括:构建分类网络模型:设置级联卷积神经网络Inception‑CNN为一级网络,设置CNN‑双层LSTM神经网络为二级网络,一级网络的输出连接二级网络的输入;利用分类网络模型进行粤剧唱腔分类:通过特征工程对各唱段粤剧音频信号的梅尔频谱提取梅尔频谱MFCC特征;将梅尔频谱MFCC特征输入至一级网络融合各唱段粤剧音频信号的浅层和深层特征;二级网络学习各唱段粤剧音频信号之间的内在特征,提取上下文关联语义,预测出粤剧唱腔类别。本发明基于多层特征级联卷积神经网络和长短时记忆单元结合的粤剧唱腔分类方法,更加贴合粤剧唱腔特性,充分提取粤剧特征,达到精准分类的效果,表达全面,更加符合实际应用需求。
-
公开(公告)号:CN116935296A
公开(公告)日:2023-10-24
申请号:CN202310901547.8
申请日:2023-07-21
Applicant: 华南农业大学
IPC: G06V20/50 , G06V10/82 , G06V10/80 , G06V10/26 , G06V20/70 , G06V10/764 , G06N3/0464 , G06N3/048 , G06N3/082
Abstract: 本发明公开了一种基于多任务深度学习的果园环境场景检测方法及终端,方法包括采集果园环境图像并构建数据集;将果园环境图像输入至改进的MobileNetv3主干网络中,依次通过CBS层和改进的bneck模块得到输出特征图;输出特征图通过空间金字塔池SPP模块生成并融合不同尺度特征,通过特征金字塔网络FPN模块生成并融合不同语义层次特征;生成不同尺度特征和不同语义层次特征后的图像同时通过目标检测解码头和语义分割解码头进行解码,通过目标检测解码头得到检测目标,通过语义分割解码头分割出可行驶区域。本发明将语义分割和目标检测任务联合进行处理,从而实现了对果园可行驶区域、障碍物的同时识别。
-
-
-