-
公开(公告)号:CN115329125A
公开(公告)日:2022-11-11
申请号:CN202210954490.3
申请日:2022-08-10
申请人: 成都开心音符科技有限公司
发明人: 马星宇
IPC分类号: G06F16/65 , G06F16/683
摘要: 本申请涉及音频处理技术领域,尤其涉及一种歌曲串烧拼接方法和装置,其方法包括获取N个音频文件,确定每一所述音频文件的特征信息,并依据所述特征信息将所述音频文件进行分类,得到分类后的音频文件集,在同一所述音频文件集中提取每一所述音频文件的副歌音频数据;依据预设的音效处理规则对所述副歌音频数据进行音效处理,得到待拼接的目标歌曲片段,依据所述目标歌曲片段生成目标串烧歌曲;上述技术方案直接使用音频数据,将多个音频文件分类并提取同类别音频文件中的副歌音频数据,依据音效处理规则对副歌音频数据处理,而后将处理后的副歌音频数据进行拼接得到串烧歌曲,该串烧歌曲听感上更加自然,且相较于获取midi数据成本上更低。
-
公开(公告)号:CN117198252A
公开(公告)日:2023-12-08
申请号:CN202311238966.4
申请日:2023-09-25
申请人: 成都开心音符科技有限公司
发明人: 马星宇
IPC分类号: G10H1/00
摘要: 本发明公开了一种基于歌词和旋律的端到端音乐音频生成的方法,涉及多媒体内容处理技术领域。该方法包括对音频文件、音乐的原始信息以及音乐评论信息进行处理,将提取音频文件中的歌词和旋律并将信息进行合并,将处理后的音乐原始信息、合并后的音频信息和音乐评论信息进行特征融合,将特征融合后的信息输入模型进行训练,经模型后输出隐层特征并经过声音信号模型语音分析合成系统输出wav格式音频,优化了现有直接生成音频的音乐生成模型的输入端,并将文本转语音或者歌声合成的思想用到了音乐生成领域,采用更精细的数据处理方式,让数据的分布尽量集中,从而使得模型更容易收敛。
-