-
公开(公告)号:CN118916608A
公开(公告)日:2024-11-08
申请号:CN202410709631.4
申请日:2024-06-03
Applicant: 北京邮电大学
IPC: G06F18/10 , G10L25/30 , G10L25/03 , G06F18/213 , G06N3/08 , G06N3/0464 , G06F123/02
Abstract: 本发明提出了一种基于扩散模型的次声数据增强方法及装置。该方法包括:数据清洗装置、扩散装置、反向扩散装置和数据增强装置。数据清洗装置通过事件检测处理原始数据,得到训练数据集。扩散装置使用扩散过程对训练数据集加噪,得到加噪数据集;根据事件发生时间等因素动态调整加噪粒度,使加噪数据趋向于特定分布。反向扩散装置使用反向扩散过程还原加噪数据,得到还原数据集;为解决联合网络(UNet)无法捕获训练数据集的峰值特征和频域特征的问题,引入了混合注意力机制,包括时域和频域自注意力机制,改善数据增强的效果。数据增强装置通过噪声生成器生成随机噪声输入到反向扩散装置,最后得到增强后的数据集。