-
公开(公告)号:CN119150925B
公开(公告)日:2025-03-14
申请号:CN202411673668.2
申请日:2024-11-21
Applicant: 南京信息工程大学
IPC: G06N3/045 , G06N3/0464 , G06N3/0475 , G06N3/084
Abstract: 本发明提供了基于混合卷积操作的生成对抗网络架构搜索方法和系统,所述方法首先设计了一个广阔的搜索空间,进而构建一个融合了所有候选操作的超网,并将超网通过连续松弛的方法使其训练过程完全可微,从而利用梯度下降方法进行高效的训练,最后,选取各个位置上表现最佳的操作来获得最优架构。与传统的架构搜索方法不同,本发明在搜索空间中引入了新颖的混合卷积操作,并通过集成部分通道注意力机制优化了搜索过程。本发明的基于混合卷积操作的生成对抗网络架构搜索增强了网络对长距离信息的捕捉能力与架构搜索速度,这种方法相比传统的搜索方法具有更高的效率和更好的性能,能够更快地找到适合任务的最优神经网络架构。
-
公开(公告)号:CN119150925A
公开(公告)日:2024-12-17
申请号:CN202411673668.2
申请日:2024-11-21
Applicant: 南京信息工程大学
IPC: G06N3/045 , G06N3/0464 , G06N3/0475 , G06N3/084
Abstract: 本发明提供了基于混合卷积操作的生成对抗网络架构搜索方法和系统,所述方法首先设计了一个广阔的搜索空间,进而构建一个融合了所有候选操作的超网,并将超网通过连续松弛的方法使其训练过程完全可微,从而利用梯度下降方法进行高效的训练,最后,选取各个位置上表现最佳的操作来获得最优架构。与传统的架构搜索方法不同,本发明在搜索空间中引入了新颖的混合卷积操作,并通过集成部分通道注意力机制优化了搜索过程。本发明的基于混合卷积操作的生成对抗网络架构搜索增强了网络对长距离信息的捕捉能力与架构搜索速度,这种方法相比传统的搜索方法具有更高的效率和更好的性能,能够更快地找到适合任务的最优神经网络架构。
-