-
公开(公告)号:CN118196600B
公开(公告)日:2024-07-12
申请号:CN202410615399.8
申请日:2024-05-17
Applicant: 南京信息工程大学
IPC: G06V10/82 , G06N3/0464 , G06N3/084 , G06N3/006
Abstract: 本发明提供了基于差分进化算法的神经架构搜索方法和系统,所述方法首先定义了一个搜索空间,将所有候选操作糅合在一起构建超网,并使用连续数值进行编码。接着,利用训练数据及其标签来训练超网的网络权重。然后,我为超网内的每个子网设计了唯一的编码方式,并直接从超网获得网络权重。随后,使用差分进化算法优化子网的编码。最后,交替执行超网的网络权重优化和子网的编码优化。与使用梯度下降方法和遗传算法优化子网编码的方式不同,本发明的差分进化算法能够更充分地利用连续编码的矢量化信息。这种方法相比传统的优化方法具有更高的效率和更好的搜索性能,能够更快地找到适合任务的最优神经网络架构。
-
公开(公告)号:CN118196600A
公开(公告)日:2024-06-14
申请号:CN202410615399.8
申请日:2024-05-17
Applicant: 南京信息工程大学
IPC: G06V10/82 , G06N3/0464 , G06N3/084 , G06N3/006
Abstract: 本发明提供了基于差分进化算法的神经架构搜索方法和系统,所述方法首先定义了一个搜索空间,将所有候选操作糅合在一起构建超网,并使用连续数值进行编码。接着,利用训练数据及其标签来训练超网的网络权重。然后,我为超网内的每个子网设计了唯一的编码方式,并直接从超网获得网络权重。随后,使用差分进化算法优化子网的编码。最后,交替执行超网的网络权重优化和子网的编码优化。与使用梯度下降方法和遗传算法优化子网编码的方式不同,本发明的差分进化算法能够更充分地利用连续编码的矢量化信息。这种方法相比传统的优化方法具有更高的效率和更好的搜索性能,能够更快地找到适合任务的最优神经网络架构。
-