-
公开(公告)号:CN116108911A
公开(公告)日:2023-05-12
申请号:CN202310127409.9
申请日:2023-02-17
Applicant: 南京邮电大学
Abstract: 本发明公开了一种深度学习模型的压缩方法、装置及存储介质,包括:获取待压缩的深度学习模型;利用自适应阈值选择器分别对模型各层的权重参数张量和其对应的剪枝阈值向量进行相似度计算,获得模型各层的剪枝自适应阈值;利用自适应细粒度选择器分别对模型各层的权重参数张量进行聚类,获得模型各层的自适应剪枝区域坐标;判断各个自适应剪枝区域的L1范数是否小于对应的剪枝自适应阈值,若是,则将其对应层的自适应剪枝区域坐标的剪枝掩码置为0;若否,将其剪枝掩码置为1;将模型各层中剪枝掩码置为0的自适应剪枝区域坐标对应的权重进行剪枝,得到压缩后的深度学习模型。本发明能够在剪枝效率和剪枝后模型的精度间保持平衡,提高模型计算速度。