基于结构搜索和知识蒸馏的卷积神经网络模型压缩方法和装置

    公开(公告)号:CN117114053B

    公开(公告)日:2024-06-21

    申请号:CN202311073117.8

    申请日:2023-08-24

    Abstract: 本发明公开了一种基于结构搜索和知识蒸馏的卷积神经网络模型压缩的方法和装置,包括以下步骤:获取目标任务数据集;从目标任务数据集划分出训练集,利用训练集对卷积神经网络模型进行训练;卷积神经网络模型完成训练后作为教师网络;利用神经结构搜索技术对卷积神经网络模型搜索出轻量化网络结构;将搜索得到的轻量化网络结构作为学生网络;进行知识蒸馏,计算教师网络和学生网络Softmax层输出的差异,将差异作为学生网络损失的一部分,对学生网络进行迭代训练直至收敛;输出知识蒸馏后的学生网络模型,即压缩完成的模型。本发明方法能有效减少模型冗余参数,实现自动对学生网络模型进行设计,适用于高效和自适应的模型压缩应用场景。

    降低神经网络推理所需内存占用量的重计算方法和系统

    公开(公告)号:CN117009093B

    公开(公告)日:2024-03-12

    申请号:CN202311278523.8

    申请日:2023-10-07

    Abstract: 降低神经网络推理所需内存占用量的重计算方法和系统,包括:通过神经网络模型的计算图构建有向无环图#imgabs0#;基于有向无环图#imgabs1#,获得重计算对集合#imgabs2#;对重计算对集合#imgabs3#进行幂集操作。根据幂集中的每一个元素#imgabs4#,对图#imgabs5#进行附加属性得到对应的图#imgabs6#;基于图#imgabs7#,进行涉及重计算策略的调度算法;在全部#imgabs8#的调度结果中,选择内存占用量最低的调度。在边缘设备智能性的需求逐渐加重的背景下,边缘设备的运行内存十分宝贵的场景下,本发明以增加额外计算代价的方式获得神经网络推理时更小的内存占用量,对边缘智能的普适性有着贡献。

    降低神经网络推理所需内存占用量的重计算方法和系统

    公开(公告)号:CN117009093A

    公开(公告)日:2023-11-07

    申请号:CN202311278523.8

    申请日:2023-10-07

    Abstract: 降低神经网络推理所需内存占用量的重计算方法和系统,包括:通过神经网络模型的计算图构建有向无环图#imgabs0#;基于有向无环图#imgabs1#,获得重计算对集合#imgabs2#;对重计算对集合#imgabs3#进行幂集操作。根据幂集中的每一个元素#imgabs4#,对图#imgabs5#进行附加属性得到对应的图#imgabs6#;基于图#imgabs7#,进行涉及重计算策略的调度算法;在全部#imgabs8#的调度结果中,选择内存占用量最低的调度。在边缘设备智能性的需求逐渐加重的背景下,边缘设备的运行内存十分宝贵的场景下,本发明以增加额外计算代价的方式获得神经网络推理时更小的内存占用量,对边缘智能的普适性有着贡献。

    一种基于目标框的大尺寸图像自适应裁剪方法和装置

    公开(公告)号:CN116071556B

    公开(公告)日:2023-07-07

    申请号:CN202310311383.3

    申请日:2023-03-28

    Abstract: 本发明公开了一种基于目标框的大尺寸图像自适应裁剪方法和装置,基于包含目标框的训练样本图像和未标注的测试样本图像,从训练样本中分层采样部分数据作为验证样本,使用循环聚类算法提取训练样本图像的目标框特征集合,使用验证样本对目标框特征集合筛选并验证,得到最优的自适应的目标框特征集合,以此作为滑窗平铺裁剪的重叠像素基准,将大图裁剪成多个子图。该方法提出了多尺度融合的特征提取改进算法、新的特征筛选算法及裁剪评价函数,优化了滑窗平铺裁剪算法,一定程度上解决了大尺寸图像裁剪预处理过程中的关键信息丢失,裁剪子图数量多、信息冗余,耗时长的问题。

    一种用于恶劣环境的复杂光学图像增强方法、装置和介质

    公开(公告)号:CN116029947B

    公开(公告)日:2023-06-23

    申请号:CN202310326767.2

    申请日:2023-03-30

    Abstract: 本发明公开了一种用于恶劣环境的复杂光学图像增强方法、装置和介质,该方法具体为:首先利用不同光照因素下的图像形成实验数据集;然后构建多种注意力模块提升图像纹理细节;其次构建特征‑图像匹配融合模块增强特征表征能力,增强模型全局感知能力;再搭建多尺度神经网络模型实现对复杂恶劣光照场景下的图像增强;然后使用数据样本训练生成对抗网络,构建对抗增强网络模型并输出增强后的图像;最后将预训练后的模型部署在TVM的设备上,根据特定设备和工作负载自动调整优化模型并获得最佳性能,在计算资源不足的设备中依旧可以提供快速且准确的推理模型。本发明能够对复杂光照因素引起的图像失真模糊进行重构增强,提高图像的增强效果。

    基于Transformer的InSAR技术冻土区多变量时序形变预测方法及装置

    公开(公告)号:CN114966692A

    公开(公告)日:2022-08-30

    申请号:CN202210844540.2

    申请日:2022-07-19

    Abstract: 本发明公布了一种基于Transformer的InSAR技术多年冻土区多变量时序形变预测方法,包括:获取冻土区时序SAR图像进行预处理和差分干涉流程并构建InSAR形变模型;进行多时相InSAR数据处理,得到多维时序形变数据;对多维时序形变数据进行滤波平滑处理,根据现有冻土分布图和聚类分析提取出不同冻土区时序形变结果;建立基于不同冻土区的时序形变数据和地表、日空气温度数据、土壤含水量的多变量时序Tranformer预测模型;对该模型进行训练,并对不同类型冻土区的形变规律进行预测和获取InSAR时序形变预测结果。本发明能够实现多年冻土区不同冻土类型时序形变有效预测,具有形变预测范围大,预测精度高等优势,可应用于多变量InSAR时序形变预测,填补了多年冻土区时序形变预测的空白。

    基于CPU-GPU异构并行的地表形变反演方法与系统

    公开(公告)号:CN114814843A

    公开(公告)日:2022-07-29

    申请号:CN202210734885.2

    申请日:2022-06-27

    Inventor: 王京 李超 刁博宇

    Abstract: 本发明公开了一种基于CPU‑GPU异构并行的InSAR分布式散射体干涉技术的地表形变反演方法和系统,基于CPU‑GPU异构硬件的并行编程模型OpenMP+CUDA,实现高效的InSAR分布式散射体干涉技术的处理流程,并提出了不同算法结构和数据结构的多层级并行方法。本发明创新性地运用CPU‑GPU异构硬件实现了较高并行性能的分布式散射体干涉技术,提高了InSAR技术的解算效率和速度,突破了分布式散射体干涉技术快速解算的技术瓶颈,该方法可应用于自然地表大区域的形变反演。

    一种基于贪心策略反向通道剪枝的图像处理方法及装置

    公开(公告)号:CN116992945B

    公开(公告)日:2024-02-13

    申请号:CN202311257346.5

    申请日:2023-09-27

    Inventor: 刁博宇 杨雨 李超

    Abstract: 本发明公开了一种基于贪心策略反向通道剪枝的图像处理方法及装置,该方法包括:获取图像数据集和待剪枝图像处理网络,对待剪枝图像处理网络进行预训练,得到预训练模型,其中预训练过程中所使用的图像集与图像数据集分布相似或相同;将预训练模型划分为特征提取量化模块和输出模块,其中特征提取量化模块作为剪枝对象;根据基于贪心策略的通道选择方法对特征提取量化模块进行反向的逐层通道剪枝,并在每层剪枝完成后进行预定轮次的微调;对进行反向的逐层通道剪枝后的预训练模型在图像数据集上进行一定轮次的微调,得到微调后的图像(56)对比文件吴雨茜;王俊丽;杨丽;余淼淼.代价敏感深度学习方法研究综述.计算机科学.2019,(05),全文.

    基于结构搜索和知识蒸馏的卷积神经网络模型压缩方法和装置

    公开(公告)号:CN117114053A

    公开(公告)日:2023-11-24

    申请号:CN202311073117.8

    申请日:2023-08-24

    Abstract: 本发明公开了一种基于结构搜索和知识蒸馏的卷积神经网络模型压缩的方法和装置,包括以下步骤:获取目标任务数据集;从目标任务数据集划分出训练集,利用训练集对卷积神经网络模型进行训练;卷积神经网络模型完成训练后作为教师网络;利用神经结构搜索技术对卷积神经网络模型搜索出轻量化网络结构;将搜索得到的轻量化网络结构作为学生网络;进行知识蒸馏,计算教师网络和学生网络Softmax层输出的差异,将差异作为学生网络损失的一部分,对学生网络进行迭代训练直至收敛;输出知识蒸馏后的学生网络模型,即压缩完成的模型。本发明方法能有效减少模型冗余参数,实现自动对学生网络模型进行设计,适用于高效和自适应的模型压缩应用场景。

    一种自适应加速算子融合的方法及装置

    公开(公告)号:CN115659281B

    公开(公告)日:2023-10-27

    申请号:CN202211461190.8

    申请日:2022-11-16

    Abstract: 本发明公开了一种自适应加速算子融合的方法及装置,该方法包括:首先将神经网络抽象成计算图的形式;其次为图节点添加关键属性进行图赋权,并为赋权后计算图中的每个算子定义状态;然后基于包含状态信息的算子,设计基于深度强化学习的关键参与者算子节点自适应计算方法;最后基于关键参与者算子节点对计算图中的算子进行融合优化,对每一个计算图中的关键参与者算子最优融合方法进行探索,其余算子融合在关键参与者算子最优融合方案下进行探索,最终确定整个神经网络每个算子的最优融合方案。本发明能够大幅减少编译器搜索算子融合优化空间的时间,并且可面向更深更复杂的网络,具有较强的扩展性与重构性。

Patent Agency Ranking