-
公开(公告)号:CN111861860B
公开(公告)日:2023-04-21
申请号:CN202010713775.9
申请日:2020-07-23
Applicant: 哈尔滨工业大学(威海)
IPC: G06T1/20
Abstract: 本发明提出了一种面向AI智能SOC芯片的图像加速处理系统,其中包括任务分析模块,任务链接模块,内部节点优化模块和寻找解决方案模块。本发明可以实现对图像处理的加速,并且可以解决传统SOC芯片对同一图像多次处理过程中I/O读写次数高,芯片内ALU利用不充分,只能针对单一节点进行优化,无法实现一个系统级的最优解决方案等问题。本发明的有益效果:能够分析本次图像处理所需要的处理任务,并且找到处理任务不同的实现方案,依据各个处理任务之间的数据依赖关系,将任务链接成一个整体的解决方案,再通过内部节点优化拆分组合任务节点,最后通过分析各种解决方案对AI智能SOC芯片内部ALU的利用率,找到最优的解决方案,提高系统性能。
-
公开(公告)号:CN111860818B
公开(公告)日:2022-11-08
申请号:CN202010714776.5
申请日:2020-07-23
Applicant: 哈尔滨工业大学(威海)
Abstract: 本发明提出了一种基于智能芯片的自组织特征映射神经网络(Self‑organizing Map,SOM)算法处理方法。SOM神经网络是无监督机器学习中一种经典的聚类算法,在图像处理、数据挖掘、深度学习有广泛的应用。本发明将SOM神经网络算法划分成不存在数据依赖的多个步骤,这个过程在下文中称为Kernel的划分。在保证每个步骤高并行度的情况下,将各个步骤在GPU上实现,对应下文里Kernel的分步骤实现与优化。在单个Kernel在GPU上完成高效的实现后,再将所有的步骤整合为一个Kernel。对整合后的Kernel进行深度优化,并将各个分步骤整合迭代的过程中,使用全局同步的方法,最终实现了一个可以在GPU端单次Kernel启动即可完成的高效的SOM神经网络算法。
-
公开(公告)号:CN111861860A
公开(公告)日:2020-10-30
申请号:CN202010713775.9
申请日:2020-07-23
Applicant: 哈尔滨工业大学(威海)
IPC: G06T1/20
Abstract: 本发明提出了一种面向AI智能SOC芯片的图像加速处理系统,其中包括任务分析模块,任务链接模块,内部节点优化模块和寻找解决方案模块。本发明可以实现对图像处理的加速,并且可以解决传统SOC芯片对同一图像多次处理过程中I/O读写次数高,芯片内ALU利用不充分,只能针对单一节点进行优化,无法实现一个系统级的最优解决方案等问题。本发明的有益效果:能够分析本次图像处理所需要的处理任务,并且找到处理任务不同的实现方案,依据各个处理任务之间的数据依赖关系,将任务链接成一个整体的解决方案,再通过内部节点优化拆分组合任务节点,最后通过分析各种解决方案对AI智能SOC芯片内部ALU的利用率,找到最优的解决方案,提高系统性能。
-
公开(公告)号:CN111860818A
公开(公告)日:2020-10-30
申请号:CN202010714776.5
申请日:2020-07-23
Applicant: 哈尔滨工业大学(威海)
Abstract: 本发明提出了一种基于智能芯片的自组织特征映射神经网络(Self-organizing Map,SOM)算法处理方法。SOM神经网络是无监督机器学习中一种经典的聚类算法,在图像处理、数据挖掘、深度学习有广泛的应用。本发明将SOM神经网络算法划分成不存在数据依赖的多个步骤,这个过程在下文中称为Kernel的划分。在保证每个步骤高并行度的情况下,将各个步骤在GPU上实现,对应下文里Kernel的分步骤实现与优化。在单个Kernel在GPU上完成高效的实现后,再将所有的步骤整合为一个Kernel。对整合后的Kernel进行深度优化,并将各个分步骤整合迭代的过程中,使用全局同步的方法,最终实现了一个可以在GPU端单次Kernel启动即可完成的高效的SOM神经网络算法。
-
-
-