-
公开(公告)号:CN111831333B
公开(公告)日:2024-03-29
申请号:CN202010689147.1
申请日:2020-07-16
Applicant: 中国科学院计算技术研究所
Abstract: 本公开提供一种用于智能处理器的指令分解方法、装置及电子设备,所述智能处理器根据分形指令进行分形运算,所述方法包括:确定对所述分形指令的操作数进行分解的维度的分解优先级;根据所述分解优先级选择当前分解的维度;在所述当前分解的维度上,对所述分形指令的操作数进行串行分解。该指令分解方法,能够在合理时间范围内找到最佳分解方案,依据最佳分解方案,串行分解器按照粒度循环输出指令模板,通过累加,计算分解出的子指令中各操作数的地址,从而提高分形运算的并行效率。
-
公开(公告)号:CN117689912A
公开(公告)日:2024-03-12
申请号:CN202211013747.1
申请日:2022-08-23
Applicant: 中国科学院计算技术研究所
IPC: G06V10/762 , B25J9/16 , G06N3/0464 , G06N3/08 , G06V10/82
Abstract: 本发明提出一种基于对象的强化学习方法和系统,包括:智能体采集在当前所处环境的观测图像,从该观测图像中识别出对象的位置,并对其进行无监督聚类,得到各对象的类别标签;以该对象的类别标签为监督,通过卷积神经网络对该观测数据进行对象抽取,得到该观测图像的对象表示;基于该观测图像的对象表示,构建该观测图像中对象间的关系,作为该观测图像的特征向量,基于该特征向量执行学习策略,得到目标动作,该智能体执行该目标动作与该环境产生交互。该发明可以提升强化学习中策略的推理能力,使其具备较高的泛化能力。
-
公开(公告)号:CN115422531A
公开(公告)日:2022-12-02
申请号:CN202210940140.1
申请日:2022-08-05
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提出一种对抗补丁检测定位硬件架构,包括:深度神经网络加速器,用于输出视频帧的浅层特征图,以及输出对该视频帧和遮挡图像进行识别的识别结果;该遮挡图像为以掩膜窗口对该视频帧进行遮挡后的图像;掩膜窗口搜索单元,用于从该视频帧的浅层特征图中选取该掩膜窗口;投票逻辑单元,用于对所有该遮挡图像的识别结果进行投票,并根据投票结果确定该视频帧中对抗补丁的位置。以及一种基于该对抗补丁检测定位硬件架构的对抗补丁检测定位方法。
-
公开(公告)号:CN114697655A
公开(公告)日:2022-07-01
申请号:CN202011611154.6
申请日:2020-12-30
Applicant: 中国科学院计算技术研究所
IPC: H04N19/122 , H04N19/124 , H04N19/13 , H04N19/42 , G06N3/08
Abstract: 本发明提出一种基于均衡流间压缩速度的神经网络量化压缩方法,包括:步骤1、获取经过量化处理后待压缩的神经网络数据,对神经网络数据进行分块,得到多个数据块;步骤2、对每一个数据块分配一个数据流进行压缩,每条数据流的压缩包括:对数据块进行游程全零编码,得到游程压缩数据,其中游程全零编码仅对神经网络数据中的零字符进行游程编码,对游程压缩数据进行规范化哈夫曼编码,并对编码结果进行重整,得到规范哈夫曼编码,作为数据块的压缩结果;步骤2包括:步骤21、监测各数据流已经压缩编码的数据量,向当前编码速度快的数据流的输出缓存写入虚字符对应的虚编码。均衡流间压缩速度,缩小流水线之间的编码差距,进而避免产生死锁。
-
公开(公告)号:CN108416437B
公开(公告)日:2021-08-03
申请号:CN201810249510.0
申请日:2016-04-18
Applicant: 中国科学院计算技术研究所
Abstract: 本公开提供了一种用于乘加运算的人工神经网络的处理系统及方法,其中,所述人工神经网络的处理系统,包括:多核心处理模块,其包括多个核心处理模块,用于执行神经网络运算中的乘加运算。本公开用于乘加运算的人工神经网络的处理系统及方法,其在神经网络处理系统中引入多核设计,从而提升神经网络处理系统的运算速度,使得神经网络处理系统性能更高,更加高效。
-
公开(公告)号:CN108416436B
公开(公告)日:2021-06-01
申请号:CN201810249470.X
申请日:2016-04-18
Applicant: 中国科学院计算技术研究所
Abstract: 本公开提供了一种使用多核心处理模块进行神经网络划分的方法及其系统,其中,人工神经网络的处理系统,包括:多核心处理模块,其包括多个核心处理模块;其中,所述神经网络根据多核处理模式进行神经网络划分,包括:从输入神经元划分、输出神经元划分和权值连接划分。本公开使用多核心处理模块进行神经网络划分的方法及其系统,其在神经网络处理系统中引入多核设计,从而提升神经网络处理系统的运算速度,使得神经网络处理系统性能更高,更加高效。
-
公开(公告)号:CN111831582A
公开(公告)日:2020-10-27
申请号:CN202010689148.6
申请日:2020-07-16
Applicant: 中国科学院计算技术研究所
Abstract: 本公开提供一种用于智能处理器的内存管理装置及方法,装置包括:循环内存段,包括第一内存区域、第二内存区域及第三内存区域,分别用于所述智能处理器进行运算过程中的分形运算、规约运算、数据装载及写回时调用;静态内存段,包括第四内存区域及第五内存区域,用于存储所述智能处理器进行运算时输入的分形指令。基于指令执行生命周期的差别,将智能处理器控制系统内存进行分类管理,可提高智能处理器的执行效率,并且,内存管理装置中增加张量置换单元可以进一步显著改善智能处理器的执行效率,同时数据一致性也得以维护。
-
公开(公告)号:CN111831339A
公开(公告)日:2020-10-27
申请号:CN202010688860.4
申请日:2020-07-16
Applicant: 中国科学院计算技术研究所
IPC: G06F9/38
Abstract: 本公开提供一种用于智能处理器的指令执行方法及装置,方法包括:指令译码,将执行分形运算的串行分解子指令译码为本地指令及分形运算指令;数据装载,将分形运算所需数据从外部存储单元读取至智能处理器的本地存储单元;操作执行,根据分形运算指令对数据完成分形运算;规约执行,根据本地指令对分形运算的结果进行规约运算;数据写回,将本地存储器中存储的规约运算结果读取至外部存储器;指令译码、数据装载、操作执行、规约执行及数据写回按照流水线方式执行。该方法可以在任意时将全部层次上的全部模块调动起来,提供了智能处理器的数据吞吐率,从而提高了智能处理器的执行效率。
-
公开(公告)号:CN111831332A
公开(公告)日:2020-10-27
申请号:CN202010689114.7
申请日:2020-07-16
Applicant: 中国科学院计算技术研究所 , 中国科学院大学
Abstract: 本公开提供一种用于智能处理器的控制系统,智能处理器的每一层分形计算子单元包括控制系统,控制系统包括:串行分解模块,用于对智能处理器执行分形运算对应的分形指令集进行串行分解,得到串行分解子指令,并对串行分解子指令进行暂存;降级模块,用于对串行分解子指令进行降级,将上一层分形计算子单元对当前层分形计算子单元下发的串行分解子指令修改为当前层分形计算子单元对下一层分形计算子单元下发的串行分解子指令;并行分解模块,用于对降级后的串行分解子指令进行并行分解,得到满足智能处理器中所有分形计算子单元并发运行的并发度要求的并行分解子指令。该控制系统可以高效、准确地控制智能处理器执行分形运算及规约运算。
-
公开(公告)号:CN108416436A
公开(公告)日:2018-08-17
申请号:CN201810249470.X
申请日:2016-04-18
Applicant: 中国科学院计算技术研究所
Abstract: 本公开提供了一种使用多核心处理模块进行神经网络划分的方法及其系统,其中,人工神经网络的处理系统,包括:多核心处理模块,其包括多个核心处理模块;其中,所述神经网络根据多核处理模式进行神经网络划分,包括:从输入神经元划分、输出神经元划分和权值连接划分。本公开使用多核心处理模块进行神经网络划分的方法及其系统,其在神经网络处理系统中引入多核设计,从而提升神经网络处理系统的运算速度,使得神经网络处理系统性能更高,更加高效。
-
-
-
-
-
-
-
-
-