-
公开(公告)号:CN117574973A
公开(公告)日:2024-02-20
申请号:CN202311580204.2
申请日:2023-11-24
Applicant: 中国科学院计算技术研究所 , 上海处理器技术创新中心
IPC: G06N3/0495 , G06N3/045 , G06N3/042 , G06N5/04 , G06F18/2433 , G16C20/70 , G16C20/10 , G16C10/00
Abstract: 本发明提出一种原子间势能面模型的离群点感知自适应混合精度量化方法和系统,通过对不同阶数项系数使用不同数据宽度的混合精度量化,本发明提出的离群点感知的量化方法可以有效的提高量化表示的效率;本发明提出了对由量化带来的多项式表示的误差进行系统性控制的机制与方法,并提出在误差控制的约束下实现对不同阶数项系数混合精度量化的最优量化精度自适应选择方法。本发明通过对原子间势能模型多项式系数表的数据分析,自适应地给出最优的混合精度量化方案并依据此方案对多项式系数表执行离群点感知的混合精度量化操作,提高原子间势能模型的推理规模与推理速度。
-
公开(公告)号:CN116861359A
公开(公告)日:2023-10-10
申请号:CN202310643920.4
申请日:2023-06-01
Applicant: 中国科学院计算技术研究所
IPC: G06F18/25 , G06N3/0464 , G06N3/08
Abstract: 本发明提出一种面向深度学习推理任务编译器的算子融合方法,包括:将深度学习推理任务模型的标准模型,转化为初始图级IR;遍历该初始图级IR,将该初始图级IR中的可融合算子标识为同类算子或异类算子;将该初始图级IR转化为张量表达式,融合该张量表达式中的同类算子;将该张量表达式编译为内核源码,融合该内核源码中的异类算子;将该内核源码编译为可执行代码并部署运行。本发明还提出一种面向深度学习推理任务编译器的算子融合系统,以及一种用于深度学习推理任务编译器算子融合的数据处理装置。
-
公开(公告)号:CN114265805A
公开(公告)日:2022-04-01
申请号:CN202111587285.X
申请日:2021-12-23
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供了一种PCIe交换芯片上、下游游端口路由表构建方法,用于构建上、下游端口路由表,所述方法包括:在上游端口重复执行如下步骤直至完成上游端口到所有下游端口的路由表项构建:S1、上游端口捕获与其相连的操作系统下发的与下游端口路由相关的配置包;S2、解析所述配置包中与路由相关的信息并根据解析到的路由相关信息构建上游端口路由表项;在下游端口重复执行如下步骤直至完成下游端口到其他下游端口的路由表项构建:P1、下游端口接收上游端口捕获的与其相连的操作系统下发的与下游端口路由相关的配置包;P2、解析所述配置包中与路由相关的信息并根据解析到的路由相关信息构建下游端口路由表项。
-
公开(公告)号:CN110990063B
公开(公告)日:2021-11-23
申请号:CN201911191604.8
申请日:2019-11-28
Applicant: 中国科学院计算技术研究所
Abstract: 本发明实施例提供了一种用于基因相似性分析的加速装置、方法和计算机设备,该加速装置包括高速通信接口,用于与主机通信,接收主机分发的待加速处理的任务;序列缓存模块,用于缓存来自主机的一个或者多个任务,每个任务包含待进行基因相似性分析的多个基因序列数据;阵列处理机,其上设有用于处理任务的处理单元,处理单元中设有基于数据驱动的流式计算模式处理任务的完整流水线,流水线中配置有处理任务所需的多个定点计算部件;控制模块,其被配置为用于将序列缓存模块中的待处理的任务分配给处理单元;任务缓存模块,其上设置有任务缓存单元,用于缓存分配给处理单元的待处理任务。本发明能够提高基因相似性分析的效率,快速得到分析结果。
-
公开(公告)号:CN113504874A
公开(公告)日:2021-10-15
申请号:CN202110703033.2
申请日:2021-06-24
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提出一种基于负载感知的自适应粒度纠删码编解码加速方法及系统。通过针对当前节点的编解码负载判断当前节点的计算压力,根据计算压力,区分当前的优化方向,在面向低负载时,根据最佳切分粒度分布图进行数据切分和计算,在面向高负载时,则根据任务压力进行自适应的粒度聚合。
-
公开(公告)号:CN111290767B
公开(公告)日:2021-06-08
申请号:CN202010063953.8
申请日:2020-01-20
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提出一种具有业务快速恢复功能的容器组更新方法及系统,包括:根据对容器组的更新请求,暂停该容器组的服务,通过比较更新请求和容器组当前状态,确定该容器组中待更新容器,并将该容器组中除该待更新容器以外的容器全都暂停,并将除该待更新容器以外的容器的进程持久化到磁盘;保存该待更新容器的运行状态,根据该更新请求中需要更新的容器镜像文件构建新的容器镜像,销毁该待更新容器后根据该运行状态重新运行新的容器镜像,得到更新容器,恢复运行该容器组以完成对该容器组的更新。
-
公开(公告)号:CN109376855B
公开(公告)日:2021-04-06
申请号:CN201811532813.X
申请日:2018-12-14
Applicant: 中国科学院计算技术研究所
IPC: G06N3/067
Abstract: 本发明提供一种光神经元结构和包含该结构的神经网络处理系统。该神经元结构包括突触输入调制模块、突触权值调制模块、光线聚合模块和光强度探测模块,其中,突触输入调制模块用于接收光信号并在与输入神经元关联的电信号的控制下执行光路调制;突触权值调制模块用于在与权值关联的电信号控制下执行对所述承载输入神经元的光信号进行调制;光线聚合模块用于对多个突触权值调制模块的输出光信号进行聚合;光强度探测模块用于将来自于光线聚合模块的输出光信号转换为电信号并执行激活操作。本发明的光神经元结构和包含该结构的神经网络处理系统能够实现神经网络的快速计算。
-
公开(公告)号:CN110262922B
公开(公告)日:2021-02-09
申请号:CN201910403522.9
申请日:2019-05-15
Applicant: 中国科学院计算技术研究所
Abstract: 本发明涉及一种基于副本数据日志的纠删码更新方法,包括:接收更新数据,并将其保存至数据端的副本数据日志;当该副本数据日志满时,以该更新数据和该数据块获得校验差值,以该校验差值更新对应的数据块,并将该校验差值转发至存储校验块的校验端;将该校验差值保存至该校验端的校验日志,当该校验日志满时,通过该校验差值生成校验数据,以该校验数据更新校验块。本发明提出的纠删码更新方法,在保证一致性的前提下,减少更新过程中产生的计算开销、网络开销和磁盘寻道开销,提高了纠删码的更新效率,在一些应用场景相对其他更新方法,达到1个数量级的性能提升。
-
公开(公告)号:CN108959106B
公开(公告)日:2020-12-18
申请号:CN201710353012.6
申请日:2017-05-18
Applicant: 华为技术有限公司 , 中国科学院计算技术研究所
Abstract: 本申请公开了一种内存访问方法和装置,属于存储器技术领域,所述方法包括:接收内存访问请求;所述内存访问请求用于请求访问动态随机访问存储器DRAM中的目标行;在所述目标行是弱行时,根据偏移量表和预设起始地址确定所述目标行在所述DRAM中的预留域中所对应的映射地址;所述偏移量表中包括所述DRAM中的弱行在所述预留域中所对应的地址偏移量,所述预设起始地址为所述预留域的起始地址;所述地址偏移量在所述预留域中所指向的行不是弱行;根据所述映射地址访问所述预留域;返回访问结果。解决了相关技术中总线中的刷新命令较多,可能会导致总线拥塞,降低系统的性能的问题;达到了可以避免总线拥塞,提高性能的效果。
-
公开(公告)号:CN111857833A
公开(公告)日:2020-10-30
申请号:CN202010689149.0
申请日:2020-07-16
Applicant: 中国科学院计算技术研究所 , 中国科学院大学
Abstract: 本公开提供一种并行计算智能处理器及并行计算智能处理方法,并行计算智能处理器包括:至少两个分形计算子单元根据分形计算指令进行分形计算,其中,各个分形计算子单元的结构之间具备层次同性;分形计算子单元的数量根据执行的分形计算对应的程序设定;控制器根据分形计算子单元的数量及硬件资源生成分形计算指令,并发送分形计算指令至分形计算子单元;规约运算器对分形计算结果进行规约运算,其中,规约运算的速率与分形计算子单元具有的处理器的数量成正比;并行计算智能处理器计算过程中使用到的存储总量与并行计算智能处理器具有的处理器的数量无关。
-
-
-
-
-
-
-
-
-