-
公开(公告)号:CN111160523B
公开(公告)日:2023-11-03
申请号:CN201911293683.3
申请日:2019-12-16
Applicant: 上海交通大学
IPC: G06V10/28 , G06V10/22 , G06V10/82 , G06N3/0464 , G06N3/082
Abstract: 本发明提供了一种基于特征值区域的动态量化方法,包括:步骤1:定位输入特征图中的敏感区域和非敏感区域;步骤2:对敏感区域和非敏感区域执行混合精度卷积;步骤3:将卷积结果提供给激活层和池化层;步骤4:在不同敏感度区域之间进行切换。本发明对输入特征图和权重进行量化,进而可以更好地保留NN的准确率;DRQ可以支持层内、甚至逐像素的量化,这种细粒度的量化策略为量化提供了更大的自由,可以在尽可能降低计算精度的情况下保证NN准确率。
-
公开(公告)号:CN111160523A
公开(公告)日:2020-05-15
申请号:CN201911293683.3
申请日:2019-12-16
Applicant: 上海交通大学
Abstract: 本发明提供了一种基于特征值区域的动态量化方法,包括:步骤1:定位输入特征图中的敏感区域和非敏感区域;步骤2:对敏感区域和非敏感区域执行混合精度卷积;步骤3:将卷积结果提供给激活层和池化层;步骤4:在不同敏感度区域之间进行切换。本发明对输入特征图和权重进行量化,进而可以更好地保留NN的准确率;DRQ可以支持层内、甚至逐像素的量化,这种细粒度的量化策略为量化提供了更大的自由,可以在尽可能降低计算精度的情况下保证NN准确率。
-
公开(公告)号:CN111831429B
公开(公告)日:2024-04-02
申请号:CN202010534263.6
申请日:2020-06-11
Applicant: 上海交通大学
Abstract: 本发明提供一种基于SIMT编程模型的张量化并行计算方法,基于主机端、转换单元和设备端之间的交互,将设备端的数据处理单元由标量转换为张量元,实现对数据的张量化运算处理,拓展了SIMT编程模型所适用的异构平台的范围,提高了编程模型的通用性,灵活性和便捷性;以及在执行任务指令时,对检测到的为对张量元运算处理的任务指令,通过调用预先封装的小核函数进行运算处理,既提高了底层计算的效率,又方便了计算调度的实现。
-
公开(公告)号:CN111401522B
公开(公告)日:2023-08-15
申请号:CN202010171246.0
申请日:2020-03-12
Applicant: 上海交通大学
IPC: G06N3/0464 , G06F9/30
Abstract: 本发明公开了一种脉动阵列变速控制方法和可变速脉动阵列微框架系统,其中方法包括:脉动阵列包括至少两个处理单元;方法包括:获取脉动阵列中所有处理单元的待转变精度模式;确定所有待转变精度模式中处理单元处理所需时长最长的处理周期,并将其作为脉动阵列的下一运行周期;在处理单元的下一实际处理周期后设置数个阻塞周期,以使得所有处理单元的下一处理周期的时长与脉动阵列的下一运行周期的时长相等。本发明可实现在多种精度下灵活切换,且每个固定周期下,脉动阵列内部的处理单元的精度可以是不同的,进而加速卷积神经网络的推理过程。
-
公开(公告)号:CN111831429A
公开(公告)日:2020-10-27
申请号:CN202010534263.6
申请日:2020-06-11
Applicant: 上海交通大学
Abstract: 本发明提供一种基于SIMT编程模型的张量化并行计算方法,基于主机端、转换单元和设备端之间的交互,将设备端的数据处理单元由标量转换为张量元,实现对数据的张量化运算处理,拓展了SIMT编程模型所适用的异构平台的范围,提高了编程模型的通用性,灵活性和便捷性;以及在执行任务指令时,对检测到的为对张量元运算处理的任务指令,通过调用预先封装的小核函数进行运算处理,既提高了底层计算的效率,又方便了计算调度的实现。
-
公开(公告)号:CN111401522A
公开(公告)日:2020-07-10
申请号:CN202010171246.0
申请日:2020-03-12
Applicant: 上海交通大学
Abstract: 本发明公开了一种脉动阵列变速控制方法和可变速脉动阵列微框架,其中方法包括:脉动阵列包括至少两个处理单元;方法包括:获取脉动阵列中所有处理单元的待转变精度模式;确定所有待转变精度模式中处理单元处理所需时长最长的处理周期,并将其作为脉动阵列的下一运行周期;在处理单元的下一实际处理周期后设置数个阻塞周期,以使得所有处理单元的下一处理周期的时长与脉动阵列的下一运行周期的时长相等。本发明可实现在多种精度下灵活切换,且每个固定周期下,脉动阵列内部的处理单元的精度可以是不同的,进而加速卷积神经网络的推理过程。
-
-
-
-
-