一种基于SIMT编程模型的张量化并行计算方法

    公开(公告)号:CN111831429B

    公开(公告)日:2024-04-02

    申请号:CN202010534263.6

    申请日:2020-06-11

    Abstract: 本发明提供一种基于SIMT编程模型的张量化并行计算方法,基于主机端、转换单元和设备端之间的交互,将设备端的数据处理单元由标量转换为张量元,实现对数据的张量化运算处理,拓展了SIMT编程模型所适用的异构平台的范围,提高了编程模型的通用性,灵活性和便捷性;以及在执行任务指令时,对检测到的为对张量元运算处理的任务指令,通过调用预先封装的小核函数进行运算处理,既提高了底层计算的效率,又方便了计算调度的实现。

    一种基于SIMT编程模型的张量化并行计算方法

    公开(公告)号:CN111831429A

    公开(公告)日:2020-10-27

    申请号:CN202010534263.6

    申请日:2020-06-11

    Abstract: 本发明提供一种基于SIMT编程模型的张量化并行计算方法,基于主机端、转换单元和设备端之间的交互,将设备端的数据处理单元由标量转换为张量元,实现对数据的张量化运算处理,拓展了SIMT编程模型所适用的异构平台的范围,提高了编程模型的通用性,灵活性和便捷性;以及在执行任务指令时,对检测到的为对张量元运算处理的任务指令,通过调用预先封装的小核函数进行运算处理,既提高了底层计算的效率,又方便了计算调度的实现。

    基于RRAM的深度学习推荐模型容错生成方法及设备

    公开(公告)号:CN116050472A

    公开(公告)日:2023-05-02

    申请号:CN202211174991.6

    申请日:2022-09-26

    Abstract: 本发明提供一种基于RRAM的深度学习推荐模型容错生成方法及设备,所述方法包括:应用于DLRM架构;所述DLRM架构包括内核,RRAM计算单元,稀疏索引数组基指针的寄存器,稀疏索引数组的寄存器,存储器;所述方法包括:在相同的方差下,采用不同的误差矩阵训练RRAM模型,获取所述RRAM模型的准确率,并求得平均准确率;在所述平均准确率收敛或不再继续升高时,获取在该方差时的误差下鲁棒性最强的RRAM模型;多次调整方差,得到每个方差下,鲁棒性最强的RRAM模型;根据通过神经网络映射之后的低维向量的重要性和电阻分布,交换所述低维向量映射到存储器。本发明可以针对RV和SF实现计紧耦合EL特性的容错方法。

Patent Agency Ranking