-
公开(公告)号:CN109165006B
公开(公告)日:2021-08-06
申请号:CN201810892536.7
申请日:2018-08-07
Applicant: 上海交通大学
Abstract: Softmax函数可以完成标量到概率的转换,被广泛应用在深度神经网络分类器中的输出层。时下,多分类问题作为深度学习的重要应用有着分类类别越来越多,精度要求越来越高的应用趋势。本发明提出了一种Softmax函数的设计优化及硬件实现方法及系统,针对大量输入数据个数、广输入范围与高精度要求,本发明通过两遍输入的输入模式进行计算以减少片上存储资源、通过可配置查找表以应对多种输入定点化方案、通过硬件决定输出定点化方案以提高精度。
-
公开(公告)号:CN111782356B
公开(公告)日:2022-04-08
申请号:CN202010496091.8
申请日:2020-06-03
Applicant: 上海交通大学
Abstract: 本发明提供了一种权重稀疏神经网络芯片的数据流方法及系统,包括:步骤S1:针对卷积核稀疏度随输入变化的特点,设计适应稀疏度变化的串行计算的内层循环方案;步骤S2:针对卷积核稀疏度不同可能导致的计算单元间不同步的问题,设计并行计算的方案;步骤S3:为优化输入及输出缓存,设计串行计算的外层循环方案。本发明解决了卷积核稀疏度不同导致的部分硬件资源闲置的问题以及不同计算单元计算的卷积核稀疏度不同导致的计算单元间的同步问题。
-
公开(公告)号:CN111782356A
公开(公告)日:2020-10-16
申请号:CN202010496091.8
申请日:2020-06-03
Applicant: 上海交通大学
Abstract: 本发明提供了一种权重稀疏神经网络芯片的数据流方法及系统,包括:步骤S1:针对卷积核稀疏度随输入变化的特点,设计适应稀疏度变化的串行计算的内层循环方案;步骤S2:针对卷积核稀疏度不同可能导致的计算单元间不同步的问题,设计并行计算的方案;步骤S3:为优化输入及输出缓存,设计串行计算的外层循环方案。本发明解决了卷积核稀疏度不同导致的部分硬件资源闲置的问题以及不同计算单元计算的卷积核稀疏度不同导致的计算单元间的同步问题。
-
公开(公告)号:CN109165006A
公开(公告)日:2019-01-08
申请号:CN201810892536.7
申请日:2018-08-07
Applicant: 上海交通大学
Abstract: Softmax函数可以完成标量到概率的转换,被广泛应用在深度神经网络分类器中的输出层。时下,多分类问题作为深度学习的重要应用有着分类类别越来越多,精度要求越来越高的应用趋势。本发明提出了一种Softmax函数的设计优化及硬件实现方法及系统,针对大量输入数据个数、广输入范围与高精度要求,本发明通过两遍输入的输入模式进行计算以减少片上存储资源、通过可配置查找表以应对多种输入定点化方案、通过硬件决定输出定点化方案以提高精度。
-
-
-