-
公开(公告)号:CN117933302A
公开(公告)日:2024-04-26
申请号:CN202410154892.4
申请日:2024-02-02
Applicant: 上海交通大学
Abstract: 本发明涉及神经网络模型剪枝技术领域,尤其涉及基于蒸馏子图的图神经网络剪枝方法,包括以下步骤:S1:根据输入图中节点的邻接向量的相似性计算输入图中边的相似性生成稀疏化的蒸馏子图;S2:基于蒸馏子图对特征通道掩码和模型权重掩码进行剪枝,获得保留的节点特征向量和模型权重参数;S3:根据节点特征向量和模型权重参数进行重训练,得到最终模型权重值。本发明核心思想是先从原始的大尺寸输入图中,蒸馏提取一个保留了关键图结构信息的小尺寸稀疏子图,通过小尺寸的稀疏子图替代原始的大尺寸输入图进行剪枝,大幅减少剪枝过程中的计算与访存量,本发明通过提出节点特征和模型参数的协同剪枝技术,能够大幅降低节点特征和模型权重的参数量。
-
公开(公告)号:CN113723044B
公开(公告)日:2024-04-05
申请号:CN202111061410.3
申请日:2021-09-10
Applicant: 上海交通大学
IPC: G06F30/392 , G06N3/063
Abstract: 本发明公开了一种基于数据稀疏性的超额行激活存算一体加速器设计方法,涉及存算一体架构的神经网络加速器设计领域,包括三部分,构建基于行激活数据的预测机制,建模外围电路器件限制与计算并行度,解决所述外围电路与所述计算并行度的匹配问题;构建行激活超额订阅机制,自适应地调整所述计算并行度和资源使用,解决稀疏数据下计算阵列和所述外围电路利用率低,资源冗余的问题;针对神经网络数据稀疏性的特点,重新规划控制流和数据流,解决了利用数据稀疏性而引入的复杂电路设计的问题。本发明通过预测输出数据规模,建模外围电路器件限制与计算并行度关系,根据预测自适应地调整计算并行度和资源使用,以最大程度利用外围电路资源。
-
公开(公告)号:CN117764137A
公开(公告)日:2024-03-26
申请号:CN202311659520.9
申请日:2023-12-05
Applicant: 上海交通大学
Abstract: 本发明提出了一种针对激活函数分段线性逼近的高精度通用算法,解决了现有技术中其他分段线性逼近算法中存在的部分区间精度过剩的问题。一种针对激活函数分段线性逼近的高精度通用算法,包括如下步骤:步骤1:定义要逼近的激活函数f(x)、逼近的输入范围[ENDleft,ENDright]、逼近的区间数目seg_num;步骤2:在输入范围[ENDleft,ENDright]中使用二分法来递归寻找区间断点;步骤3:迭代优化相邻的断点,使各个区间内的误差相同。本发明提出了等误差分割算法,该算法通过平衡各分段之间的误差,解决了其他分段线性逼近算法中存在的部分区间精度过剩问题。除此之外,这种方法不仅提高了逼近精度,而且避免了引入额外的硬件开销,且具有通用性,适用于所有常见的激活函数。
-
公开(公告)号:CN111950709B
公开(公告)日:2023-11-03
申请号:CN202010808453.2
申请日:2020-08-12
Applicant: 上海交通大学
IPC: G06N3/0464 , G06N3/082 , G06N3/048 , G06V20/13 , G06V10/764 , G06V10/82
Abstract: 本发明提供了一种面向无人机图像目标检测的SqueezeNet网络折叠构造方法及系统,包括:步骤S1:调用并配置各子模块实现整个卷积池化部分;步骤S2:获取物体种类信息、物体置信度信息和物体位置信息;步骤S3:确定数据流向,获取数据流向确定结果信息;步骤S4:根据硬件结构同时进行的卷积运算数目和图像识别神经网络的结构,将卷积池化部分分为7个阶段,更新HalfFire模块的权重,对加速器的配置例化HalfFire模块后,每个阶段依次完成相应操作;步骤S5:获取面向无人机图像目标检测的SqueezeNet网络折叠构造结果信息。本发明构造合理,使用方便,克服了现有技术的缺陷。
-
公开(公告)号:CN111538475B
公开(公告)日:2023-06-23
申请号:CN202010219354.0
申请日:2020-03-25
Applicant: 上海交通大学
IPC: G06F7/58
Abstract: 本发明提供了一种基于FPGA的真随机数发生器构建系统及方法,包括:控制单元、熵源产生模块、熵提取器、熵源解码器、后处理模块以及随机数发生器;所述控制单元与熵源产生模块、熵提取器、熵源解码器、后处理模块分别相连;所述控制单元能够进行随机数发生器的初始化设置;所述随机数发生器需要外部提供一个时钟单元,其输出作为随机数发生器的工作时钟;所述随机数发生器的熵源来自熵源产生模块;所述熵源产生模块中的一个相互耦合的自定时振荡环产生的时钟抖动信号作为随机数发生器的熵源。本发明比传统的反相器振荡环或者没有耦合的自定时振荡环更稳定,鲁棒性更好,这样的真随机数发生器在电压或环境变化时可以相对稳定的工作。
-
公开(公告)号:CN116257246A
公开(公告)日:2023-06-13
申请号:CN202310003551.2
申请日:2023-01-03
Applicant: 上海交通大学
IPC: G06F8/41
Abstract: 本发明公开了一种基于重调度和循环变换消除访存冲突方法,涉及粗粒度可重构架构编译器领域。本发明在连续放置策略的前提下建立了访存冲突模型来准确预测访存冲突的情况,基于该模型,提出通信感知的内存访问优化方法。该方法通过重调度和循环变换在时间域和空间域上减少访存冲突,在最小化数据通信开销的同时,能有效地减少访存冲突。本发明提出的重调度和循环变换两种方法通过纯软件的方式进行,不依赖缓存资源,能够轻易地应用于多种CGRA结构,通用性更好。
-
公开(公告)号:CN115982528A
公开(公告)日:2023-04-18
申请号:CN202211489970.3
申请日:2022-11-25
Applicant: 上海交通大学
IPC: G06F17/15 , G06F7/544 , G06F7/533 , G06N3/0464
Abstract: 本发明提供了一种基于Booth算法的近似预编码卷积运算方法及系统,包括:步骤S1:乘数和被乘数输入乘法器通过近似预编码模块进行部分积分离,将分离后的被乘数相关部分积输入至加法树模块完成压缩,将压缩后的被乘数相关部分积和乘数相关部分积相加得到乘法器结果;步骤S2:将乘法器结果进行符号位扩展,并将扩展后的乘法器结果输入累加模块进行移位和相加操作,并将移位相加操作结果进行进位补偿。
-
公开(公告)号:CN115980437A
公开(公告)日:2023-04-18
申请号:CN202211594519.8
申请日:2022-12-13
Applicant: 上海交通大学
Abstract: 本发明提供了一种基于TDC的可调谐电压传感装置及其校准调谐方法,包括TDC模块、时钟模块和寄存器模块;所述时钟模块产生脉冲时钟和采样时钟;所述TDC模块根据脉冲时钟产生多沿脉冲信号在延迟链上传递,并被采样时钟采样,得到测量结果;所述寄存器模块对TDC模块和时钟模块中各项参数进行配置和调试。本发明提供的电压传感装置灵敏度高,同时有较好的可部署性。相比常见的TDC电压传感装置,采用了多链多沿及双采样的设计,大大提高了灵敏度,利用相移时钟增强了可部署性。
-
公开(公告)号:CN115438775A
公开(公告)日:2022-12-06
申请号:CN202211200169.2
申请日:2022-09-29
Applicant: 上海交通大学
Abstract: 本发明提供了一种卷积神经网络训练8位张量表示方法及系统,包括:步骤S1:张量分成低比特张量部分和共享阶码数组;步骤S2:使用SP8表示方法表示低比特张量部分的数值;步骤S3:使用按通道分配共享阶码的共享阶码管理方法共享阶码部分;步骤S4:将张量表示方法应用于卷积神经网络训练时卷积部分的前向传播与反向传播。本发明有效降低卷积神经网络训练时的存储开销与计算开销;本发明具有比现有8位张量表示方法更高的神经网络训练精度。
-
公开(公告)号:CN113052307B
公开(公告)日:2022-09-06
申请号:CN202110281982.6
申请日:2021-03-16
Applicant: 上海交通大学
Abstract: 本发明提供了一种面向忆阻器加速器的神经网络模型压缩方法及系统,涉及基于忆阻器的神经网络加速器技术领域,该方法包括:步骤1:通过阵列感知的规则化增量剪枝算法,裁剪原始网络模型获得忆阻器阵列友好的规则化稀疏模型;步骤2:通过二的幂次量化算法,降低ADC精度需求和忆阻器阵列中低阻值器件个数以总体降低系统功耗。本发明能够解决原始模型映射到忆阻器加速器上时硬件资源消耗过大的问题以及ADC单元和计算阵列功耗过高的问题。
-
-
-
-
-
-
-
-
-