-
公开(公告)号:CN116089060A
公开(公告)日:2023-05-09
申请号:CN202211488523.6
申请日:2022-11-25
Applicant: 电子科技大学长三角研究院(湖州)
IPC: G06F9/50
Abstract: 本发明属于内存功耗预测技术领域,公开了一种基于3D‑NUMA架构的内存功耗预测方法。本发明进行内存功耗预测时,考虑了计算机架构的现今情况以及未来的发展趋势,基于3D‑NUMA架构提出了一种内存功耗预测方法。以memory bank的访问率为输入,memory bank的功耗为输出,在二者之间建立memory bank的功率模型。基于NUMA的Non‑Uniform Access(非一致性访问),根据core访问不同距离的memory bank时,其访问延迟不同的特性,可以依据其访问延迟以及memory bank和core的电压和频率来修正得到新的访问率,进而通过功率模型来预测新的memory bank的功耗。
-
公开(公告)号:CN115794584A
公开(公告)日:2023-03-14
申请号:CN202211487635.X
申请日:2022-11-24
Applicant: 电子科技大学长三角研究院(湖州)
IPC: G06F11/34 , G06F11/30 , G06N3/0455 , G06N3/047 , G06N3/08
Abstract: 本发明属于芯片温度预测领域,公开了一种基于Transformer的芯片全片温度分布预测方法、系统及介质,包括时序信息编码模块、Transformer神经网络训练模块、模型准确性验证模块;时序信息编码模块用于获取所述性能计数和温度传感器温度数据,并对其时序数据和位置信息进行编码;Transformer神经网络训练模块用于根据输入序列对未来芯片温度进行预测;模型准确性验证模块用于对预测结果和温度仿真器的仿真结果进行比较,符合预期则输出温度分布预测模型,反之则调整训练参数重新训练。本发明既能对芯片全片温度进行预测,并给出芯片未来指定时刻对温度分布,又能辅助动态温度管理在芯片未达到温度阈值时主动进行温度控制,减少因超温而被迫降低工作频率的性能损失。
-
公开(公告)号:CN115719303A
公开(公告)日:2023-02-28
申请号:CN202211486574.5
申请日:2022-11-24
Applicant: 电子科技大学长三角研究院(湖州)
IPC: G06T1/40 , G06N3/0475 , G06N3/082 , G06V10/77 , G06V10/82
Abstract: 本发明属于GPU热稳定性领域,公开了一种基于GAN网络的GPU全片温度分布估计方法,数据集的构建;GAN网络结构构建;模型训练与优化,最终需要达到生成模型速度和网络精度的平衡,为后续热管理过程提供实时可靠的芯片温度分布数据。本发明具有所提出的GPU温度分布估计方法能较好的平衡精度和速度,可以在GPU实时系统中运行。
-
公开(公告)号:CN115719478A
公开(公告)日:2023-02-28
申请号:CN202211479381.7
申请日:2022-11-24
Applicant: 电子科技大学长三角研究院(湖州)
IPC: G06V20/56 , G06V10/82 , G06N3/08 , G06N3/0464
Abstract: 本发明公开一种独立于无关信息的加速强化学习的端到端自动驾驶方法,包括以下步骤:1)在包含动态场景和静态场景的情况下,利用前置摄像头收集的图像信息,将原始图像作为自动编码器的输入;2)在自动编码器中将原始数据分类为相关特征数据集和无关特征数据集,对自动编码器进行训练;3)自动编码器输出作为强化学习网络的输入;4)强化学习网络在基于FPGA的加速平台下进行推理和训练,进而得到控制命令。本发明通过训练自动编码器使其能够在所有的输入图像中忽略无关的特征,并将其作为深度强化学习网络的输入,对神经网络进行训练获得沿着道路安全行驶的策略,本发明能够克服强化学习效率低、学习慢的问题,最终的输出命令以控制车辆。
-
公开(公告)号:CN115757204A
公开(公告)日:2023-03-07
申请号:CN202211533458.4
申请日:2022-11-30
Applicant: 电子科技大学长三角研究院(湖州)
IPC: G06F12/0844 , G06F12/084 , G06F12/0868
Abstract: 本发明属于自动驾驶领域,公开了一种应用于自动驾驶的NUCA架构硬件性能优化方法、系统及介质,当本地cache无空闲空间时,利用广度优先算法先查找最近的,然后次近的,依次向外访问外围的共享cache,当访问到空闲地址则直接存入数据,否则继续利用队列的先进先出特征,按照前面访问的顺序回顾一遍相邻点,访问下一层的空闲地址;当访问外围的cache到一定层数阈值时便停止继续访问,直接替换本地cache中未经常访问的数据。本发明基于广度优先遍历算法,以及根据相关限制约束当访问外围的cache到一定层数时便停止继续访问直接替换本地cache中数据,以此加速数据存储与处理降低访问的延迟同时提高吞吐率使硬件的性能得到优化。
-
公开(公告)号:CN115906991A
公开(公告)日:2023-04-04
申请号:CN202211486815.6
申请日:2022-11-25
Applicant: 电子科技大学长三角研究院(湖州)
Abstract: 本发明公开了一种针对长序列问题在循环神经网络压缩中获得鲁棒快照的方法,包括如下步骤:S1、在生成快照前对原神经网络输入矩阵进行奇异值分解;S2、根据奇异值分布选择截断维数q,截断奇异值与奇异向量矩阵TSVD;S3、利用截断的矩阵构建新输入权重矩阵并重建用于采样的神经网络;S4、用于采样的神经网络前向传播并进行状态采样生成鲁棒快照;S5、对鲁棒快照进行POD得到鲁棒的压缩投影算子。相比于直接从原网络生成采样的方法,在采样过程中在原网络的输入矩阵上采用TSVD构建新神经网络并生成替代的采样,可加速快照的生成速度,减少由于长序列输入带来的输入到隐藏层信息的冗余,生成鲁棒的快照。
-
公开(公告)号:CN115775011A
公开(公告)日:2023-03-10
申请号:CN202211505902.1
申请日:2022-11-25
Applicant: 电子科技大学长三角研究院(湖州)
IPC: G06N3/0442 , G06N3/048 , G06N3/08
Abstract: 本发明属于网络压缩处理技术领域,公开了一种应用于长短时记忆网络压缩的稳定性保持方法及系统,通过前向传播迭代求解LSTM的主要工作点,基于主要工作点进行线性部分与新非线性部分的分离,将难以确定的LSTM线性部分分离点问题转化为前向传播迭代求解吸引子不动点问题;将DEIM仅应用在LSTM新非线性部分上实现压缩网络的稳定性保持。本发明通过分离主要工作点的线性部分,避免生成的模型在有限时间步内发散;将难以直接计算的模型工作点通过迭代找到的吸引子不动点表示,简化线性部分分离点的选择;找到LSTM的主要工作点并基于该点进行线性化部分分离将DEIM仅应用在LSTM新非线性部分上实现压缩网络的稳定性保持。
-
-
-
-
-
-