AdHoc网络中基于信任的按需多路径矢量路由算法

    公开(公告)号:CN103118412B

    公开(公告)日:2015-06-17

    申请号:CN201310063088.7

    申请日:2013-02-27

    Applicant: 山东大学

    Abstract: 本发明公开了一种Ad Hoc网络中基于信任的按需多路径矢量路由算法,它包括采用简单实用的可信理论对AOMDV路由协议进行改进和扩展,使用丢包率作为衡量可信的标准,建立可信多路径,大幅提高了数据传递率。同时,在原有路由维护的基础上,增加了路径维护机制,将原有的路由错误广播改为路径错误单播,减小了可信路径维护的开销。本发明在传递率和网络开销中找到了平衡点。经过NS2仿真测试以及现场测试验证,本发明大幅提高了服务质量。

    RSA加密算法的指令优化处理器

    公开(公告)号:CN102662628B

    公开(公告)日:2015-03-04

    申请号:CN201210079969.3

    申请日:2012-03-23

    Applicant: 山东大学

    Abstract: 本发明涉及一种RSA加密算法的指令优化处理器。它采用了5条专门用于加速优化RSA加密算法的扩展指令,并且设计了一款与新指令集相对应的专用指令处理器模型-RSA_ASIP。所述5条专门用于加速优化RSA加密算法的扩展指令包括getbit、shift_l、shift_r、muladd和muladd2指令,所述与新指令集相对应的专用指令处理器模型-RSA_ASIP主要由数据存储器、代码存储器、寄存器堆、流水线和总线矩阵五部分组成。本发明设计的RSA_ASIP处理器中能够在保证软件实现的灵活性和可扩展性的前提下,大幅度地优化RSA的执行,经过对RSA1024、RSA2048的实现,与在ARM处理器上的实现比较,指令周期平均减少了64%,经过指令优化的处理器模型节省了资源消耗。

    一种基于FPGA的安全多方计算机器学习资源配置方法及系统

    公开(公告)号:CN118277092A

    公开(公告)日:2024-07-02

    申请号:CN202410377327.4

    申请日:2024-03-29

    Applicant: 山东大学

    Abstract: 本发明属于安全多方计算机器学习领域,提供了一种基于FPGA的安全多方计算机器学习资源配置方法及系统,其技术方案为:获取待加速的安全多方计算神经网络的信息、网络延迟和FPGA的硬件资源信息;结合待加速的安全多方计算神经网络的信息、网络延迟和FPGA的硬件资源信息,和构建好的硬件资源分配模型,生成安全多方计算神经网络在FPGA中进行运算处理时的最优资源配置方案。针对安全多方计算中的计算和通信瓶颈,使用分块和数据流策略,为核心模块提出了优化的流水线设计,利用FPGA的流水线并行,显著减少了执行过程中的通信和计算时间。在隐私保护CNN推理中,执行速度和能效比都有显著提升。

    面向资源受限存算一体芯片的DNN推理加速系统及方法

    公开(公告)号:CN116432723A

    公开(公告)日:2023-07-14

    申请号:CN202310255123.9

    申请日:2023-03-13

    Applicant: 山东大学

    Abstract: 本发明公开了一种面向资源受限存算一体芯片的DNN推理加速系统及方法,包括:权重分配模块,用于在离线状态下获取神经网络信息和ReRAM结构信息,生成一个OU大小的权重块到物理OU的映射表;OU调度模块,用于在离线状态下将神经网络信息、ReRAM结构及映射表信息输入到OU调度器,生成调度表;权重编程模块,用于在线状态下根据生成的映射表,将OU大小的权重块写入指定的物理OU中;推理模块,用于在线状态下读取调度表,用相应的输入特征向量激活OU上的计算;权重编程和推理迭代运行,直到对所有输入数据完成DNN推理。本发明对ReRAM的编程时延进行了优化,加速了DNN在资源受限的ReRAM芯片上的推理。

    一种CPU-GPU异构平台共享末级缓存管理方法、架构及装置

    公开(公告)号:CN108399145B

    公开(公告)日:2021-07-30

    申请号:CN201810129892.3

    申请日:2018-02-08

    Applicant: 山东大学

    Abstract: 本发明公开了一种CPU‑GPU异构平台共享末级缓存管理方法、架构及装置,该方法包括:检测CPU‑GPU异构平台运行信息,所述运行信息包括每个运算核的LLC块利用率和每个LLC组的未命中信息;采用分区算法根据运算核的LLC块利用率得到运算核的初始LLC块插入位置;根据初始LLC块插入位置和LLC组的未命中信息执行LLC块的插入和提升算法,进行CPU‑GPU异构平台共享末级缓存管理。能够感知LLC使用的时间局部性和在不同LLC组之间的空间局部性,动态调整不同运算核之间对于LLC的资源调配,有效解决了CPU‑GPU共享LLC的管理问题,提高CPU‑GPU异构多处理器片上系统的运行效率。

    基于流水线的SM3算法FPGA实现方法及系统

    公开(公告)号:CN111913749A

    公开(公告)日:2020-11-10

    申请号:CN202010790357.X

    申请日:2020-08-07

    Applicant: 山东大学

    Abstract: 本公开提供了一种基于流水线的SM3算法FPGA实现方法及系统,对不同消息分别进行消息填充和数据分组;设计多级流水,将SM3算法中每一轮的迭代计算利用一级流水实现,每一轮迭代计算中的哈希值及后续内容分别进行存储;将SM3算法中的迭代压缩进行循环展开,将每一轮计算的输出作为下一轮的输入,继续计算,直到当前哈希值无剩下的内容需要继续计算,输出计算的最终哈希值;将存储的每一轮迭代计算中的哈希值及后续内容分别独立进行内容赋值填充并存储;本公开大大提高了SM3算法的吞吐率,尤其在需要计算大量不同哈希值的情况下,提升效果更为明显。

    一种基于GPU空间资源共享的任务调度方法

    公开(公告)号:CN111736987A

    公开(公告)日:2020-10-02

    申请号:CN202010474738.7

    申请日:2020-05-29

    Applicant: 山东大学

    Abstract: 本公开提供了一种基于GPU空间资源共享的任务调度方法,涉及GPU任务调度的技术领域,启动一个新的任务,如果没有正在运行的任务,新任务将以独占模式启动;如果当前正在执行第一任务,根据性能模型和截止时间动态调整第一任务和新任务的资源使用;根据输出的每个时钟周期执行的指令数分派新任务,实现了高GPU资源利用率下的软实时调度,本公开解决了现有的并行GPU任务执行和资源共享的工作无法支持抢占式实时调度的问题,确保在GPU资源能够在并发任务之间以最大限度共享的同时,能够满足高优先级任务的截止时间;并发任务可以在单个SM上并行执行,以实现更好的GPU资源利用率。

    基于Cache感知的NVP性能优化备份方法及系统

    公开(公告)号:CN106844101B

    公开(公告)日:2019-05-21

    申请号:CN201710029385.8

    申请日:2017-01-16

    Applicant: 山东大学

    Abstract: 本发明公开了基于Cache感知的NVP性能优化备份方法及系统;将标签槽插入反汇编代码中作为备份位置的候选点;对带有标签槽的反汇编代码进行分析,对高速缓冲存储器Cache的行为进行分析,在保证能够成功备份的前提下,选择最远的标签槽插入备份标签;对每条指令进行备份标签位置标记,收到能量报警信号的指令,在相应标记的备份标签位置上开始进行备份,以使指令在开始备份之前,指令运行达到最远的前进步长;在程序运行过程中遇到能量报警信号时,对基于NVM的非易失性处理器NVP中主存储器的备份,程序继续运行到最远的备份标签处才开始触发备份,以实现程序收到能量报警信号后能够运行最大运行步长。

    基于HEVC的DVFS控制方法、系统、处理器及存储设备

    公开(公告)号:CN107465929A

    公开(公告)日:2017-12-12

    申请号:CN201710601985.7

    申请日:2017-07-21

    Applicant: 山东大学

    CPC classification number: H04N19/70 G06F1/324 H04N19/91

    Abstract: 本发明涉及一种基于HEVC的DVFS控制方法、系统、处理器及存储设备,该方法基于CPU和GPU以流水线方式协同HEVC解码,解码器将其输入的二进制比特流进行熵解码,为解码器参数赋值,估计视频帧i的TU数量,并解析出反变换系数矩阵,输入至工作量预测模块;在CPU和GPU的每个同步点上,工作量预测模块基于熵解码估计的视频帧i的TU数量,预测CPU工作频率和GPU工作频率,输入到频率管理器;根据预测的CPU工作频率和GPU工作频率,频率管理器设定CPU工作频率和GPU工作频率,根据帧缓存中已解码视频帧的数量对设定的CPU工作频率和GPU工作频率进行调节,输入到调控器;调控器根据最终的CPU工作频率设置CPU频率,根据最终的GPU工作频率设置GPU频率,CPU和GPU以设定的频率继续解码。

Patent Agency Ranking