支持卷积神经网络扩展指令的RISC-V加速器系统

    公开(公告)号:CN115983348A

    公开(公告)日:2023-04-18

    申请号:CN202310081218.3

    申请日:2023-02-08

    申请人: 天津大学

    发明人: 魏继增 王兹哲

    IPC分类号: G06N3/0464 G06N3/08

    摘要: 一种支持卷积神经网络扩展指令的RISC‑V加速器系统,包括,用于保存所有指令与数据的外部存储器和用于数据传输的AXI总线,还设置有五级流水线结构的依次串接的取指模块、译码模块、执行模块、访存模块和写回模块,所述的写回模块的输出端连接通用寄存器堆,将当前指令的运行结果送入到通用寄存器堆保存,用于译码模块的提取。本发明是一种通用的、模块化、可扩展的能处理所有卷积层运算的指令集,并基于RISC‑V基础指令集极大提高了处理器的通用性。本发明中的专用矩阵扩展指令和RISC‑V基本指令集相结合,在卷积神经网络运算上显著提高计算性能并降低资源占用。

    一种面向嵌入式GPU多着色器结构的后置顶点Cache设计方法

    公开(公告)号:CN106683162A

    公开(公告)日:2017-05-17

    申请号:CN201710035714.X

    申请日:2017-01-18

    申请人: 天津大学

    发明人: 魏继增

    IPC分类号: G06T15/55 G06T1/20 G06F17/50

    摘要: 本发明公开了一种面向嵌入式GPU多着色器结构的后置顶点Cache设计方法,设计了一种缓存Tag与SRAM分离的后置顶点Cache结构,使得Cache的Tag和SRAM能够在不同的处理阶段按相同的替换机制分别对顶点索引和顶点处理结果的内容进行替换,从而实现在多着色器环境下对重复顶点数据处理结果的缓存机制。与现有技术相比,本发明的后置顶点Cache对最近处理和加载的顶点数据进行缓存判断,从而有效了重复处理顶点的数目,并在一定程度上减少了对片外顶点存储资源的访问频度,使得总体顶点数据带宽不断降低。

    基于微体系结构级别的硬件反病毒装置

    公开(公告)号:CN106339628A

    公开(公告)日:2017-01-18

    申请号:CN201610682919.2

    申请日:2016-08-16

    申请人: 天津大学

    IPC分类号: G06F21/55 G06F21/56

    CPC分类号: G06F21/552 G06F21/566

    摘要: 本发明涉及到信息安全、大数据、机器学习及微处理器设计领域,为实现从硬件的角度提升反病毒引擎的计算效率并进一步节省计算资源,从根本上大大减少了软件反病毒引擎带来的性能开销。由于引入了机器学习加大数据的概念,此硬件反病毒引擎还可能检测出未知的恶意软件,进一步提升了此硬件反病毒引擎方案的健壮性。本发明采用的技术方案是,基于微体系结构级别的硬件反病毒装置,是在处理器的流水线的最后一级设置的一个恶意软件检测单元MDU(Malware Detection Unit)模块,MDU模块包括三个子模块。本发明主要应用于微处理器设计场合。

    双核并行RSA密码处理方法及协处理器

    公开(公告)号:CN105871552A

    公开(公告)日:2016-08-17

    申请号:CN201610428614.9

    申请日:2016-06-14

    申请人: 天津大学

    IPC分类号: H04L9/30 H04L9/00

    CPC分类号: H04L9/302 H04L9/003 H04L9/005

    摘要: 本发明涉及到信息安全及微处理器设计领域,为实现通过FIOS模乘算法将模乘转换为简单的小数加法和乘法运算,充分降低模乘运算单元的面积,有效避免大量中间数据的写回过程。从硬件实现的角度提升算法的计算效率并进一步节省计算资源,从根本上缩减加解密时间和空间开销,有效提升RSA的加解密性能。本发明采用的技术方案是,双核并行RSA密码处理方法,在进行加密之前,需要借助证书颁发机构(CA)作为可信第三方,负责用户私钥和公钥证书的生成、保管、维护、撤销环节,加密时,用户B执行运算c=me(modN)并将加密信息c发送给用户A;解密时,用户A利用自己的私钥d对密文c执行运算从而恢复出明文。本发明主要应用于信息安全处理。

    PowerPC向量协处理器译码电路中动态调度方法

    公开(公告)号:CN105302639A

    公开(公告)日:2016-02-03

    申请号:CN201510772209.4

    申请日:2015-11-12

    申请人: 天津大学

    发明人: 郭炜 王捷 魏继增

    IPC分类号: G06F9/48

    摘要: 一种PowerPC向量协处理器译码电路中动态调度方法,当协处理器接收到一条主处理器发来的指令时,需要在协处理器接口协议规定的时钟周期返回一个确认信号,表明所接收到的指令是不是一条有效的协处理器指令。如果协处理器确认所接收到的指令是一条有效的协处理器指令,则主处理器认为协处理器应该在固定的时钟周期内完成所接收指令的执行工作,并根据协处理器接口协议,在规定的时钟周期将协处理器所需要的有效操作数传输给协处理器。当协处理器所接收指令涉及修改主处理器特殊寄存器的值时,需要在执行结束前完成相应的特殊寄存器值的修改工作。本发明能够将由于协处理器指令之间存在数据相关而对流水线的阻塞降低到最小,提高了协处理器的整体性能。

    一种面向分支预测攻击的微体系结构级安全防护方法

    公开(公告)号:CN105005737A

    公开(公告)日:2015-10-28

    申请号:CN201510468229.2

    申请日:2015-07-31

    申请人: 天津大学

    发明人: 魏继增 谭雅 郭炜

    IPC分类号: G06F21/55 G06F21/57

    CPC分类号: G06F21/55 G06F21/572

    摘要: 本发明公开了一种面向分支预测攻击的微体系结构级安全防护方法,该方法流程包括:首先进行间谍进程识别;然后对识别的间谍进程实现基于加锁的防护。首次提出微体系结构的硬件防护方法来有效抵御此种攻击。在防护过程中,将使用记录表动态识别系统运行中的间谍进程,并立即激活对应的防护策略;在BTB中,最近访问的关键分支语句将被强行加锁,阻止间谍进行对其进行替换,破坏攻击条件,达到有效防护的目的。本发明能够确保面向分支预测分析攻击的微体系结构级防护方法的安全性;对通用处理器性能(例如CPI)的影响非常小,甚至对于整体的CPI具有平均0.12%的提升。

    基于格密码体系的多项式模乘协处理器

    公开(公告)号:CN104065478A

    公开(公告)日:2014-09-24

    申请号:CN201410274011.9

    申请日:2014-06-18

    申请人: 天津大学

    IPC分类号: H04L9/30 G06F7/523

    摘要: 一种基于格密码体系的多项式模乘协处理器,包括有第一寄存器堆、第二寄存器堆、第三寄存器堆和第四寄存器堆,以及:输入端连接第三寄存器堆、第四寄存器堆和模乘逆元运算单元输出端的多路选择器;分别连接多路选择器和地址映射表的输入寄存器堆;分别连接输入寄存器堆和第一寄存器堆的输出端的取模运算下的快速傅里叶变换模块;输入端连接取模运算下的快速傅里叶变换模块的输出端,输出端连接多路分配器的输出寄存器堆;多路分配器的输出端分别连接输出端和模乘单元,模乘单元的输出端连接模乘逆元运算单元;地址映射表的输入端连接第二寄存器堆。本发明使用FPGA平台做硬件设计,实现了基于格密码体系的多项式模乘协处理器。

    一种支持双域的快速RSA密码协处理器

    公开(公告)号:CN103793199A

    公开(公告)日:2014-05-14

    申请号:CN201410035727.3

    申请日:2014-01-24

    申请人: 天津大学

    IPC分类号: G06F7/72 H04L9/06

    摘要: 一种支持双域的快速RSA密码协处理器,包括:域控制寄存器,用于接收外部输入的控制信号;控制寄存器,用于接收外部输入的控制信号;RAM存储单元,用于存储外部输入的操作数以及运算结果;二元扩域,连接域控制寄存器的输出端,接收域控制寄存器的控制信号;素数域,连接域控制寄存器的输出端,接收域控制寄存器的控制信号;双域模乘单元,分别连接控制寄存器、RAM存储单元、二元扩域和素数域,用于根据域控制寄存器的控制信号对RAM存储单元存储的外部操作数进行计算,并将计算结果存回到RAM存储单元内。本发明有效地避免了大量的冗余数据写回过程,提高了RSA的加解密性能,实现了不同有限域之间切换的功能,面积增加不到20%,效果非常明显。

    基于铱星、北斗双模通信的高可靠数据传输系统

    公开(公告)号:CN113055080B

    公开(公告)日:2022-02-18

    申请号:CN202110318453.9

    申请日:2021-03-25

    申请人: 天津大学

    IPC分类号: H04B7/185 H04L67/06 H04W28/06

    摘要: 本发明公开一种基于铱星、北斗双模通信的高可靠数据传输系统,包括:发送端、转发器端和接收端,其中:所述发送端,与转发器端相连,将获取的数据发送给转发器端;所述转发器端,与接收端相连,将发送端发送的数据,转发给接收端;所述接收端,接收数据并返回确认数据包,所述确认数据包再由转发器端转发至发送端。本发明根据数据形式,选取铱星模块、北斗模块相应的通信方式进行发送,并且具有断点续传功能和采用有确认的通信方式,从而实现基于铱星、北斗双模通信的数据传输和提高该数据传输可靠性的目的。

    一种基于眼动数据的车辆驾驶效率监测方法

    公开(公告)号:CN112426124A

    公开(公告)日:2021-03-02

    申请号:CN202011323653.5

    申请日:2020-11-23

    申请人: 天津大学

    摘要: 本发明公开了一种基于眼动数据的车辆驾驶效率监测方法,步骤1、采集驾驶员在驾驶过程中实时的眼动数据;步骤2、由眼动数据抽取眼动行为特征;步骤3、获取驾驶员基于眼动数据的实时注视点与驾驶员的距离信息以及实时驾驶速度;步骤4、计算在驾驶员的成像平面上由注视点引发的光流幅值;步骤5、将视觉空间网格化;步骤6、构建概率分布模型;步骤7、利用概率分布间的距离函数得到所述注视点概率分布以及光流概率分布之间的差距,作为驾驶效率的指标。与现有技术相比,本发明相较于单一的驾驶效率监测指标更加准确且更具一般性。