-
公开(公告)号:CN114265696B
公开(公告)日:2024-12-20
申请号:CN202111632969.7
申请日:2021-12-28
Applicant: 北京航天自动控制研究所
IPC: G06F9/50 , G06N3/0464 , G06N3/063 , G06N3/08
Abstract: 本发明涉及一种针对卷积神经网络最大池化层的池化器及池化加速电路,池化器包括第一选择器、第二选择器、比较器、常数寄存器和池化寄存器;比较器的第一输入端输入池化窗口中的特征数据,第二输入端接入第一选择器的输出数据,输出端连接到第二选择器;第一选择器的第一输入端连接常数寄存器,第二输入端连接外部的池化缓存从中读取数据,第三输入端连接池化寄存器输出端;第二选择器的第一输出端作为池化最终结果输出端,第二输出端连接外部的池化缓存向其写入数据,第三输出端连接池化寄存器的输入端。本发明以尽可能小的FPGA资源消耗量,实现常见CNN中最大池化层的高效计算,进而解决将CNN部署到嵌入式设备中遇到的实时性问题和功耗问题。
-
公开(公告)号:CN115809691A
公开(公告)日:2023-03-17
申请号:CN202211585769.5
申请日:2022-12-10
Applicant: 北京航天自动控制研究所
Inventor: 王晓峰 , 李晓敏 , 周辉 , 赵雄波 , 盖一帆 , 蒋彭龙 , 路坤锋 , 李超然 , 谢宇嘉 , 吴敏 , 林平 , 董文杰 , 吴松龄 , 弥寒光 , 黄鹂 , 赵冠杰 , 林玉野 , 李杨珺 , 王森 , 李杰 , 杨庆军 , 靳蕊溪
IPC: G06N3/063 , G06F17/16 , G06N3/0464
Abstract: 本公开属于神经网络加速计算技术领域,具体而言涉及一种基于Winograd的相关算法加速器计算方法,包括:获取基准张量块和实时张量块;通过Winograd变换由基准张量块得到第一张量块,由实时张量块得到第二张量块;通过张量块逐点相乘由第一张量块和第二张量块得到第三张量块;沿通道方向累加所述第三张量块,得到第一矩阵;通过Winograd反变换由第一矩阵得到第二矩阵;逐点相加第二矩阵和偏执矩阵,得到过程矩阵;将所述过程矩阵输入至过程张量缓存中,遍历结束后输出。上述过程提高计算速率和计算连续性。
-
公开(公告)号:CN115759220A
公开(公告)日:2023-03-07
申请号:CN202211584828.7
申请日:2022-12-10
Applicant: 北京航天自动控制研究所
Inventor: 王晓峰 , 周辉 , 赵雄波 , 盖一帆 , 蒋彭龙 , 路坤锋 , 李晓敏 , 李超然 , 谢宇嘉 , 林平 , 董文杰 , 吴松龄 , 弥寒光 , 黄鹂 , 吴敏 , 赵冠杰 , 李杨珺 , 王森 , 李杰 , 徐天运 , 靳蕊溪 , 林玉野
Abstract: 本公开属于人工智能处理器技术领域,具体而言涉及一种基于Winograd的深度学习处理系统,包括:输入通道,与外部设备通信;输入特征加载器,与所述输入通道相连;路由模块,与所述输入层加载器相连;卷积加速器核心模块,与路由模块相连,所述卷积核加速器核心模块包括至少两个并行设置的卷积核加速器子核心模块;通道累加器,与卷积加速器核心模块相连,用于累加并行的卷积核加速器子核心模块的输出数据;特征卸载器,与通道累加器相连,将所述通道累加器的输出数据传输至处理系统外。通过多尺寸Wino‑DPU混合架构,通过核间算力的最优分配,实现Wino‑DPU灵活性和高效性的全面提升,进而有效提升深度学习算法的计算效率。
-
公开(公告)号:CN114358266A
公开(公告)日:2022-04-15
申请号:CN202111683726.6
申请日:2021-12-28
Applicant: 北京航天自动控制研究所
Abstract: 本发明涉及一种数据流驱动的卷积神经网络加速器,包括:预处理模块、卷积模块、池化模块和指令分发模块;预处理模块用于加载输入特征执行卷积神经网络的预处理;卷积模块用于加载权重、偏置数据以及输入特征执行卷积层、全连接层或非线性激活层的计算;池化模块用于加载卷积模块的计算结果执行池化层的计算输出;指令分发模块用于对所述预处理模块、卷积模块和池化模块进行工作模式的配置和控制;在指令分发模块的工作模式配置和控制下,根据卷积神经网络结构,将预处理模块、卷积模块和池化模块进行动态的流式结构连接;实现对输入数据的卷积神经网络加速处理。本发明提高CNN加速器的可扩展性,提升系统的整体性能。
-
公开(公告)号:CN106201946B
公开(公告)日:2018-11-23
申请号:CN201610499711.7
申请日:2016-06-29
Applicant: 北京航天自动控制研究所 , 中国运载火箭技术研究院
IPC: G06F13/38
Abstract: 一种基于FPGA和DSP的星载电子系统数据接口转换系统,包括:FPGA处理模块、DSP处理模块、接口电路模块和附属电路模块等模块。DSP处理模块实现Spacewire数据编解码处理、收发控制、实现Spacewire控制协议以及与SpaceWire节点通信;FPGA处理模块实现了不同总线数据处理、信息流控制、各接口间信息交换等功能;接口电路模块实现与CAN节点设备、422总线节点设备、485总线节点设备、1553B节点设备的数据通信;本发明实现了SpaceWire信号与CAN信号、422信号和485信号、1553B信号间的相互转换,解决了Spacewire数据与不同总线接口信息相互兼容与相互操作的问题,可广泛应用于各种航天设备电子系统。
-
公开(公告)号:CN104657553A
公开(公告)日:2015-05-27
申请号:CN201510070071.3
申请日:2015-02-10
Applicant: 北京航天自动控制研究所 , 中国运载火箭技术研究院
IPC: G06F17/50
Abstract: 一种基于快速归一化互相关法的相似性测度硬件加速方法,首先建立实时图与模板图之间相关系数的数学模型;然后利用两层流水线进行硬件算法的设计,并利用有限状态机方法计算搜索窗口选定的实时图与模板图之间的相关系数;在所有搜索窗口选定的实时图与模板图之间的相关系数计算完成后,找出相关系数中的最大值和对应搜索窗口左上角在实时图坐标系中的横坐标和纵坐标,该搜索窗口对应的选定区域即为匹配区域,本发明合理控制硬件资源代价,在Xilinx Virtex5-XC5VFX100T下满足达到100M的要求,对大小为80*64的实时图和大小为25*25的模板图进行相似性匹配运算只需3.5ms,极大的提高了算法速度。
-
公开(公告)号:CN116048782A
公开(公告)日:2023-05-02
申请号:CN202211589824.8
申请日:2022-12-10
Applicant: 北京航天自动控制研究所
Inventor: 王晓峰 , 路坤锋 , 周辉 , 谢宇嘉 , 赵雄波 , 盖一帆 , 蒋彭龙 , 李晓敏 , 李超然 , 吴松龄 , 林平 , 董文杰 , 弥寒光 , 黄鹂 , 吴敏 , 赵冠杰 , 李杰 , 李杨珺 , 王森 , 杨庆军 , 靳蕊溪 , 林玉野 , 徐天运
IPC: G06F9/50 , G06N3/063 , G06N3/0464
Abstract: 本公开属于人工智能处理器技术领域,具体而言涉及一种基于Winograd的深度学习处理器核心模组,包括:控制模块,接收外部控制单元传递的指令,并产生控制信号;d‑Buffer模块,缓存来及外部的输入特征,所述d‑Buffer模块与所述控制模块相连,所述控制模块控制d‑Buffer模块每个时钟周期的动作;和PE阵列,包括n个独立的计算单元,每个计算单元与d‑Buffer模块相连,所述计算单元计算每个输出通道的卷积,PE阵列进行n个输出通道的并行计算,所述控制模块控制PE阵列每个时钟周期的动作。本公开通过Winograd快速卷积方法解决基于FPGA的深度学习处理器的性能普遍受限于FPGA片上DSP资源数量的限制的问题,降低DSP数量对深度学习处理器性能的限制。
-
公开(公告)号:CN115878956A
公开(公告)日:2023-03-31
申请号:CN202211584551.8
申请日:2022-12-10
Applicant: 北京航天自动控制研究所
Inventor: 王晓峰 , 盖一帆 , 周辉 , 赵雄波 , 路坤锋 , 蒋彭龙 , 李晓敏 , 李超然 , 谢宇嘉 , 赵冠杰 , 林平 , 董文杰 , 吴松龄 , 弥寒光 , 黄鹂 , 吴敏 , 靳蕊溪 , 李杨珺 , 王森 , 李杰 , 杨庆军 , 林玉野
Abstract: 本公开属于专用算法硬件电路技术领域,具体而言涉及一种基于Winograd的相关算法加速器计算系统,包括:张量变换单元,包括基准图变换单元,对基准图张量块进行Winograd变换,得到第一张量块;实时图变换单元,对实时图张量块进行Winograd变换,得到第二张量块;和结果变换单元,对第一矩阵进行Winograd反变换,得到第二矩阵;逐点相乘单元,将所述第一张量块和所述第二张量块进行逐点相乘,得到第三张量块;通道累加单元,将所述第三张量块沿通道方向进行累加,得到第一矩阵;以及偏置累加单元,将所述第二矩阵与偏置矩阵逐点相加,得到过程矩阵。通过上述设置以提高计算速率和计算连续性。
-
公开(公告)号:CN114265696A
公开(公告)日:2022-04-01
申请号:CN202111632969.7
申请日:2021-12-28
Applicant: 北京航天自动控制研究所
Abstract: 本发明涉及一种针对卷积神经网络最大池化层的池化器及池化加速电路,池化器包括第一选择器、第二选择器、比较器、常数寄存器和池化寄存器;比较器的第一输入端输入池化窗口中的特征数据,第二输入端接入第一选择器的输出数据,输出端连接到第二选择器;第一选择器的第一输入端连接常数寄存器,第二输入端连接外部的池化缓存从中读取数据,第三输入端连接池化寄存器输出端;第二选择器的第一输出端作为池化最终结果输出端,第二输出端连接外部的池化缓存向其写入数据,第三输出端连接池化寄存器的输入端。本发明以尽可能小的FPGA资源消耗量,实现常见CNN中最大池化层的高效计算,进而解决将CNN部署到嵌入式设备中遇到的实时性问题和功耗问题。
-
公开(公告)号:CN113739791A
公开(公告)日:2021-12-03
申请号:CN202110891377.0
申请日:2021-08-04
Applicant: 北京航天自动控制研究所
Abstract: 本发明涉及基于矢量描述的导航星集确定方法:S1、计算观星设备视场轴向在地心惯性系下的矢量u;S2、计算圆形视场边缘起始点的矢量S3、将以矢量u为中轴线,矢量为母线形成的圆锥体底面边缘,作为圆形视场边缘,根据矢量计算原理获得圆形视场边缘各点矢量Vs的描述模型;S4、计算步骤S3获得的圆形视场边缘各点矢量Vs对应的赤经αs、赤纬βs唯一解;S5、根据圆形视场边缘各点矢量Vs对应的赤经αs、赤纬βs唯一解,确定圆形视场边缘各点矢量Vs对应的赤经αs、赤纬βs范围;S6、查询恒星星表,得到赤经、赤纬落入步骤S6确定的圆形视场边缘各点矢量Vs对应的赤经αs、赤纬βs范围内的恒星集合。本发明计算简单,且适应任意给定星敏感器轴向条件的情况。
-
-
-
-
-
-
-
-
-