-
公开(公告)号:CN115827553A
公开(公告)日:2023-03-21
申请号:CN202211584357.X
申请日:2022-12-10
Applicant: 北京航天自动控制研究所
Inventor: 王晓峰 , 周辉 , 谢宇嘉 , 赵雄波 , 盖一帆 , 蒋彭龙 , 路坤锋 , 李晓敏 , 李超然 , 林平 , 赵冠杰 , 董文杰 , 吴松龄 , 弥寒光 , 黄鹂 , 吴敏 , 林玉野 , 李杨珺 , 王森 , 李杰 , 徐天运 , 靳蕊溪
IPC: G06F15/78 , G06F13/40 , G06N3/0464 , G06N3/063
Abstract: 本发明涉及一种面向CNN加速计算的带宽自适应的数据传输方法,包括:通过主控向指令配置模块从外部存储装置中写入输入特征图的基本信息;地址自动生成模块根据配置信息生成每次传输的地址信息,并将该地址信息传输给AX I驱动模块;AXI驱动模块根据配置信息和地址自动生成模块的信息,发起数据块的读取操作,并将数据写入自动插值模块;AX I数据感知模块感知通道信号的占空比,以及占空比的变化速率,并将该信息反馈给AXI驱动模块;自动插值将预定值插入数据流的预定位置,并将插值后的数据写入F I FO驱动模块;F I FO驱动模块根据F I FO的状态确定数据的读取和写入操作。通过上述方法提高加速核与外部存储装置之间的数据传输效率。
-
公开(公告)号:CN115796253A
公开(公告)日:2023-03-14
申请号:CN202211585982.6
申请日:2022-12-10
Applicant: 北京航天自动控制研究所
Inventor: 王晓峰 , 周辉 , 路坤锋 , 赵雄波 , 盖一帆 , 蒋彭龙 , 李晓敏 , 李超然 , 谢宇嘉 , 赵冠杰 , 林平 , 董文杰 , 吴松龄 , 弥寒光 , 黄鹂 , 吴敏 , 李杨珺 , 王森 , 李杰 , 徐天运 , 靳蕊溪 , 林玉野
IPC: G06N3/063 , G06F5/06 , G06N3/0464
Abstract: 本发明涉及一种带宽自适应的数据传输的卷积神经网络加速计算系统,包括卷积神经网络加速器,用于执行具体的数据计算;以及带宽自适应数据传输装置,设置在所述卷积神经网络加速器和外部存储装置之间,感知卷积神经网络加速器的数据消耗和生成速率、感知外部存储装置带宽的占用情况;根据感知数据确定卷积神经网络加速器和所述外部存储装置之间的数据传输策略;所述带宽自适应数据传输装置包括数据加载模块和数据卸载模块。通过上述结构可动态适应片外存储带宽,可大幅提升数据传输的连续性,从而有效提升卷积神经网络加速器的片外数据传输带宽。
-
公开(公告)号:CN115759235A
公开(公告)日:2023-03-07
申请号:CN202211602462.1
申请日:2022-12-10
Applicant: 北京航天自动控制研究所
Inventor: 王晓峰 , 谢宇嘉 , 周辉 , 赵雄波 , 盖一帆 , 路坤锋 , 蒋彭龙 , 李晓敏 , 李超然 , 董文杰 , 林平 , 吴松龄 , 弥寒光 , 黄鹂 , 吴敏 , 赵冠杰 , 王森 , 李杨珺 , 杨庆军 , 靳蕊溪 , 林玉野 , 李杰
IPC: G06N3/08
Abstract: 本公开属于神经网络处理方法技术领域,具体而言涉及一种基于Winograd的深度学习处理方法,包括:获取待计算单元的大小;获取多个具有不同尺寸的加速核的大小;根据多个加速核的大小得到计算比例;根据待计算单元的大小和计算比例得到待计算单元的划分区域,所述待计算单元的划分区域与加速核的大小相对应;根据划分区域进行计算,然后汇总完成所述待计算单元的加速计算。本公开利用不同卷积核尺寸和输出尺寸的Winograd加速核(Wino‑Core)在灵活性和高效性方面的差异性,在高度可扩展的深度学习处理器架构中组合多个不同尺寸的Wino‑Core,形成多核混合异构的深度学习处理器,并通过核间算力的最优分配,实现Wino‑DPU灵活性和高效性的全面提升。
-
公开(公告)号:CN114327676A
公开(公告)日:2022-04-12
申请号:CN202111632984.1
申请日:2021-12-28
Applicant: 北京航天自动控制研究所
Abstract: 本发明涉及一种面向卷积神经网络的高可靠加速器,包括指令分发模块和与其连接、受其控制的加载模块、路由模块、计算模块、冗余控制模块、和卸载模块;在指令分发控制模块的控制下,所述加载模块从外部加载输入特征数据和卷积核数据;路由模块将加载的数据分配给计算模块;所述计算模块中包括多个并列的计算核心,每个计算核心均用于接收分配数据进行卷积神经网络加速处理,输出处理结果;冗余控制模块将所述计算模块输出的多路计算结果输出到所述卸载模块,通过卸载模块将卷积神经网络加速处理结果卸载输出。本发明实现了卷积神经网络的加速处理,并兼顾卷积神经网络的高速处理和高可靠性处理的要求。
-
公开(公告)号:CN119942071A
公开(公告)日:2025-05-06
申请号:CN202411971469.X
申请日:2024-12-30
Applicant: 北京航天自动控制研究所
IPC: G06V10/25 , G06V10/82 , G06N3/0464 , G06N3/08 , G06F17/10 , G06N3/048 , G06V10/774 , G06V20/10
Abstract: 本发明公开了一种面向复杂数据集的二值化目标检测方法。二值化目标检测算法,在各种性能受限的嵌入式以及低功耗设备上具有广泛的应用前景。然而,复杂数据集中的目标特性、噪声和变化对二值化网络提出了更高的要求,当二值化YOLOv5s模型在应用于复杂数据集,如光学遥感数据集时,往往会导致模型检测准确率显著下降。本发明公开了一种多颗粒度缩放因子选取方法,针对不同复杂度的数据集,通过方法自动选择合适颗粒度的缩放因子,使得二值化YOLOv5‑MobileNetV2检测网络可以适应不同复杂程度的数据集,平衡部署算法的检测精度和计算性能。
-
公开(公告)号:CN119942070A
公开(公告)日:2025-05-06
申请号:CN202411971456.2
申请日:2024-12-30
Applicant: 北京航天自动控制研究所
IPC: G06V10/25 , G06V10/82 , G06N3/0464 , G06N3/048 , G06V10/80 , G06N5/04 , G06V10/774
Abstract: 本发明公开一种在量化感知训练中目标检测模型的处理方法。深度模型通常具有庞大的参数量以及复杂的计算过程,导致在移动设备和嵌入式设备等资源受限的平台上的部署和应用受到限制。将浮点数二值化为1‑bit可以极大减少存储空间,并提升推理的计算速度,有效解决资源受限问题。在二值化场景中,为了减少计算量,BN层通常会和卷积层进行融合,造成权重的偏差,对性能造成影响。本发明通过基于训练后量化的BN融合策略BQ‑P和基于BN层折叠的量化感知训练策略BNF‑QAT,使得深度神经网络二值化权重的最终精度不会受到BN层参数融合的影响,保持BN融合带来的计算速度提升的同时,消除BN层融合对任务性能的不利影响。
-
公开(公告)号:CN119580068A
公开(公告)日:2025-03-07
申请号:CN202411674703.2
申请日:2024-11-21
Applicant: 北京航天自动控制研究所
Inventor: 谢宇嘉 , 周辉 , 王晓峰 , 盖一帆 , 赵雄波 , 李超然 , 吴松龄 , 董文杰 , 弭寒光 , 王云龙 , 李然 , 路坤锋 , 李晓敏 , 靳蕊溪 , 杨立波 , 高琪 , 康旭冰
IPC: G06V10/82 , G06V20/17 , G06N3/048 , G06N3/0495
Abstract: 本发明提供了一种图像目标识别方法,包括:将图像集中的图像输入训练后的浮点数深度神经网络模型,获取浮点数深度神经网络模型各隐藏层输出浮点数的取值范围;根据浮点数深度神经网络模型各隐藏层输出浮点数的取值范围,结合量化后定点数的目标位宽值,确定每个隐藏层的输出浮点数与定点数非对称量化关系式中的参数;确定每个隐藏层的输出浮点数与定点数非对称量化关系式为:#imgabs0#在浮点数深度神经网络模型的各隐藏层后,分别采用各隐藏层对应的输出浮点数与定点数非对称量化关系式取代ReLU函数,获得定点数神经网络模型;向定点数神经网络模型中输入待测图像,定点数神经网络模型中各隐藏层输出的浮点数转化为定点数,并完成图像目标识别。
-
公开(公告)号:CN117826591A
公开(公告)日:2024-04-05
申请号:CN202311808632.6
申请日:2023-12-26
Applicant: 北京航天自动控制研究所
IPC: G05B13/04
Abstract: 本发明一种基于长短期记忆网络的控制律自动设计方法,借鉴深度学习中网络架构搜索方法经验,利用循环神经网络在时序关联性发掘方面的优势,将控制律结构设计问题转化为有向无环图拓扑关系自动搜索问题,实现飞行控制律控制结构的自动生成,并基于遗传算法实现给定控制律结构下参数的自动整定,目的在于克服当前控制律自动优化只能针对已知控制器结构利用启发式算法对控制器参数进行自动整定的局限,降低了人工设计工作量,提升了复杂设计输入条件下的控制效果。
-
公开(公告)号:CN116048782A
公开(公告)日:2023-05-02
申请号:CN202211589824.8
申请日:2022-12-10
Applicant: 北京航天自动控制研究所
Inventor: 王晓峰 , 路坤锋 , 周辉 , 谢宇嘉 , 赵雄波 , 盖一帆 , 蒋彭龙 , 李晓敏 , 李超然 , 吴松龄 , 林平 , 董文杰 , 弥寒光 , 黄鹂 , 吴敏 , 赵冠杰 , 李杰 , 李杨珺 , 王森 , 杨庆军 , 靳蕊溪 , 林玉野 , 徐天运
IPC: G06F9/50 , G06N3/063 , G06N3/0464
Abstract: 本公开属于人工智能处理器技术领域,具体而言涉及一种基于Winograd的深度学习处理器核心模组,包括:控制模块,接收外部控制单元传递的指令,并产生控制信号;d‑Buffer模块,缓存来及外部的输入特征,所述d‑Buffer模块与所述控制模块相连,所述控制模块控制d‑Buffer模块每个时钟周期的动作;和PE阵列,包括n个独立的计算单元,每个计算单元与d‑Buffer模块相连,所述计算单元计算每个输出通道的卷积,PE阵列进行n个输出通道的并行计算,所述控制模块控制PE阵列每个时钟周期的动作。本公开通过Winograd快速卷积方法解决基于FPGA的深度学习处理器的性能普遍受限于FPGA片上DSP资源数量的限制的问题,降低DSP数量对深度学习处理器性能的限制。
-
公开(公告)号:CN115906956A
公开(公告)日:2023-04-04
申请号:CN202211539304.6
申请日:2022-12-01
Applicant: 北京航天自动控制研究所
Inventor: 谢宇嘉 , 王晓峰 , 李悦 , 周辉 , 赵雄波 , 张辉 , 吴松龄 , 李晓敏 , 杨钧宇 , 路坤峰 , 张隽 , 丛龙剑 , 盖一帆 , 李山山 , 吴敏 , 林玉野 , 靳蕊溪
IPC: G06N3/0495 , G06N3/063 , G06F15/78
Abstract: 本公开涉及一种基于FPGA的神经网络模型轻量化方法,所述方法包括:步骤一、对需要计算的数据集进行预处理获得数据的最大值rmax、数据的最小值rmin、数据的均值m和方差σ2;步骤二、计算截断范围;步骤三、计算量化参数;计算量化所需参数量化步长s和量化零点z;步骤四、根据确定的参数进行量化计算。采用如上技术方案,将神经网络进行了适用于FPGA硬件的量化操作,减小了计算量,提高了计算效率。
-
-
-
-
-
-
-
-
-