-
公开(公告)号:CN112306951B
公开(公告)日:2022-03-22
申请号:CN202011252879.0
申请日:2020-11-11
Applicant: 哈尔滨工业大学
Abstract: 本发明是一种基于FPGA的CNN‑SVM资源高效型加速架构。本发明涉及嵌入式目标分类、检测技术领域,本发明所述架构包括处理器系统和可编程逻辑系统;所述CNN‑SVM流式架构加速器基于通用的加速算子结构,所述加速算子结构为多个乘累加MAC节点组成的二维阵列,该加速架构可以充分利用数据重用特性,并适用于CNN‑SVM混合算法中包括CNN,FC全连接层和SVM在内的不同类型的层。此外,加速架构中设计的通用算子的流水线间隔可以保持在单个时钟周期从而可以提高加速器的计算效率。
-
公开(公告)号:CN111414994B
公开(公告)日:2022-07-12
申请号:CN202010150245.8
申请日:2020-03-03
Applicant: 哈尔滨工业大学
Abstract: 本发明是一种基于FPGA的Yolov3网络计算加速系统及其加速方法。所述系统包括ARM和FPGA平台架构、片外存储区、AXI_M接口和AXI_S接口,所述ARM平台架构包括核心处理器和数据和内存控制器,所述FPGA平台架构包括加速核心单元、输入缓存端和输出缓存端;所述核心处理器包括ARM Cortex‑A53CPU和L2缓存区,所述片外存储区包括SD卡和外部DDR4,所述加速核心单元包括数据矩阵向量阵列和计算模块。本发明输入和输出缓存端采用多通道并行读取写回的方式代替传统的单通道读写方式,最大化利用了Zynq芯片的带宽。输入缓存端设计双缓存区和寄存器阵列,实现高效的数据复用,成倍提高带宽。
-
公开(公告)号:CN112306951A
公开(公告)日:2021-02-02
申请号:CN202011252879.0
申请日:2020-11-11
Applicant: 哈尔滨工业大学
Abstract: 本发明是一种基于FPGA的CNN‑SVM资源高效型加速架构。本发明涉及嵌入式目标分类、检测技术领域,本发明所述架构包括处理器系统和可编程逻辑系统;所述CNN‑SVM流式架构加速器基于通用的加速算子结构,所述加速算子结构为多个乘累加MAC节点组成的二维阵列,该加速架构可以充分利用数据重用特性,并适用于CNN‑SVM混合算法中包括CNN,FC全连接层和SVM在内的不同类型的层。此外,加速架构中设计的通用算子的流水线间隔可以保持在单个时钟周期从而可以提高加速器的计算效率。
-
公开(公告)号:CN111414994A
公开(公告)日:2020-07-14
申请号:CN202010150245.8
申请日:2020-03-03
Applicant: 哈尔滨工业大学
Abstract: 本发明是一种基于FPGA的Yolov3网络计算加速系统及其加速方法。所述系统包括ARM和FPGA平台架构、片外存储区、AXI_M接口和AXI_S接口,所述ARM平台架构包括核心处理器和数据和内存控制器,所述FPGA平台架构包括加速核心单元、输入缓存端和输出缓存端;所述核心处理器包括ARM Cortex-A53CPU和L2缓存区,所述片外存储区包括SD卡和外部DDR4,所述加速核心单元包括数据矩阵向量阵列和计算模块。本发明输入和输出缓存端采用多通道并行读取写回的方式代替传统的单通道读写方式,最大化利用了Zynq芯片的带宽。输入缓存端设计双缓存区和寄存器阵列,实现高效的数据复用,成倍提高带宽。
-
公开(公告)号:CN111652365B
公开(公告)日:2022-05-17
申请号:CN202010366873.X
申请日:2020-04-30
Applicant: 哈尔滨工业大学
Abstract: 本发明公开了一种用于加速Deep Q‑Network算法的硬件架构及其设计空间探索方法。硬件架构包括:通用处理器模块负责与外部环境进行交互和实现奖励函数的计算,也负责Deep Q‑Network算法经验池的维护;外部DDR存储器负责Deep Q‑Network算法的经验池的存储;AXI总线接口为通用AXI总线接口结构,负责实现通用处理器与FPGA可编程逻辑模块之间控制信号和数据信号的传递与反馈;Target Q模块负责实现Target Q网络的前向推理计算;Current Q模块负责实现Current Q网络的前向推理和反向传播。本发明在高度优化FPGA硬件架构下,实现Deep Q‑Network算法的实时计算。
-
公开(公告)号:CN109859525B
公开(公告)日:2020-12-08
申请号:CN201910266700.8
申请日:2019-04-03
Abstract: 本发明提供基于A星算法的车位导航方法,属于停车位管理技术领域。本发明将停车场划分为网格,每一个网格视为一个顶点;将起点放入集合A中,集合B置空;然后将A中的各顶点按照代价值升序排列,并将第一个顶点Vi放入B中;判断Vi是否为终点,如果是,导航结束;如果不是,扩展Vi的子顶点Vj;如果A、B中都没有Vj,那么将Vj放置到A中并将指针指向它的父级顶点Vi;如果A中存在Vj,则更新集合A中Vj的代价值,并将指针指向Vi;如果B中存在Vj,则该顶点不需考虑;重复上述操作直至导航结束。本发明解决了现有车位导航不能快速有效找到最短路径的问题。本发明可用于停车位管理。
-
公开(公告)号:CN111652365A
公开(公告)日:2020-09-11
申请号:CN202010366873.X
申请日:2020-04-30
Applicant: 哈尔滨工业大学
Abstract: 本发明公开了一种用于加速Deep Q-Network算法的硬件架构及其设计空间探索方法。硬件架构包括:通用处理器模块负责与外部环境进行交互和实现奖励函数的计算,也负责Deep Q-Network算法经验池的维护;外部DDR存储器负责Deep Q-Network算法的经验池的存储;AXI总线接口为通用AXI总线接口结构,负责实现通用处理器与FPGA可编程逻辑模块之间控制信号和数据信号的传递与反馈;Target Q模块负责实现Target Q网络的前向推理计算;Current Q模块负责实现Current Q网络的前向推理和反向传播。本发明在高度优化FPGA硬件架构下,实现Deep Q-Network算法的实时计算。
-
公开(公告)号:CN110413791A
公开(公告)日:2019-11-05
申请号:CN201910718426.3
申请日:2019-08-05
Applicant: 哈尔滨工业大学
IPC: G06F16/35
Abstract: 基于CNN-SVM-KNN组合模型的文本分类方法,本发明涉及基于组合模型的文本分类方法。本发明的目的是为了解决现有方法文本分类准确率低的问题。具体过程为:1:文本预处理;2:对步骤一预处理后后的文本进行特征提取,得到特征提取后的文本;3:基于步骤2建立CNN模型;4:建立CNN-SVM模型;5:建立CNN-KNN模型;6:设定区分阈值d;7:计算距离:计算待分类的样本点到CNN-SVM分类器最优的分类面距离tmp;8:比较距离:当tmp>d时,选择CNN-SVM分类器;否则,选择CNN-KNN分类器;9:重复执行步骤6至步骤9,寻找评价指标最优的d值。本发明用于文本分类领域。
-
公开(公告)号:CN109859525A
公开(公告)日:2019-06-07
申请号:CN201910266700.8
申请日:2019-04-03
Abstract: 本发明提供基于A星算法的车位导航方法,属于停车位管理技术领域。本发明将停车场划分为网格,每一个网格视为一个顶点;将起点放入集合A中,集合B置空;然后将A中的各顶点按照代价值升序排列,并将第一个顶点Vi放入B中;判断Vi是否为终点,如果是,导航结束;如果不是,扩展Vi的子顶点Vj;如果A、B中都没有Vj,那么将Vj放置到A中并将指针指向它的父级顶点Vi;如果A中存在Vj,则更新集合A中Vj的代价值,并将指针指向Vi;如果B中存在Vj,则该顶点不需考虑;重复上述操作直至导航结束。本发明解决了现有车位导航不能快速有效找到最短路径的问题。本发明可用于停车位管理。
-
-
-
-
-
-
-
-