一种FAST特征均匀化提取与帧间特征误匹配去除方法

    公开(公告)号:CN111160362B

    公开(公告)日:2023-07-11

    申请号:CN201911179598.4

    申请日:2019-11-27

    Applicant: 东南大学

    Abstract: 本发明公开了一种FAST特征均匀化提取与帧间特征误匹配去除方法,先采用FAST特征均匀化提取方法使在全图范围内尽可能获得均匀且有质量的FAST特征点,并不产生额外计算开销,再基于IMU的帧间特征误匹配去除方法使用IMU传感器数据(加速度和角速度)通过计算相邻图像之间的平移和旋转变换,由此推导基础矩阵模型并判断:当相机静止时,根据特征匹配的运动矢量长度判断并去除特征误匹配;当相机运动时,根据特征匹配是否符合基础矩阵模型来判断并去除特征误匹配。

    基于FPGA高能效实现深度学习视差估计算法的方法

    公开(公告)号:CN110910434B

    公开(公告)日:2023-05-12

    申请号:CN201911069381.8

    申请日:2019-11-05

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于FPGA高能效实现深度学习视差估计的方法,包括以下步骤:从FPGA片上内存上读取当前卷积计算子单元所需的、以低位宽数据格式存储的权值数据,并对该权值数据进行数据还原,降低访存代价;S200:对上一个卷积计算子单元输出的特征数据和经过数据还原的权值数据依次进行跳零卷积计算、池化计算和通道混洗计算,输出下一个卷积计算子单元所需的特征图,跳零卷积以及通道混洗进一步减少计算以及访存能耗开销;S300:循环执行S100和S200,直至最后一个卷积计算单元完成计算,输出特征图;S400:对S300输出的特征图中的特征数据进行反卷积计算得到深度信息。

    基于全二值卷积的极少计算量的端到端双目立体匹配网络

    公开(公告)号:CN114819074A

    公开(公告)日:2022-07-29

    申请号:CN202210408581.7

    申请日:2022-04-19

    Applicant: 东南大学

    Inventor: 齐志 蔡家璇 刘昊

    Abstract: 本发明公开了一种全二值卷积的极少计算量的端到端双目立体匹配网络(PBCStereo),用于双目深度估计任务。基于二值卷积模块、二值上采样模块、输入层编码方法的设计,PBCStereo中的所有卷积过程都为二值卷积。与其他依赖于浮点卷积的双目立体匹配方法相比,PBCStereo节省了10倍以上的计算次数,对于输入分辨率为512*256的输入图像对,PBCStere完成深度估计的计算量开销仅为0.64G OPs。因此,PBCStereo更容易被部署在计算资源受限的边缘设备上,同时它在SceneFlow与KITTI数据集上也实现了相当的准确性,SceneFlow上的端点误差为1.84,KITTI 2012上的三像素点误差百分比为4.46%,KITTI 2015上的三像素点误差百分比为4.73%。

    基于粒子群算法的二维片上网络自适应路由方法

    公开(公告)号:CN108183860B

    公开(公告)日:2021-04-13

    申请号:CN201810052222.6

    申请日:2018-01-19

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于粒子群算法的二维片上网络自适应路由方法,在网络中将源节点到目的节点的路径编码为粒子,将所有可能的路径编码作为粒子的搜索空间,每个粒子有位置和速度两个属性;路由开始时,源节点向目的节点按照确定性路由进行数据传输,选择N条有效路径作为初始种群粒子;粒子群算法迭代时,每个粒子的适应度值由该粒子所包含路径节点的延迟和节点的数据吞吐量决定,找出当前粒子种群中适应度最好的值,同时记录各粒子的历史最好适应度值,更新各粒子的位置和速度变量;迭代完成后,历史最好适应度值的粒子的位置即为最优的路由路径。该方法可以动态的调节数据包在网络中的传输路径,在降低网络延迟的同时使得整个网络负载均衡。

    一种GPU L1 Cache处访存序列的仿真生成与排序方法

    公开(公告)号:CN106407063A

    公开(公告)日:2017-02-15

    申请号:CN201610889218.6

    申请日:2016-10-11

    Applicant: 东南大学

    Inventor: 齐志 张亚 时龙兴

    CPC classification number: G06F11/26

    Abstract: 本发明公开的一种GPU L1 Cache处访存序列的仿真生成与排序方法,包含访存序列生成、线程调度、访存合并和访存排序共四个步骤,使用GPU功能模拟器生成GPU应用程序各线程初始的访存序列,在充分解析GPU访存系统微结构特征后,对该访存序列采取线程调度、访存合并和访存排序三大步骤,最终得到GPU应用程序在GPU L1 Cache处的仿真访存序列。该访存序列便于进行GPU L1 Cache缺失行为特征分析。

    用于实现可重构系统中多任务调度的管理单元和方法

    公开(公告)号:CN103455367B

    公开(公告)日:2016-11-16

    申请号:CN201310338040.2

    申请日:2013-08-05

    Applicant: 东南大学

    Abstract: 本发明公开了一种用于实现可重构系统中多任务调度的管理单元和方法,包括任务生成模块、任务解析模块和任务发送接口模块;所述任务生成模块:用于生成可重构阵列的任务,包括配置可重构阵列功能的配置信息、配置数据流的配置信息、相应的目标可重构阵列编号以及任务编号;所述任务解析模块:用于缓存并解析任务中包含的目标可重构阵列编号及任务编号;所述任务发送接口模块:用于传送任务给相应的可重构阵列,当任务解析模块中发现任务的目标可重构阵列相同时,将该任务同时发送给多个可重构阵列。本发明提高复杂的可重构系统动态重构效率。

    一种可重构系统中隐藏存储访问延时的方法

    公开(公告)号:CN103559154B

    公开(公告)日:2016-03-23

    申请号:CN201310546199.3

    申请日:2013-11-06

    Applicant: 东南大学

    Abstract: 本发明公开了一种可重构系统中隐藏存储访问延时的方法,先对算法源码进行编译得到算法配置信息和启动间隔II,根据启动间隔II获得停顿阈值周期数Tt和有效访存延时周期数Td并将停顿阈值周期数Tt以及有效访存延时周期数Td载入数据流控制器,同时将算法配置信息载入可重构阵列。利用对停顿阈值周期数Tt和有效访存延时周期数Td的监控,使可重构阵列在非停顿周期执行与已发出访存请求无数据依赖的操作,在停顿周期时接收应当返回的数据。本发明实现访存与运算的重叠执行,提高了可重构系统的性能和资源利用率,达到隐藏存储访问延时的目的;且无需对原可重构编译器进行任何修改,无需编程人员介入,即可实现发明目的,减轻开发难度。

    一种应用于粗粒度可重构阵列的自动映射方法

    公开(公告)号:CN103116493B

    公开(公告)日:2016-01-06

    申请号:CN201310027776.8

    申请日:2013-01-21

    Applicant: 东南大学

    Abstract: 本发明公开了一种应用于粗粒度可重构阵列的自动映射方法,包括以下步骤:将用高级语言编写的应用算法,划分为由主控处理器执行的软件部分和由可重构阵列加速的硬件部分;对在阵列上加速的硬件部分,使用编译器进行编译,得到描述此部分代码的数据流图;选择数据流图中待映射的操作节点并映射到阵列上,对剩余的操作节点反复进行上述选择,直到数据流图中的所有操作节点都被映射,得到可在阵列上运行的配置文件;将得到的配置文件与由主控处理器执行的软件部分整合,得到整合后的新的应用算法;将新的应用算法用主控处理器的编译器进行编译,生成能在硬件上运行的机器代码。本发明实现对可重构阵列硬件资源的高效分配和调度,以减少映射时间。

    基于预先解码分析的数据信息缓存管理方法及系统

    公开(公告)号:CN103034455B

    公开(公告)日:2015-09-16

    申请号:CN201210535995.2

    申请日:2012-12-13

    Applicant: 东南大学

    CPC classification number: G06F12/0862

    Abstract: 本发明公开了一种基于预先解码分析的数据信息缓存管理系统,包括流媒体处理器模块、数据信息预取FIFO模块、数据信息缓存单元和数据信息缓存控制器模块。本发明还公开了一种利用如上所述基于预先解码分析的数据信息缓存管理系统的管理方法。本发明通过尽量利用重复数据,减少数据传输时间,减少数据带宽占用及在外部存储器中的换行延迟,以提高大规模粗粒度可重构系统的数据访问效率,使得性能提升。

    一种普适的手机平台VPU视频编解码性能检测方法

    公开(公告)号:CN104469368A

    公开(公告)日:2015-03-25

    申请号:CN201410742098.8

    申请日:2014-12-08

    Applicant: 东南大学

    Abstract: 本发明公开了一种普适手机平台的视频处理单元(VPU)的H.264视频编解码性能检测方法,包括:手机平台利用VPU进行H.264视频编解码的系统搭建、YUV视频序列H.264编码速率的测试、YUV视频序列H.264编码功耗的测试、YUV视频序列H.264编码PSNR的测试、H.264视频流解码速率的测试以及H.264视频流解码功耗的测试。本发明是一种能够适应各种手机型号的并在手机平台上实现检测上述VPU H.264编解码的极限性能的方案,本发明避免了传统只能适应某种型号手机进行VPU H.264编解码的弊端,并能对其编解码性能高效准确的测试。

Patent Agency Ranking