基于ASIC与VGG16的图像分类加速方法及装置

    公开(公告)号:CN112396072B

    公开(公告)日:2022-11-25

    申请号:CN201910748316.1

    申请日:2019-08-14

    Applicant: 上海大学

    Abstract: 一种基于ASIC与VGG16的图像分类加速方法及装置,通过将待实现的卷积神经网络配置为相应的ASIC控制指令,然后通过读取预先存储在外部存储中的检测图片与网络权重,通过ASIC并行实现VGG16图像分类神经网络的运算并得到图像分类结果。本发明通过将检测图片与网络权重预先存储在外部存储中,加速模块读取外部存储的数据,以专用集成电路芯片或高性能现场可编程逻辑阵列为平台,利用专用集成电路芯片或高性能现场可编程逻辑阵列高效率的运算能力,对深度学习网络VGG16图像分类网络进行加速,从而实现小体积、低功耗的图像分类加速模块。

    可重构的极化码与低密度奇偶校验码译码器

    公开(公告)号:CN113055025B

    公开(公告)日:2022-11-22

    申请号:CN202110269830.4

    申请日:2021-03-12

    Applicant: 上海大学

    Abstract: 一种可重构的极化码与低密度奇偶校验码译码器,包括:RDU集群、译码控制器、存储控制器和可重构存储器,其中:译码控制器根据译码方式和译码模式对RDU集群中的每个码字的RDU进行动态重新分组、生成指令字并输出至RDU集群和存储控制器,存储控制器根据指令字生成对应的读写控制信号和地址信号并输出至可重构存储器进行读写控制,可重构存储器从RDU集群读取信息数据写入或者读取信息输出至RDU集群。本发明利用LDPC码和极化码的BP译码算法的相似性,实现了可重构的LDPC码和极化码的可重构译码器,与分别单独实现LDPC译码和极化码译码相比节省了硬件资源,提高了硬件资源利用率。

    基于基带-射频联合优化的数字预失真方法及系统

    公开(公告)号:CN113949350A

    公开(公告)日:2022-01-18

    申请号:CN202111219171.X

    申请日:2021-10-20

    Applicant: 上海大学

    Abstract: 一种基于基带‑射频联合优化的数字预失真方法及系统,通过采集真实射频功率放大器的收发信号数据集用于对功率放大模型进行训练获取模型系数矢量,采集基带激励信号数据集输入数字预失真模型后经上变频处理后再输入功率放大模型,得到相应的射频输出信号及其功率频谱图;再将射频输出信号进行下变频与线性滤波得到基带恢复信号后通过后失真器模型得到反馈信号,用于计算激励与反馈之间的误差以及MSE,根据数字预失真模型、功率放大模型的模型系数矢量以及上下变频相关参数计算出非线性互调失真的决定因子数学表达式;最后根据基于基带‑射频特性的联合优化目标函数推导递归最小二乘(RLS)改进算法并根据算法迭代更新数字预失真模型系数矢量,使联合优化目标函数收敛从而实现射频功率放大器的线性优化,令数字指标MSE与射频指标IMDs共同降低。

    基于天线扩展的室内定位方法

    公开(公告)号:CN113852908A

    公开(公告)日:2021-12-28

    申请号:CN202110862915.3

    申请日:2021-07-29

    Applicant: 上海大学

    Abstract: 一种基于天线扩展的室内定位方法,将定位区域分成多个小栅格区域,在每个小栅格中心采集定位区域的CSI数据作为指纹特征;构造位置指纹库并通过CSI相位配后再提取每根天线对应的幅度信息和相位信息;再采用角度域辅助定位的DNN对幅度和相位信息进行特征提取得到训练模型;在线测试阶段,采集实时CSI经相位处理后得出待定位点的位置信息,并通过训练后的角度域辅助定位的深度神经网络根据指纹数据得到位置坐标。本发明在不增加无线链路的基础上,利用更多天线提供的空间多样性和多路复用增益,即更多的CSI指纹特征,进行更好的方向估计和更高精度的定位。

    神经网络实现端到端的定点快速傅里叶变换量化方法及系统

    公开(公告)号:CN113626756A

    公开(公告)日:2021-11-09

    申请号:CN202010380295.5

    申请日:2020-05-08

    Applicant: 上海大学

    Abstract: 一种神经网络实现端到端的定点快速傅里叶变换量化方法及系统,将浮点时域数据通过基于深度学习的神经网络的量化处理得到相应的定点时域数据,并进一步通过定点快速傅里叶变换得到对应的顶点频域数据,再通过基于深度学习的神经网络的去向量处理得到浮点频域数据。本发明使用截断方法满足有限字长的要求并方便地节省内存资源,同时通过机器学习方法联合优化信号的量化与去量化过程,不必需各种先验信息就能够完成信号的量化工作,且适用于任何线性运算。

    基于DDPG的无线定位网络的资源优化方法

    公开(公告)号:CN113597008A

    公开(公告)日:2021-11-02

    申请号:CN202110865555.2

    申请日:2021-07-29

    Applicant: 上海大学

    Abstract: 一种基于DDPG的无线定位网络的资源优化方法,在离线阶段采用位置推理获得的节点之间的距离以及信道参数作为DDPG网络的状态空间,采用各个节点分配到的带宽和功率作为DDPG网络的动作空间,经收益设置和网络训练后,在在线阶段根据代理节点的当前状态信息通过DDPG网络得到最优的带宽和功率分配方案,实现资源分配。本发明利用代理节点配合协同定位,当无线定位网络的资源有限时,将有限的资源合理的分配给各个节点可以有效的提高室内定位的精度,在保证定位精度的同时能够显著减少在线定位阶段进行资源分配时所要消耗的时间。

    基于联合视觉和无线信号特征的高精度室内定位方法

    公开(公告)号:CN112165684B

    公开(公告)日:2021-09-14

    申请号:CN202011045307.5

    申请日:2020-09-28

    Applicant: 上海大学

    Abstract: 一种基于联合视觉和无线信号特征的高精度室内定位方法,在离线阶段对待定位的室内场地采集和构建Wi‑Fi指纹库和图像数据库,获取环境的场景信息;在在线阶段,移动终端实时采集Wi‑Fi指纹数据和图像数据,对采集到的Wi‑Fi指纹数据进行粗定位,确定用户的潜在区域,再对粗定位区域的图像数据采用基于深度神经网络回归的方法,完成精确定位位置的预测。本发明通过融合无线信号特征和视觉特征,在减少计算资源、降低计算复杂度的同时,进一步减小定位误差,实现高精度的室内定位。

    基于FPGA的DMRS信号生成方法
    108.
    发明授权

    公开(公告)号:CN110933003B

    公开(公告)日:2021-09-14

    申请号:CN201911209139.6

    申请日:2019-11-30

    Applicant: 上海大学

    Abstract: 一种基于FPGA的DMRS信号生成系统及方法,包括:用于生成DMRS生成所需的给定参数的参数生成模块、跳组计算模块、译码模块、六个子单元组成的数据计算模块、用于完成整数与小数的计算的乘法模块以及三角函数模块,本发明针对协议3GPP TS 36.211 Release 15版本,实现LTE‑V基带链路系统的DMRS信号生成。同时,基于FPGA进行模块开发,在保证满足LTE‑V系统的低延时要求的前提下,尽可能的减少对FPGA的资源利用,包括DSP单元的使用。

    多码的深度学习译码器的实现方法

    公开(公告)号:CN108809522B

    公开(公告)日:2021-09-14

    申请号:CN201810742784.3

    申请日:2018-07-09

    Applicant: 上海大学

    Abstract: 一种多码的深度学习译码器的实现方法,通过在两种不同的编码之前加入用于区分两种码字的指示节后对接收端神经网络进行训练,训练后的神经网络作为译码器,使用相同的权重同时学习两种不同的编码的编码方式,达到解码时网络吞吐量的提高。本发明通过共用神经网络同时训练两种不同的编码并共享网络权重,在接收端能够使用深度学习,在接收端所得到的信号加入所提出的指示节后同时放入神经网络中进行学习,相比于传统的解码器可以实现近似的误码率性能以及更高的吞吐量增益。

    具有优化资源消耗的定点FFT实现架构

    公开(公告)号:CN113111300A

    公开(公告)日:2021-07-13

    申请号:CN202010031509.8

    申请日:2020-01-13

    Applicant: 上海大学

    Abstract: 一种具有优化资源消耗的定点FFT实现架构,包括:log2 N级蝶形运算模块及其存储模块,每级的蝶形运算由各自的蝶形运算模块及其对应的存储模块配合实现,每级的蝶形运算模块计算该级的全部次蝶形运算,在此基础上通过流水线插入使得处理连续的输入序列时,整个处理器的计算周期大大减少。本发明基于对运算单元的数量优化以及蝶形运算架构,通过基‑2FFT的算法在利用旋转因子的对称性以及在不损失计算结果精度的情况下尽可能减小每一级蝶形运算的字长,利用这两种方法来减少定点FFT运算的资源消耗。

Patent Agency Ranking