一种基于生成式对抗神经网络的高质量声码器模型

    公开(公告)号:CN115035904B

    公开(公告)日:2025-05-06

    申请号:CN202210391848.6

    申请日:2022-04-14

    Abstract: 本发明公开了一种基于生成式对抗神经网络的高质量声码器模型,该模型首先使用一个生成器模块进行从音频的Mel谱到波形形式的转换,其由含多视野融合块的Unet式沙漏形结构卷积神经网络搭建;使用一个声学特征提取器和多个鉴别器模块对生成的波形进行多重角度的优化;其中声学特征提取器使用传统信号处理方法构建,鉴别器模块由多尺度鉴别器、多周期鉴别器、多相位鉴别器三部分组成,基于卷积神经网络搭建。本发明大幅降低了神经网络的学习难度,节省训练时间和计算资源开销;利用了相位信息和时域上的自相似特征来对生成波形进行优化,获得更高音质的波形;使用了局部化训练策略,可以更自然流畅地合成任意长度的长音频序列。

    一种基于波束成形的RFID均衡读取方法

    公开(公告)号:CN118734872A

    公开(公告)日:2024-10-01

    申请号:CN202310335826.2

    申请日:2023-03-31

    Applicant: 南京大学

    Abstract: 本发明公开了一种基于波束成形的RFID均衡读取方法,包括以下步骤:步骤1,使用基于贝叶斯优化的初始化方式,获得环境中标签的数量,并获得不同波束的可读取标签集合和有效波束集合;步骤2,利用所述有效波束集合,探测每个标签的读取速度,根据读取结果对标签进行划分;步骤3,使用基于集合覆盖模型的均衡读取方式进行掩码选择和波束选择;步骤4,使用选择的掩码和波束进行读取,判断是否完成均衡读取,若是,则结束方法,否则返回步骤3重新选取掩码和波束。本发明不仅提升了真实场景下RFID系统的标签读取率、读全效率和均衡读取效率,并且与现有RFID标准兼容。

    一种基于RFID的虚拟边界构建及检测方法

    公开(公告)号:CN118278435A

    公开(公告)日:2024-07-02

    申请号:CN202410431911.3

    申请日:2024-04-11

    Applicant: 南京大学

    Abstract: 本发明公开了一种基于RFID的虚拟边界构建及检测方法,包括:任意相邻两个RFID标签构建一条虚拟边,所有虚拟边组成一条虚拟边界;获取阅读器读取范围内的所有虚拟边对应的相位梯度及其所属类型;若所述虚拟边为目标类,则作为检测目标进行检测;若所述虚拟边为非目标类,则不作为检测目标;其中,所述相位梯度为构成一条所述虚拟边的两个标签在一段时间内的相位差值;所述所属类型包括目标类和非目标类,所述目标类为阅读器沿当前运动方向即将穿过的所述虚拟边。该方法可在所有符合ISO标准的商用RFID设备上使用,不需要任何额外设备和硬件改变,而且检测精度较高。

    一种视频决策码率确定方法、装置、存储介质及电子装置

    公开(公告)号:CN117640920A

    公开(公告)日:2024-03-01

    申请号:CN202211026597.8

    申请日:2022-08-25

    Abstract: 本申请提供了一种视频决策码率确定方法、装置、存储介质及电子装置,该方法包括:获取传输视频的视频复杂度信息和视频编码信息,根据视频复杂度信息和视频编码信息确定码率预测值和码率预测值的置信区间,获取视频传输过程中的网络状态信息,根据码率预测值、置信区间及网络状态信息确定视频传输的决策码率。本申请通过预测视频编码码率和码率波动范围提前调整编码器,实现了对视频编码码率的实时自适应调节,可以解决相关技术中实际编码码率与设定编码码率之间总是存在一定差值,导致码率决策失误的问题,既实现了对网络带宽的充分利用,又减少了视频卡顿、丢帧现象的发生,提升了用户体验质量。

    一种基于扩散模型的自监督预训练方法

    公开(公告)号:CN116524307A

    公开(公告)日:2023-08-01

    申请号:CN202310350662.0

    申请日:2023-04-04

    Applicant: 南京大学

    Abstract: 本发明提供了一种基于扩散模型的自监督预训练方法,包括以下步骤:步骤1,在预训练的数据集上基于噪声预测的方式训练扩散模型,并将其作为教师网络;步骤2,将步骤1中训练完的扩散模型中U‑Net网络中的上采样部分的特征图提取出来,并进行拼接;步骤3,将学生网络输出的特征图与步骤2中提取的特征图进行对齐,从而对学生网络进行训练;步骤4,通过步骤3训练完的学生网络得到图像的全局特征图。本发明方法对图像中不同区域的语义相关性进行了显式地建模,并且添加了对图像的全局特征的正则化约束,从而大幅提升了通过本发明方法预训练得到的模型在图像分类、目标检测和语义分割等下游任务的性能。

    一种自适应视频传输配置方法和系统

    公开(公告)号:CN113242469B

    公开(公告)日:2022-07-12

    申请号:CN202110429780.1

    申请日:2021-04-21

    Abstract: 本发明提供了一种自适应视频传输配置方法和系统,本发明能够在不使用任何预先编程的模型或者特定假设的情况下,从没有任何先验知识开始,逐渐通过强化学习方法自适应地学习选择视频传输配置,让面向目标检测的实时视频系统实现保持较低传输时延,增强检测准确度性能的多任务目标。本发明使用神经网络来代表视频编码的决策选择过程,神经网络通过将系统的观测值(估计带宽、历史配置)结合视频画面变化的快慢作为输入,以动态可伸缩的方式将丰富多样的观测值映射到下一个时隙的视频编码配置决策中去。经过多次迭代训练后,可以做出高效的视频配置决策,在保持系统较低传输时延的同时,增强系统目标检测性能,具有较好的泛化性能。

    一种基于点云地图的视觉定位方法

    公开(公告)号:CN114723920A

    公开(公告)日:2022-07-08

    申请号:CN202210455895.2

    申请日:2022-04-24

    Abstract: 本发明提供了一种基于点云地图的视觉定位方法,包括点云地图生成模块、视觉惯性里程计构建模块,以及基于点云地图的视觉匹配定位模块。其中点云地图模块通过融合激光,IMU以及GPS信息建立高精度的点云地图;视觉惯性里程计构建模块先提取视觉特征点,使用光流法追踪前后帧特征点,并对IMU进行预积分,和视觉特征点进行融合,构建视觉惯性里程计,输出每一帧的初始位姿,并恢复特征点的深度;基于已有地图的视觉匹配定位模块根据初始位置从点云地图中提取子图,通过视觉恢复的特征点投影到3D空间地图坐标系下,并在当前子图中查询最近点。对于视觉和地图匹配到的最近点,采用基于对偶四元数的RANSAC算法优化当前帧的位姿。

    一种移动机器人定位与建图的方法

    公开(公告)号:CN111795686A

    公开(公告)日:2020-10-20

    申请号:CN202010511607.1

    申请日:2020-06-08

    Abstract: 一种移动机器人定位与建图的方法,包括移动机器人主体、单目相机、IMU传感器和轮速计传感器,单目相机镜头朝向所述移动机器人主体的正前方;处理单目相机获取的每帧图像,获得单目相机的处理值,对每两相邻帧图像间的IMU传感器测量值进行预积分,获得IMU传感器的处理值,对每两相邻帧图像间的轮速计传感器测量值进行预积分,获得轮速计传感器的处理值;将单目相机、IMU传感器和轮速计传感器的处理值加入滑动窗口;获取滑动窗口的处理值,对所述移动机器人的位姿、特征点的坐标、IMU陀螺仪偏差、线速度和尺度因子进行初始化;初始化成功后,构建因子图模型获得待估计状态值,对滑动窗口的处理值和待估计状态值进行非线性优化,得到所述移动机器人的位姿和地图。

Patent Agency Ranking