-
公开(公告)号:CN113674149B
公开(公告)日:2024-10-29
申请号:CN202110818650.7
申请日:2021-07-20
申请人: 南京航空航天大学
IPC分类号: G06T3/4053 , G06T3/4046 , G06N3/0464 , G06N3/08
摘要: 本发明公开了一种基于卷积神经网络的新型超分辨率重建方法,提出了一种基于自校准卷积和自适应密度连接(SCCADC‑SR)的新型的SR网络。首先,引入了自校准卷积作为基本卷积模块,并将其作为注意力机制的补充;其次,利用有效通道注意(ECA)去构造自适应密集连接结构来处理不同层次的特征;再次,使用CutBlur方法(图像超分辨率中的数据增强手段)对数据进行增强,提高模型的泛化能力;使用长跳跃连接去提高深度模型结构的收敛性;最后,SCCADC‑SR将自集成和模型集成相结合,以便去提高模型的鲁棒性,同时降低了噪声。实验结果表明,无论基于真实退化模型还是基于双三次方退化模型,本发明的SCCADC‑SR模型都优于目前最先进的图像重建方法。
-
公开(公告)号:CN114580718B
公开(公告)日:2024-07-23
申请号:CN202210162399.8
申请日:2022-02-22
申请人: 南京航空航天大学
IPC分类号: G06V10/70 , G06N3/0455 , G06N3/0475 , G06N3/094 , G06N3/0464 , G06V10/40
摘要: 本发明公开了一种基于条件变分生成对抗网络的行人轨迹预测方法,首先对语义地图中的环境信息进行特征提取,接着从预测行人的历史轨迹序列中提取特征信息,基于场景物理环境对行人轨迹的约束和影响,融合条件变分自编码器CVAE和条件生成对抗网络CGAN,设计条件变分生成对抗网络模型Context‑CVGN,实现行人轨迹预测;通过在不同场景下进行训练测试,本发明提供的Context‑CVGN能够综合二者的优点实现整体性能上的最优。整体上本发明提出的算法可以在环境语义信息较为复杂的情况下生成高质量的满足环境条件约束的行人未来轨迹预测结果。
-
公开(公告)号:CN114997067B
公开(公告)日:2024-07-19
申请号:CN202210767796.8
申请日:2022-06-30
申请人: 南京航空航天大学
IPC分类号: G06F30/27 , G06F16/9537 , G06F119/02
摘要: 本发明公开一种基于时空图与空域聚合Transformer网络的轨迹预测方法,解决了现有行人轨迹预测输出存在的交互特征提取不足的问题,使用时空图卷积神经网络以及时序特征变换网络操作完成对场景内行人轨迹特征的有效、准确提取,同时设计一个全新的空域聚合Transformer架构进行行人时序特征变换,完成对空域行人特征的高效聚合与利用,最终以概率分布的形式完成对行人预测轨迹的输出,达到对突发状况进行合理避让、保持组群行人运动一致性的目的,相关指标表明本架构在预测行人终点方面取得了突破,完成对行人轨迹分布更加准确、高效预测的目的,对于自动驾驶、智慧交通等领域的发展提供了重要帮助。
-
公开(公告)号:CN112184912B
公开(公告)日:2024-02-20
申请号:CN202011048867.6
申请日:2020-09-29
申请人: 南京航空航天大学
IPC分类号: G06T17/20 , G06T15/00 , G06N3/0464 , G06N3/08
摘要: 本发明公开了一种基于参数化模型和位置图的多度量三维人脸重建方法,首先,对二维人脸图像对应的三维人脸数据进行预处理;其次,将无约束的二维人脸图像预处理后送入参数子网络,回归得到姿态参数、三维人脸形变模型的身份参数和表情参数;然后,构建记录三维人脸点云数据的位置图,并将其与输入二维人脸图像堆叠生成位置图子网络的输入数据;并将生成的结果输入位置图子网络,回归估计三维人脸的位置图表示;最后,设计损失函数并对模型进行训练。本发明实现对可能出现的各种类型场景的覆盖,有效提升了网络的泛化能力,实现高精度并且更鲁棒的人脸重建效果,对三维人脸重建的研究与应用具有重要的理论意义和应用价值。
-
公开(公告)号:CN110929578B
公开(公告)日:2023-08-08
申请号:CN201911021480.9
申请日:2019-10-25
申请人: 南京航空航天大学
IPC分类号: G06V40/10 , G06V10/26 , G06V10/762 , G06V10/80 , G06V10/82 , G06V10/764 , G06N3/0464 , G06N3/08 , G06N3/045
摘要: 本发明公开一种基于注意力机制的抗遮挡行人检测方法,步骤是:得到行人图片的多层卷积特征,以新型特征金字塔的结构融合,生成包含语义信息和细节信息的新特征层;采用k均值聚类得到预设的行人边界框的尺寸;预测所有行人边界框的回归偏置和分类置信度;计算交叉熵损失函数和改进的自适应遮挡感知回归损失函数,进而得到整体损失函数;迭代优化,不断训练得到检测模型;将待检测图片送入检测模型中,采用非极大值抑制法去除重叠程度高的框,最终得到检测结果。此种方法可改善对遮挡行人的检测能力,具有更高的检测精度和鲁棒性。
-
公开(公告)号:CN115762128A
公开(公告)日:2023-03-07
申请号:CN202211189215.3
申请日:2022-09-28
申请人: 南京航空航天大学
摘要: 本发明公开了一种基于自注意力机制的深度强化学习智能交通信号控制方法,包括路网环境及车流数据建模、深度强化学习算法选择与三要素设计、引入自注意力机制、训练模型的步骤,通过引入自注意力机制,使得神经网络自动地关注重要的状态分量以增强网络的感知能力,提升了信号控制效果,并减少了状态向量设计的难度。
-
公开(公告)号:CN115388884A
公开(公告)日:2022-11-25
申请号:CN202210985024.1
申请日:2022-08-17
申请人: 南京航空航天大学
摘要: 本发明公开了一种智能体位姿估计器联合初始化方法,其步骤包括:首先,构建智能体状态向量,所述状态向量包含智能体当前朝向、位置、速度、陀螺仪和加速度计偏置、GNSS接收机偏置和偏置率、视觉特征深度、里程计坐标系与世界坐标系的偏置信息,并对智能体机载传感器测量数据进行预处理;然后,利用PnP算法求解纯视觉条件下的智能体位姿,并将视觉与IMU的联合初始化构建为最小二乘优化问题,通过带入视觉与IMU先验信息即可完成视觉与IMU的联合初始化;最后,利用SPP算法求解智能体在地心地固坐标系下的粗略位置,并构建GNSS伪距、多普勒频移和接收机时钟偏置的概率因子图模型,即可获得智能体位姿估计器的所有初值。
-
公开(公告)号:CN115018705A
公开(公告)日:2022-09-06
申请号:CN202210593247.3
申请日:2022-05-27
申请人: 南京航空航天大学
摘要: 本发明公开了一种基于增强型生成对抗网络的图像超分辨率算法。主要任务为搭建生成网络和判别网络,并对他们进行训练,最终期望获得可以有效提高图像分辨率的算法模型。其中,在生成网络中,提出采用一种并行卷积密集连接残差块代替原算法中的DenseBlock,增大图像感受野,并添加通道注意力与空间注意力机制在并行卷积密集连接残差块后,将并行密集连接残差块与注意力机制结合作为生成网络基本单元,增强算法对图像高频信息的学习能力,以提高超分辨率效果。
-
公开(公告)号:CN114626598A
公开(公告)日:2022-06-14
申请号:CN202210227310.1
申请日:2022-03-08
申请人: 南京航空航天大学
摘要: 本发明涉及一种基于语义环境建模的多模态行人轨迹预测方法,属于自动驾驶和人工智能领域。在本发明模型框架中,针对现有语义物理环境限制下行人动态交互场景中的多模态轨迹预测的问题与不足,对于原始输出图像使用栅格化语义地图的方式进行高效环境建模,使用条件场景下的变分生成对抗网络架构输出多模态下的行人轨迹,使用判别器对模态匹配轨迹和真值轨迹的距离进行度量,同时设计多元化损失函数,以解决模态坍缩、单一拟合等问题,使得本发明模型能够预测出在该场景语义地图中行人合理的未来轨迹,对于及时、快速预测行人合理轨迹有积极和深刻的意义,对无人驾驶、智能交通等领域的进一步发展有重要的帮助。
-
公开(公告)号:CN114580715A
公开(公告)日:2022-06-03
申请号:CN202210149868.2
申请日:2022-02-18
申请人: 南京航空航天大学
摘要: 本发明公开了一种基于生成对抗网络和长短期记忆模型的行人轨迹预测方法,包括:选择ETH行人轨迹数据集作为数据源,选择Social GAN的方式,借助长短期记忆网络LSTM对行人历史轨迹和当前位置建模,实现行人轨迹预测;其中,生成器使用长短期记忆网络对数据中的每一个行人的历史轨迹进行特征分析;鉴别器部则通过数个全连接层进行输入特征的提取,同样通过LSTM网络进行历史轨迹的特征记忆;考虑到官方的ETH数据集中并不包含人物ID标签信息,通过对ETH数据集和其补充数据集的使用,成功对模型进行了训练,并选择常用轨迹预测指标ADE和FDE作为性能评价指标。
-
-
-
-
-
-
-
-
-