-
公开(公告)号:CN119206088A
公开(公告)日:2024-12-27
申请号:CN202411676372.6
申请日:2024-11-22
Applicant: 南京信息工程大学
Abstract: 本发明公开了基于数据驱动压缩与自适应分裂的高效三维重建方法,包括:获取多视角图像生成3D高斯;构建掩码生成网络和判别网络,掩码生成网络生成掩码,筛选被消除的3D高斯;通过可微光栅渲染器优化3D高斯的属性;利用掩码进行高斯选择和消除,生成部分高斯被消除后的渲染图;若达到预设迭代次数,则根据3D高斯对场景的贡献进行保留或消除;否则进行高斯分裂或复制操作。通过掩码生成网络和判别网络的对抗性学习以及重建损失优化,在减少高斯数量的同时实现高精度的三维场景重建。本发明适用于各种三维重建场景,能够大幅提高渲染速度,减少计算资源消耗,同时保持重建结果的视觉质量,适用于虚拟现实、增强现实、电影特效等领域。
-
公开(公告)号:CN118658106B
公开(公告)日:2024-11-22
申请号:CN202411132278.4
申请日:2024-08-19
Applicant: 南京信息工程大学
Abstract: 本发明公开一种基于特征解耦增强的文本生成视频方法,属于文本生成视频技术领域。其包括,将用户文本输入到预先训练好的文本生成视频网络模型中,得到与所述用户文本描述相符的视频;其中,所述文本生成视频网络模型包括视觉特征解耦网络、跨帧注意力模块及时间注意力模块,所述视觉特征解耦网络用于将视频特征进行解耦分层,所述跨帧注意力模块用于加强解耦分层的视频特征连续三帧的关联,所述时间注意力模块用于加强经过跨帧注意力输出的隐层特征全局帧的关联;本发明适用于文本生成视频,能够有效提升了生成视频细节质量。
-
公开(公告)号:CN118735978B
公开(公告)日:2024-11-15
申请号:CN202411210367.6
申请日:2024-08-30
Applicant: 南京信息工程大学
IPC: G06F30/27
Abstract: 本发明公开了图像处理领域的一种单目图像深度估计方法和存储介质,方法包括:获取待估计的单目图像并预处理;将图像输入预先训练的初步深度估计网络和迭代优化网络,获得最终的单目图像深度估计结果;初步深度估计网络包括编码器、解码器和回归头,解码器包含解码层,解码层采用三元组交叉注意力TCA模块,TCA模块对图像的处理包括:WCA模块计算注意力,输出窗口注意力特征;CDA模块计算注意力,输出跨维度注意力特征;REA模块计算注意力,输出相关性注意力特征;FBSF模块融合WCA、CDA和REA模块的输出结果,生成本解码层的输出特征。能够兼顾局部、全局信息和信息间的相关性得到更准确的单目图像深度估计结果。
-
公开(公告)号:CN117876370B
公开(公告)日:2024-06-07
申请号:CN202410271154.8
申请日:2024-03-11
Applicant: 南京信息工程大学
IPC: G06T7/00 , G06T7/11 , G06T7/12 , G06N3/0455 , G06N3/0464 , G06N3/048 , G06N3/08
Abstract: 本发明公开了基于三维轴向Transformer模型的CT图像肾脏肿瘤分割系统,数据集生成模块中对CT图像进行预处理生成图像数据集;第一阶段模型获得模块中构建ATrans Unet深度学习网络并进行训练,得到第一阶段模型;第二阶段模型获得模块中对图像数据集进行处理得到第二阶段图像数据集,训练ATrans Unet深度学习网络得到第二阶段模型;掩膜获取模块中将CT图像输入第一阶段模型,得到第一掩膜,根据第一掩膜裁剪CT图像后输入第二阶段模型,得到第二掩膜;分割结果获得模块中结合第一掩膜和第二掩膜得到第三掩膜,并对其进行后处理得到最终的分割图像。本发明实现了CT图像序列中肾脏及其肿瘤区域的准确分割。
-
公开(公告)号:CN112365476B
公开(公告)日:2023-12-08
申请号:CN202011268313.7
申请日:2020-11-13
Applicant: 南京信息工程大学
IPC: G06T7/00 , G06V10/774 , G06V10/764 , G06N3/0464 , G06V10/82 , G06N3/084
Abstract: 本发明涉及一种基于双通路深度网络的雾天能见度检测方法,包括采集高速公路监控图像,根据能见度距离分类为若干等级,并划分为训练数据集与测试数据集;构建雾天能见度检测的双通路深度网络模型,两条通路分别学习暗通道先验信息与雾天图像的深度特征,并联合两类特征通过全连接层进行分类;设计用于优化网络模型参数学习的目标函数,预设网络模型的训练超参;将训练数据送入网络模型中,根据目标函数,采用Adam优化器实现模型参数的迭代优化与更新;训练完成的网络模型可实现对高速公路雾天能见度等级的端对端分类,预测高速公路监控图像的能见度等级。本发明可实现高速公路雾天(56)对比文件闫宏艳.基于深度卷积网络的高速公路雾天能见度检测《.中国优秀硕士学位论文全文数据库 工程科技Ⅰ辑》.2023,(第1期),B026-200.
-
公开(公告)号:CN110728728B
公开(公告)日:2023-04-21
申请号:CN201910874274.6
申请日:2019-09-17
Applicant: 南京信息工程大学
IPC: G06T11/00
Abstract: 本发明公开了一种基于非局部正则的压缩感知网络图像重建方法,首先获取图像数据,进行归一化处理,对图像序列进行采样,获得相应的测量向量;获取图像尺寸,根据该大小设置随机噪声,构建压缩感知网络模型,将随机噪声与测量向量作为网络的输入,添加非局部正则约束,设计目标函数,预设网络模型的超参数;采用半二次分裂算法对所设计的目标函数进行求解,交替迭代优化所构造的压缩感知网络模型,并进行正则项参数的更新,直至满足迭代结束条件;迭代过程结束后,根据当前次迭代结果计算得到重建后的图片序列,从而实现非局部正则约束的压缩感知网络重建。本发明可以在低采样的情况下,不需要对网络预训练,便可重建出接近原图的图像。
-
公开(公告)号:CN114627382B
公开(公告)日:2022-07-22
申请号:CN202210508579.7
申请日:2022-05-11
Applicant: 南京信息工程大学
IPC: G06V20/10 , G06V20/52 , G06V20/58 , G06V10/774 , G06V10/764 , G06V10/80 , G06V10/82 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本申请涉及一种联合行道线几何先验的高速公路雾天能见度检测方法。该方法包括:实时获取高速公路上的摄像头拍摄的高速公路雾天情况的图像数据;将高速公路雾天情况的图像数据输入到训练好的双分支分类网络模型的行道线检测分支和深度神经网络视觉特征提取分支,对应输出行道线检测标签和道路区域的视觉特征;训练好的双分支分类网络模型的融合分类模块根据行道线检测标签计算高速公路可见区域的长度特征,并融合道路区域的视觉特征进行分类,确定摄像头拍摄的高速公路对应的雾天能见度等级,联合行道线长度特征进行分类,分类准确度高,从而提高了高速公路雾天能见度检测的准确率。
-
公开(公告)号:CN112365476A
公开(公告)日:2021-02-12
申请号:CN202011268313.7
申请日:2020-11-13
Applicant: 南京信息工程大学
Abstract: 本发明涉及一种基于双通路深度网络的雾天能见度检测方法,包括采集高速公路监控图像,根据能见度距离分类为若干等级,并划分为训练数据集与测试数据集;构建雾天能见度检测的双通路深度网络模型,两条通路分别学习暗通道先验信息与雾天图像的深度特征,并联合两类特征通过全连接层进行分类;设计用于优化网络模型参数学习的目标函数,预设网络模型的训练超参;将训练数据送入网络模型中,根据目标函数,采用Adam优化器实现模型参数的迭代优化与更新;训练完成的网络模型可实现对高速公路雾天能见度等级的端对端分类,预测高速公路监控图像的能见度等级。本发明可实现高速公路雾天能见度等级的自动检测,为公路管理部门的智能化管理提供技术支撑。
-
公开(公告)号:CN112258526A
公开(公告)日:2021-01-22
申请号:CN202011199922.1
申请日:2020-10-30
Applicant: 南京信息工程大学
Abstract: 本发明公开了一种基于对偶注意力机制的CT肾脏区域级联分割方法,包括如下步骤:S101、对原始CT图片进行预处理操作,获得训练数据集;S102、设计三维对偶注意力机制模块,充分提取完备的特征信息;S103、构建三维对偶注意力模块驱动的CT图像肾脏感兴趣区域级联分割网络;S104、设计级联分割网络的损失函数,并学习网络参数;S105、将S101得到的训练数据下采样一倍作为输入,送入S103的级联分割网络的第一级粗分割网络;把第一级粗分割网络的结果上采样一倍,与原始输入的训练数据融合后送入第二级细分割网络学习,并获得最终分割结果。本发明可以显著提高对肾脏及其感兴趣区域的分割精度。
-
公开(公告)号:CN110399909A
公开(公告)日:2019-11-01
申请号:CN201910609358.7
申请日:2019-07-08
Applicant: 南京信息工程大学
IPC: G06K9/62
Abstract: 本发明公开了一种基于标签约束弹性网图模型的高光谱图像分类方法。步骤:对待高光谱图像进行EMP特征提取,构建空谱联合特征;根据空谱联合特征进行标签约束传递,获得全局约束矩阵;根据全局约束矩阵,针对每个像素点构建字典;根据字典求解弹性网表示,构建标签约束的弹性网图模型;基于弹性网图模型进行半监督分类,得到标签矩阵,实现高光谱图像分类。本发明可以降低计算的复杂度,提高构图的准确性,提升算法分类性能。
-
-
-
-
-
-
-
-
-