-
公开(公告)号:CN119135879A
公开(公告)日:2024-12-13
申请号:CN202411105461.5
申请日:2024-08-13
Applicant: 南京信息工程大学
IPC: H04N17/00 , H04N21/234 , H04N21/24 , H04N21/442 , H04N21/44 , H04N21/647 , G06V10/98 , G06V10/82 , G06V20/40 , G06N3/0464
Abstract: 本发明公开了一种视频质量评价方法及系统,涉及视频质量评价技术领域,方法包括:获取UGC视频以及UGC视频对应的文本描述,将UGC视频分别输入至预先建立的Conv2Former模型和SlowFast模型内,输出得到空间特征和时间特征,将空间特征和时间特征进行融合,得到最终输出特征;将UGC视频对应的文本描述输入至预先建立的Transformer模型内,输出得到文本特征,其中,所述文本特征包括视频内容的语义信息和视频质量的评价;将最终输出特征与文本特征相融合,得到融合特征,将融合特征输入至预先建立的MLP网络模型内,输出得到视频质量分数。
-
公开(公告)号:CN118660186A
公开(公告)日:2024-09-17
申请号:CN202411124016.3
申请日:2024-08-16
Applicant: 南京信息工程大学
IPC: H04N21/2343 , H04N21/4402 , H04N23/698 , G06T3/4053 , G06T3/4046 , G06V20/40 , G06V10/44 , G06V10/82 , G06V10/80 , G06N3/0464 , G06N3/0455
Abstract: 本发明公开了基于神经和多尺度特征融合的360度视频传输方法及系统,涉及视频流传输技术领域,包括:获取360度视频,对360度视频进行预处理,得到预处理后的360度视频,对预处理后的360度视频输入至预先建立的时空下采样模型内,输出得到多尺度特征和低分辨率视频帧;将低分辨率视频帧进行掩码编码,得到处理后的掩码帧,将掩码帧进行重构,得到重建的LR帧;对重建的LR帧和多尺度特征输入至预先建立的上采样超分辨率模型内,输出得到优化后的超分辨率视频帧,能显著减少端到端传输过程中的数据冗余,实现理想的视觉质量。
-
公开(公告)号:CN113808022A
公开(公告)日:2021-12-17
申请号:CN202111105966.8
申请日:2021-09-22
Applicant: 南京信息工程大学
Abstract: 本发明公开了一种基于端侧深度学习的手机全景拍摄与合成方法,主要利用基于端侧推理框架与深度神经网络模型对手机前、后摄拍摄内容进行图像拼接、图像增强去模糊以及图像内容补全,还原最真实的拍摄与合成场景,不仅能够扩大拍摄的视野范围,观察视角也能改变,给用户一种临场感,并且无需任何专业的全景拍摄设备,随时随地打开手机就可以进行拍摄。降低了VR拍摄与合成的门槛,每个用户使用手机即可进行VR全景拍摄。
-
公开(公告)号:CN117808766A
公开(公告)日:2024-04-02
申请号:CN202311846522.9
申请日:2023-12-29
Applicant: 南京信息工程大学
IPC: G06T7/00 , G06N3/045 , G06N3/0464 , G06N3/0442 , G06N3/049 , G06N3/0895
Abstract: 本发明公开了一种基于Conv2Former和对比学习的视频质量评价方法及装置,该方法利用Conv2Former作为空间特征提取模块并结合特征金字塔技术,对视频帧进行空间特征提取。再利用Attention‑LSTM模型,处理视频的时序信息,以捕捉视频帧之间的时间关系。最后,通过一个MLP层将时序特征映射为最终的视频质量评分。为了解决数据不足问题,采用对比学习进行预训练,利用未标记的数据来学习更具有判别性的特征表示,从而提升模型性能和泛化能力。本发明提出的深度学习模型能够在保持较高的计算效率的同时提取空间特征,并实现视频质量评价的准确和自动化,特别是通过对比学习进行预训练,为解决视频质量评价中标记数据不足的问题提供了一种可靠的解决方案。
-
公开(公告)号:CN117454223A
公开(公告)日:2024-01-26
申请号:CN202311428026.1
申请日:2023-10-31
Applicant: 南京信息工程大学
IPC: G06F18/24 , G06F18/214 , G06F18/21
Abstract: 本发明公开了一种基于对比学习的点云分类领域自适应方法,包括如下步骤:获取目标域的实际点云集,输入至训练好的点云分类模型,得到目标域的点云分类结果;模型的训练方法如下:获取源域和目标域的原始点云集,分别进行增强操作,得到源域和目标域的增强点云集;以最小化总损失函数为目标,优化训练点云分类模型;增强操作包括:基于FPS算法将原始点云分为两个部分点云;分别对两个部分点云进行噪声扰动后再进行拼接得到更新点云;对更新点云同时进行两次增强处理,得到两个增强点云;汇总增强点云,得到增强点云集。本发明通过结合局部增强和全局增强,能够有效地提高增强点云集样本的多样性和难度,从而提高模型的性能和泛化能力。
-
公开(公告)号:CN117333398A
公开(公告)日:2024-01-02
申请号:CN202311398669.6
申请日:2023-10-26
Applicant: 南京信息工程大学
Abstract: 本发明公开了一种基于自监督的多尺度图像去噪方法及装置,以实现图像噪声去除。方法包括两个关键阶段:预训练阶段和微调阶段。在预训练阶段,利用合成噪声图像进行去噪模块的预训练,为网络建立初始的去噪能力。为了解决真实噪声图像中存在的空间相关性,引入像素重组下采样技术,有效地破解噪声之间的相关性。输出去噪后的图像,并与输入的原始图像计算两者之间的损失函数LMDM。在微调阶段,通过多个卷积层和残差块实现多尺度特征提取,同时应用上下文模块捕获多尺度信息,从而有效地进行图像去噪。本发明利用自监督学习,对真实世界中的噪声图像进行去噪,实现了图像噪声去除。
-
公开(公告)号:CN115311253A
公开(公告)日:2022-11-08
申请号:CN202211081284.2
申请日:2022-09-05
Applicant: 南京信息工程大学
Abstract: 本发明公开了一种基于高频提取和知识蒸馏的图像质量评估方法,根据训练好的学生降质特征提取模块提取的降质图像特征、教师降质特征提取模块提取的原始质量图像特征、训练好的学生高频特征提取模块提取的学生高频特征、教师高频特征提取模块提取的教师高频特征、复原特征提取网络提取的复原特征以及质量预测模块输出的第一、第二和第三质量分数,计算图像质量评估模型的总损失函数;以总损失函数最小为目标优化所提出的图像质量评估模型,当损失下降并保持稳定时认为训练结束,得到训练好的图像质量评估模型;将复原图像输入训练好的图像质量评估模型,输出复原图像的质量分数。本发明有利于提高对感知图片质量的预测。
-
公开(公告)号:CN113704207A
公开(公告)日:2021-11-26
申请号:CN202110912060.0
申请日:2021-08-10
Applicant: 南京信息工程大学
IPC: G06F16/174 , G06F16/16
Abstract: 本发明公开了一种基于视频压缩技术的高空气象数据压缩及解码方法,对高空探测到的数据进行压缩,使探测到的数据在传输到地面的过程中更加及时,也会相应的减少一定的误差,提高数据传输过程中的准确性、稳定性。同时,也让其适应了更多的应用环境,比如在高空中传输数据可能会受到众多环境因素的影响,而通过将数据以较高的压缩比压缩,使其传输更加及时有效。
-
公开(公告)号:CN118585964B
公开(公告)日:2024-10-18
申请号:CN202411074751.8
申请日:2024-08-07
Applicant: 南京信息工程大学
IPC: G06F18/25 , G06N3/0464 , G06N3/0455 , G06N3/0442 , G06N3/084 , G06N3/048
Abstract: 本发明公开了视音相关性特征融合策略的视频显著性预测方法及系统,涉及视频显著性预测技术领域。本发明包括:接收视频及音频数据,对视频数据进行预处理,得到连续的视频帧;采用预训练后的S3D作为视觉编码器,结合空洞空间金字塔池化和局部重要性池化,根据视频帧提取得到多尺度视觉时空特征;将多尺度视觉时空特征输入到多尺度特征协同模块中,通过在网络的不同层次提取和融合多尺度特征,得到增强特征,用于丰富其在对于不同大小物体的表征能力。本发明通过具有相关性感知的多头交叉注意力机制,根据音视频特征的语义相关性动态调整融合策略,有效避免了背景音频等无关音频对显著性预测的干扰,提高了预测的精度。
-
公开(公告)号:CN113704207B
公开(公告)日:2023-05-09
申请号:CN202110912060.0
申请日:2021-08-10
Applicant: 南京信息工程大学
IPC: G06F16/174 , G06F16/16
Abstract: 本发明公开了一种基于视频压缩技术的高空气象数据压缩及解码方法,对高空探测到的数据进行压缩,使探测到的数据在传输到地面的过程中更加及时,也会相应的减少一定的误差,提高数据传输过程中的准确性、稳定性。同时,也让其适应了更多的应用环境,比如在高空中传输数据可能会受到众多环境因素的影响,而通过将数据以较高的压缩比压缩,使其传输更加及时有效。
-
-
-
-
-
-
-
-
-