-
公开(公告)号:CN111539909B
公开(公告)日:2023-04-28
申请号:CN202010172380.2
申请日:2020-03-12
Applicant: 上海交通大学
IPC: G06T7/00 , G06V10/764 , G06V10/80
Abstract: 本发明提供了一种相似场景图像组的图像质量评估方法、系统及终端,对场景内容一致的图像组数据进行独立自由能值和耦合自由能值的计算,得到分别以图像自身为先验知识的独立自由能值和分别以剩余图像为先验知识的耦合自由能值;利用独立自由能估计对组内图像局部区块的关注程度;利用耦合自由能值估计对组内图像局部失真的感知程度;对相似场景图像组所有的局部区块的失真感知程度和关注程度作为整体图像组的特征,对特征进行融合,生成整体图像组的视觉感知质量结果。该方法较好地解决了相似场景图像组的质量评估的问题。
-
公开(公告)号:CN114240820A
公开(公告)日:2022-03-25
申请号:CN202111230351.8
申请日:2021-10-21
Applicant: 上海交通大学
Abstract: 本发明提供一种细颗粒压缩图像质量评价方法,包括:获取图像结构特征;获取图像纹理特征;将所述图像结构特征和图像纹理特征进行融合,得到细颗粒压缩图像质量评价分数;依据所述的细颗粒压缩图像质量评价分数,对细颗粒压缩图像质量进行评价。本发明可以有效地用于评价比特率差异不大的压缩图像质量好坏,这对图像压缩技术以及图像压缩质量评价技术的发展有着重要的意义。
-
公开(公告)号:CN113628175A
公开(公告)日:2021-11-09
申请号:CN202110829971.7
申请日:2021-07-22
Applicant: 上海交通大学
Abstract: 本发明公开一种图像质量分数分布的预测方法、系统、终端及介质,其中方法包括:提取图像的自然场景统计特征;利用提取的所述自然场景统计特征通过训练四个不同的支持向量机;采用训练得到的所述支持向量机来预测图像质量分数分布的四个参数,最终得到基于Alpha稳定模型的图像质量分数分布。本发明第一次提出使用Alpha稳定模型来描述图像质量得分的分布,其所表达出的信息要比图像的MOS更丰富,通过提取图像的自然场景统计特征,并利用支持向量机回归,可有效地预测图像的质量分数分布。
-
公开(公告)号:CN111479109B
公开(公告)日:2021-06-29
申请号:CN202010172444.9
申请日:2020-03-12
Applicant: 上海交通大学
IPC: H04N17/00 , H04N21/234 , H04N21/44
Abstract: 本发明提供了一种基于视听联合注意的视频质量评价方法、系统及终端,该方法在传统基于视觉注意的视频质量评价方法的基础上,通过纳入听觉对视觉注意的影响,构建更加全面的视听联合注意力模型,然后在视频局部失真池化的时候引入基于视听联合注意的加权池化,从而更好地辅助视频质量评价;该方法主要包含三大步骤:构建视听联合注意力模型,视频局部失真度量,基于视听联合注意的局部失真池化。本发明可以更全面地考虑听觉对视觉注意的影响,从而利用视听联合注意更有效地辅助视频质量评价。
-
公开(公告)号:CN111539250A
公开(公告)日:2020-08-14
申请号:CN202010171560.9
申请日:2020-03-12
Applicant: 上海交通大学
Abstract: 本发明提供一种基于神经网络的图像雾浓度估计方法、系统和终端,方法包括:采用卷积神经网络自动提取待测图像的特征;将提取的待测图像的所述特征采用最大池化层与卷积层进行特征映射;计算映射后的所述特征中的最大值和平均值,并将两者进行融合;对于融合后的特征进行激活;对激活得到的特征取平均,得到的结果为最后整幅图像的雾浓度。所述系统包括特征提取模块、特征映射模块、局部统计值集散模块和最大值均值融合模块。本发明能很好的预测雾浓度的大小,并且与人类的主观评价高度一致,可以对任意大小的雾图像进行雾浓度的估计。
-
公开(公告)号:CN111488886A
公开(公告)日:2020-08-04
申请号:CN202010171615.6
申请日:2020-03-12
Applicant: 上海交通大学
Abstract: 本发明提供了一种基于排列注意力特征的全景图像显著性预测方法,包括:提取模板特征图和逐通道特征图,将所述模板特征图和所述逐通道特征图进行相乘生成逐通道特征;将生成的所述逐通道特征进行注意力特征排列;根据排序结果,选择对细粒度显著性预测有用的所述逐通道特征进行特征增强,将选择的所述逐通道特征输入到卷积神经网络中进行头部注视点的预测。本发明还提供与上述方法对应的系统及终端。本发明不仅可以较好的模拟人类视觉注意力机制,而且也得到了较高的预测准确率。
-
公开(公告)号:CN117934704A
公开(公告)日:2024-04-26
申请号:CN202311729804.0
申请日:2023-12-15
Applicant: 宁波东方理工大学(暂名) , 上海交通大学
IPC: G06T17/00 , G06N3/045 , G06N3/0499 , G06N3/08
Abstract: 本发明公开了一种用于人人交互场景的三维人体反应生成方法与系统,涉及三维成像技术领域,主要包括步骤:通过扩散模型将动作反应方的人体反应,进行随机采样时间步长下的正向过程加噪;将条件输入和加噪后的人体反应分别由全连接层处理并拼接后获得最终表征;将随机采样时间步长和条件输入所对应的动作类别由全连接层处理并拼接,拼接结果与最终表征合并获得合并结果;将合并结果输入逆过程模型,在基于距离的双人动作表征损失函数约束,以及扩散模型损失函数对扩散模型的约束下进行训练;动作反应方人体反应的实时生成。本发明通过构建扩散模型和自注意力机制解码器结构的人体反应生成网络,获取人体实时反应结果,优化了可视化效果。
-
公开(公告)号:CN110930356B
公开(公告)日:2023-02-28
申请号:CN201910966425.0
申请日:2019-10-12
Applicant: 上海交通大学
IPC: G06T7/00 , G06K19/06 , G06N3/0464 , G06N3/048 , G06N3/08
Abstract: 本发明提供了一种无参考的针对工业二维码图像的质量评价系统,包括工业二维码数据库模块,提供待评估的工业二维码测试样本和用于训练的工业二维码训练样本,输入多任务MTL卷积神经网络模块进行模块;多任务MTL卷积神经网络模块,通过在工业二维码训练样本上对多任务MTL卷积神经网络进行训练,并采用训练后的多任务MTL卷积神经网络完成对待评估的工业二维码进行的质量评价任务;工业二维码经过浅层多任务卷积神经网络和深层多任务卷积神经网络的预测后,一方面,可以判定图像的多种失真类型,另一方面,可以预测图像的质量等级。本发明可以大大减少工业二维码预处理与解码的时间成本与计算成本,提高工业二维码的解码效率,增加工业流水线的吞吐量。
-
公开(公告)号:CN111539914B
公开(公告)日:2022-12-20
申请号:CN202010211227.6
申请日:2020-03-24
Applicant: 上海交通大学
Abstract: 本发明提供一种手机照片质量比较评价方法、系统及终端,方法包括:对同一场景下的两幅照片进行调整,使所述两幅照片的内容对齐;移除对齐后的所述两幅照片的画面中运动物体,减少画面内容的差异部分;将移除运动物体后的所述两幅照片分别划分为多个区域,逐一比对所述两幅照片中相对应的区域,提取出所述两幅照片中相似度最低的区域;对提取到的所述相似度最低的区域进行清晰度、噪声进行分析,得到综合评价结果。系统包括:图像调整对齐模块、运动物体移除模块、差异最大区域提取模块和综合质量评价模块。本发明可以实现照片客观质量评价,不需要主观评价者的参与,节省人力,可操作性高。
-
公开(公告)号:CN111355949B
公开(公告)日:2021-05-25
申请号:CN202010172382.1
申请日:2020-03-12
Applicant: 上海交通大学
IPC: H04N17/00 , H04N21/234 , H04N21/233 , H04N21/44 , H04N21/439 , H04N21/475
Abstract: 本发明提供了一种音视频多媒体数据库的构建及多媒体主观质量评价方法,通过创建专门用于音频及视频多媒体的联合质量主观评价音视频多媒体数据库,并基于该数据库,通过搭建音视频多媒体质量评价环境以及选择训练用音视频多媒体数据库中的数据对测试者进行训练、对从测试用音视频多媒体数据库中选择待测试数据进行测试以及对测试得到的主观质量评价结果进行后期数据处理,实现规范化及流程化的音视频多媒体主观质量评价。
-
-
-
-
-
-
-
-
-