-
公开(公告)号:CN117476041A
公开(公告)日:2024-01-30
申请号:CN202311369512.0
申请日:2023-10-23
Applicant: 上海交通大学
Abstract: 本公开提供一种基于多维特征相似度融合的全参考音频质量评价方法,包括:对参考音频和退化音频进行预处理;将预设的基于感知质量的图像质量评价算法推广处理至一维空间,并确定参考音频的一维波形与退化音频的一维波形之间的相似度;对参考音频和退化音频进行特征提取处理,并确定并采用预设的基于感知质量的图像评价算法确定每一参考音频的二维特征和退化音频的二维特征之间的相似度;将参考音频和退化音频之间的多维特征相似度分数进行融合处理,回归处理至退化音频的质量分数。通过本公开,提取丰富的音频信号特征,并将基于感知质量的图像质量评价算法应用于音频特征质量的评价中,有效评价音频的感知质量。
-
公开(公告)号:CN117557481A
公开(公告)日:2024-02-13
申请号:CN202311341065.8
申请日:2023-10-16
Applicant: 上海交通大学
IPC: G06T5/90 , G06T7/00 , G06T7/90 , G06N3/0464
Abstract: 本发明提供了一种以质量为引导的人脸肤色连续可控增强方法、系统及终端,方法包括:提取人脸图像的肤色区域并进行肤色调整,通过图像质量评估模块获取调整后图像的质量分数,建立肤色图像质量评估数据库;建立基于三维查找表的图像增强网络;利用肤色图像质量评估数据库对图像增强网络进行训练,学习不同质量分数的图像的分布,获得图像增强模型;将待增强图像及目标质量分数共同输入图像增强模型,获得目标质量分数对应的增强图像,实现根据给定的质量分数对人脸肤色进行连续可控的调整。由此,本发明可以解决相关技术中只能获得固定增强结果而无法控制增强效果的问题。
-