视频质量评价方法、装置、设备及存储介质

    公开(公告)号:CN118885821A

    公开(公告)日:2024-11-01

    申请号:CN202410911624.2

    申请日:2024-07-08

    摘要: 本申请涉及人工智能领域,提供了一种视频质量评价方法、装置、设备及存储介质,该方法包括:获取待评价的数字人说话视频,并从数字人说话视频中分离出数字人说话数据和数字人图像数据;确定数字人说话数据的第一质量评分,并确定数字人图像数据的第二质量评分;对数字人说话数据中的语音特征进行编码处理,得到语音特征向量,对数字人图像数据中的人脸特征进行编码处理,得到人脸特征向量;确定语音特征向量与人脸特征向量之间的相似度,根据相似度,确定第三质量评分;根据第一质量评分、第二质量评分和第三质量评分,确定数字人说话视频的目标质量评分。本申请提高了确定数字人说话视频的质量的效率和准确性。

    数字人脸合成方法、装置、计算机设备及存储介质

    公开(公告)号:CN118397151A

    公开(公告)日:2024-07-26

    申请号:CN202410404711.9

    申请日:2024-04-03

    IPC分类号: G06T13/20 G06T13/40

    摘要: 本申请公开一种数字人脸合成方法、装置、计算机设备及存储介质,解决现有的语音驱动数字人脸的方法在感染力上与真实的客服人员的感染力有较大的差距的问题。方法包括:提取出样本视频的语音信息与人脸图像,将语音信息输入语音特征提取器,获取与人脸的相关度较高的第一特征信息和第二特征信息,将第一特征信息输入预设多层神经网络,获取人脸分布信息和人脸表情信息,将第二特征信息输入至预设多层神经网络,获取躯干信息,根据人脸分布信息、人脸表情信息以及躯干信息生成数字人脸图像,计算人脸图像与数字人脸图像的损失函数直至符合预设收敛条件,停止训练,得到数字人脸合成模型。如此,所生成的数字人脸高度逼近于样本视频中的人脸。