专利检索 ap:("平安科技(深圳)有限公司") AND inv:"史屹琛" 第 1 页

1.

发明公开
视频质量评价方法、装置、设备及存储介质审中-公开

公开(公告)号：CN118885821A

公开(公告)日：2024-11-01

申请号：CN202410911624.2

申请日：2024-07-08

申请人： 平安科技(深圳)有限公司

发明人： 张旭龙 , 王健宗 , 程宁 , 史屹琛

IPC分类号： G06F18/22 , G10L25/57 , G10L19/00 , G06V40/16

摘要： 本申请涉及人工智能领域，提供了一种视频质量评价方法、装置、设备及存储介质，该方法包括：获取待评价的数字人说话视频，并从数字人说话视频中分离出数字人说话数据和数字人图像数据；确定数字人说话数据的第一质量评分，并确定数字人图像数据的第二质量评分；对数字人说话数据中的语音特征进行编码处理，得到语音特征向量，对数字人图像数据中的人脸特征进行编码处理，得到人脸特征向量；确定语音特征向量与人脸特征向量之间的相似度，根据相似度，确定第三质量评分；根据第一质量评分、第二质量评分和第三质量评分，确定数字人说话视频的目标质量评分。本申请提高了确定数字人说话视频的质量的效率和准确性。

2.

发明公开
数字人脸合成方法、装置、计算机设备及存储介质审中-实审

公开(公告)号：CN118397151A

公开(公告)日：2024-07-26

申请号：CN202410404711.9

申请日：2024-04-03

申请人： 平安科技(深圳)有限公司

发明人： 张旭龙 , 王健宗 , 程宁 , 史屹琛

IPC分类号： G06T13/20 , G06T13/40

摘要： 本申请公开一种数字人脸合成方法、装置、计算机设备及存储介质，解决现有的语音驱动数字人脸的方法在感染力上与真实的客服人员的感染力有较大的差距的问题。方法包括：提取出样本视频的语音信息与人脸图像，将语音信息输入语音特征提取器，获取与人脸的相关度较高的第一特征信息和第二特征信息，将第一特征信息输入预设多层神经网络，获取人脸分布信息和人脸表情信息，将第二特征信息输入至预设多层神经网络，获取躯干信息，根据人脸分布信息、人脸表情信息以及躯干信息生成数字人脸图像，计算人脸图像与数字人脸图像的损失函数直至符合预设收敛条件，停止训练，得到数字人脸合成模型。如此，所生成的数字人脸高度逼近于样本视频中的人脸。

3.

发明公开
人脸声纹交互式活体检测方法、装置、设备及存储介质审中-实审

公开(公告)号：CN118230429A

公开(公告)日：2024-06-21

申请号：CN202410406661.8

申请日：2024-04-03

申请人： 平安科技(深圳)有限公司

发明人： 张旭龙 , 王健宗 , 程宁 , 史屹琛

IPC分类号： G06V40/40 , G06V40/70 , G06V40/16 , G06V10/25 , G06V10/30 , G06V10/82 , G06N3/045 , G06V10/80 , G06V10/77 , G06V10/54 , G06V10/56 , G06V10/762 , G10L17/18 , G10L17/02

摘要： 本发明涉及人工智能技术，揭露了一种人脸声纹交互式活体检测方法，包括：采集用户的多角度数据，得到人脸图集以及语音数据集；将人脸图集标准化成标准人脸图集，将语音数据集标准化操作成标准语音数据集；利用双分支孪生网络从标准人脸图集中提取出标准人脸特征、从标准语音数据集中提取出标准语音特征；利用注意力机制将标准人脸特征和标准语音特征融合成多模态用户特征；利用活体检测模型对多模态用户特征进行特征降维，得到降维多模态特征，对降维多模态特征进行特征归一化，得到多模态特征编码，并根据多模态特征编码检测出用户信息。本发明可以应用于银行身份识别、智能生活领域，能够提高活体检测的准确率。