-
公开(公告)号:CN112733797B
公开(公告)日:2021-10-08
申请号:CN202110089871.5
申请日:2021-01-22
Applicant: 腾讯科技(深圳)有限公司
Abstract: 本申请公开了一种人脸图像的视线矫正方法、装置、设备及存储介质,涉及人工智能技术领域。所述方法包括:从人脸图像中获取待矫正眼部图像;基于待矫正眼部图像,生成眼部运动流场和眼部轮廓掩码;基于眼部运动流场和眼部轮廓掩码,对待矫正眼部图像进行视线矫正处理,生成矫正后眼部图像;基于矫正后眼部图像,生成经视线矫正后的人脸图像。本申请直接根据输入的待矫正眼部图像端到端生成矫正后眼部图像,不需要知道头部姿态角,大大降低了耗时并提高了矫正准确度,使得视线矫正功能真正达到了实际可用的标准,适用于视频会议、视频通话、视频直播等场景。
-
公开(公告)号:CN109117803B
公开(公告)日:2021-08-24
申请号:CN201810952542.7
申请日:2018-08-21
Applicant: 腾讯科技(深圳)有限公司
Abstract: 本发明公开了一种人脸图像的聚类方法、装置、服务器及存储介质,属于图像处理技术领域。所述方法包括:确定每张人脸图像的人脸区域和人体区域;根据从每张人脸图像的人脸区域中提取的人脸特征,对多张人脸图像进行聚类,得到多个人脸图像集合;将每张人脸图像上的人脸区域与人体区域进行关联;根据与两个人脸图像集合中每张人脸图像的人脸区域相关联的人体区域,确定两个人脸图像集合之间的集合相似度;如果集合相似度满足第一阈值条件,则将两个人脸图像集合进行合并。本发明通过将人脸区域和人体区域进行关联,并基于相关联的人体区域,对人脸图像的聚类结果进行优化,将属于同一用户的人脸图像集合进行合并,提高了人脸图像聚类的准确性。
-
公开(公告)号:CN112597984B
公开(公告)日:2021-05-25
申请号:CN202110237788.8
申请日:2021-03-04
Applicant: 腾讯科技(深圳)有限公司
Abstract: 本申请公开了一种图像数据处理方法、装置、计算机设备和存储介质,该方法包括:将N个标签图像和M个无标签图像输入图像识别模型;在图像识别模型中确定每个标签图像包含的对象的第一身份预测结果,从图像集合中获取每个标签图像的相似图像;图像集合包括N个标签图像和M个无标签图像;每个标签图像的相似图像未携带所属标签图像携带的对象身份标签;根据每个标签图像与所属相似图像确定相似差异损失函数,根据每个标签图像的第一身份预测结果和携带的对象身份标签确定预测损失函数;基于相似差异损失函数和预测损失函数修正图像识别模型的模型参数,得到目标图像识别模型。采用本申请,可提高目标图像识别模型对于对象身份识别的准确性。
-
公开(公告)号:CN112528048B
公开(公告)日:2021-05-14
申请号:CN202110187051.X
申请日:2021-02-18
Applicant: 腾讯科技(深圳)有限公司
IPC: G06F16/43 , G06F16/903
Abstract: 本申请实施例公开了一种跨模态检索方法、装置、设备及介质,其中的方法包括:获取待检索的查询文本;根据查询文本在多媒体数据库中进行检索,得到候选多媒体集合;根据N个候选多媒体数据中的对象信息生成查询文本的缺失内容,并获取针对缺失内容的确认反馈;根据确认反馈对候选多媒体集合进行优化,得到检索结果。本申请实施例可适用于查询文本不完整的情况,且能够有效提升检索性能,提高检索结果的准确性。
-
公开(公告)号:CN112733797A
公开(公告)日:2021-04-30
申请号:CN202110089871.5
申请日:2021-01-22
Applicant: 腾讯科技(深圳)有限公司
Abstract: 本申请公开了一种人脸图像的视线矫正方法、装置、设备及存储介质,涉及人工智能技术领域。所述方法包括:从人脸图像中获取待矫正眼部图像;基于待矫正眼部图像,生成眼部运动流场和眼部轮廓掩码;基于眼部运动流场和眼部轮廓掩码,对待矫正眼部图像进行视线矫正处理,生成矫正后眼部图像;基于矫正后眼部图像,生成经视线矫正后的人脸图像。本申请直接根据输入的待矫正眼部图像端到端生成矫正后眼部图像,不需要知道头部姿态角,大大降低了耗时并提高了矫正准确度,使得视线矫正功能真正达到了实际可用的标准,适用于视频会议、视频通话、视频直播等场景。
-
公开(公告)号:CN112597984A
公开(公告)日:2021-04-02
申请号:CN202110237788.8
申请日:2021-03-04
Applicant: 腾讯科技(深圳)有限公司
Abstract: 本申请公开了一种图像数据处理方法、装置、计算机设备和存储介质,该方法包括:将N个标签图像和M个无标签图像输入图像识别模型;在图像识别模型中确定每个标签图像包含的对象的第一身份预测结果,从图像集合中获取每个标签图像的相似图像;图像集合包括N个标签图像和M个无标签图像;每个标签图像的相似图像未携带所属标签图像携带的对象身份标签;根据每个标签图像与所属相似图像确定相似差异损失函数,根据每个标签图像的第一身份预测结果和携带的对象身份标签确定预测损失函数;基于相似差异损失函数和预测损失函数修正图像识别模型的模型参数,得到目标图像识别模型。采用本申请,可提高目标图像识别模型对于对象身份识别的准确性。
-
公开(公告)号:CN109359558B
公开(公告)日:2020-12-25
申请号:CN201811125625.5
申请日:2018-09-26
Applicant: 腾讯科技(深圳)有限公司 , 腾讯云计算(北京)有限责任公司
Abstract: 本申请公开了图像标注方法、目标检测方法、装置及存储介质。其中,一种图像标注方法,包括:获取第一图像集合和第二图像集合;根据所述标签,从第一图像集合的图像中提取一个或多个第一图像区域和一个或多个第二图像区域;将第一图像区域生成为正样本;对于任一个第二图像区域,为其添加标签而得到一个负样本;通过区域推荐方式,从第二图像集合提取候选图像区域;基于图的半监督学习方式,确定候选图像区域的标签;根据候选图像区域的标签,确定第二图像集合的图像中目标对象对应的区域并添加与目标对象有关的标签。
-
公开(公告)号:CN111738454B
公开(公告)日:2020-11-27
申请号:CN202010881808.0
申请日:2020-08-28
Applicant: 腾讯科技(深圳)有限公司
IPC: G06N20/00
Abstract: 本发明公开了一种目标检测方法、装置、存储介质及设备,所述方法包括获取待进行目标检测的图片;将所述图片输入目标检测模型得到所述图片的目标检测结果;其中,所述目标检测模型通过预设的训练方法训练预设的机器学习模型而得到,所述预设的训练方法用于基于带有残缺标注的第一数据集和所述机器学习模型生成带有全标注的第二数据集,根据所述第一数据集和所述第二数据集训练所述机器学习模型,得到所述目标检测模型。本发明通过对残缺标注场景中的机器学习模型进行训练,得到的目标检测模型的精准度依然保持在较高水平,在确保目标检测精准的同时显著扩展了基于人工智能进行目标检测的可实施场景,也减低了人力成本。
-
公开(公告)号:CN111738244B
公开(公告)日:2020-11-24
申请号:CN202010867019.1
申请日:2020-08-26
Applicant: 腾讯科技(深圳)有限公司
Abstract: 本申请涉及一种图像检测方法、装置、计算机设备和存储介质。该方法涉及人工智能领域中的图像分类技术,该方法可以由人工智能云服务实现,所述方法包括:获取包括人脸的待检测图像;提取待检测图像对应的图像特征;切分图像特征,获得待检测图像中各局部区域对应的局部特征;根据局部特征确定各局部区域之间的相似度;根据相似度预测待检测图像中的人脸属于伪造人脸的第一概率;根据第一概率,确定待检测图像中人脸的真伪检测结果。采用本方法能够克服特定伪造图像检测算法在一些人脸图像上过拟合的问题,提升了检测效果,并具有一定的可解释性。
-
公开(公告)号:CN111709497B
公开(公告)日:2020-11-20
申请号:CN202010840896.X
申请日:2020-08-20
Applicant: 腾讯科技(深圳)有限公司
Abstract: 本申请实施例公开了一种信息处理方法、装置及计算机可读存储介质,通过将目标训练样本分别输入第一目标检测模型和第二目标检测模型,得到第一目标特征图信息和第二目标特征图信息;分别对第一目标特征图信息和第二目标特征图信息进行图卷积计算,获取目标物体之间的第一关系特征向量和第二关系特征向量;构建第一关系特征向量和第二关系特征向量对应的蒸馏损失函数;将蒸馏损失函数加入至第二目标检测模型的损失函数进行联合训练,得到联合训练后的第二目标检测模型;基于联合训练后的第二目标检测模型对待识别图像进行物体识别。以此,将第一目标检测模型对于目标物体标识框之间关系的学习能力迁移到第二目标检测模型中,提升信息处理效率。
-
-
-
-
-
-
-
-
-