人体指向确定、屏幕控制方法、装置及相关设备

    公开(公告)号:CN115909418A

    公开(公告)日:2023-04-04

    申请号:CN202310180797.7

    申请日:2023-03-01

    Abstract: 本申请公开了一种人体指向确定、屏幕控制方法、装置及相关设备,本申请同时获取对人体拍摄的目标图像以及深度点云数据,提取目标图像的人体掩码特征,以及提取深度点云数据的深度点云特征,基于人体掩码特征对深度点云特征进行处理,得到深度补全特征,基于深度补全特征确定人体指向点信息。本申请在传统的基于人体深度点云数据进行人体指向估计的基础上,额外考虑了对人体拍摄的目标图像,利用该目标图像的人体掩码特征对深度点云特征进行处理,得到的深度补全特征相比于单纯从深度点云数据中提取的深度点云特征,其包含的信息更加丰富,进而可以更加准确的估计人体指向点信息,提升了人体指向点信息的准确性。

    实例分割方法、装置、电子设备和存储介质

    公开(公告)号:CN115861338A

    公开(公告)日:2023-03-28

    申请号:CN202211699750.3

    申请日:2022-12-28

    Abstract: 本发明公开了一种实例分割方法、装置、电子设备和存储介质,其中,实例分割方法包括:对待分割图像进行目标检测和实例分割,得到目标检测框和第一实例掩码;根据目标检测框,分别从待分割图像对应的多尺度特征图、待分割图像和第一实例掩码获取特征信息,并将获取的特征信息进行融合,得到多尺度深浅特征;基于多尺度深浅特征,生成第二实例掩码;输出目标检测框和第二实例掩码。本发明由于融合了多尺度的低分辨率深层特征和高分辨低层特征,可以更好地预测出实例的掩码细节,输出更为精细的实例掩码,提高了图像实例分割的精度。

    一种图像语义匹配方法、装置、设备及存储介质

    公开(公告)号:CN115830350A

    公开(公告)日:2023-03-21

    申请号:CN202211710848.4

    申请日:2022-12-29

    Abstract: 本发明提供了一种图像语义匹配方法、装置、设备及存储介质,其中,图像语义匹配方法包括:获取待匹配图像和参考图像;以图像变换矩阵为优化对象,以使基于图像变换矩阵对待匹配图像进行变换得到的变换后图像与参考图像的语义匹配为目标,对图像变换矩阵进行优化;将基于最后一次优化后的图像变换矩阵对待匹配图像进行变换得到的图像,确定为与参考图像的语义匹配的图像。本发明提供的图像语义匹配方法以图像变换矩阵为优化对象,通过不断优化得到待匹配图像与参考图像间的图像变换矩阵,优化过程即是对待匹配图像进行变换的过程,优化完成时即完成图像语义匹配,本发明提供的图像语义匹配方法具有较好的匹配效果和较强的泛化能力。

    全景分割方法及相关装置、电子设备、存储介质

    公开(公告)号:CN115424264A

    公开(公告)日:2022-12-02

    申请号:CN202210945482.2

    申请日:2022-08-08

    Inventor: 张圆 殷保才

    Abstract: 本申请公开了一种全景分割方法及相关装置、电子设备、存储介质,其中,全景分割方法包括:提取待分割图像的第一特征图;基于第一特征图,分别预测得到第一特征图中第一像素点的类别信息和位置信息,并基于第一特征图进行特征生成,得到第二特征图;基于第一特征图中第一像素点的类别信息和位置信息,提取各图像对象的位置信息;基于第二特征图和各图像对象的位置信息进行全景分割,得到待分割图像的全景分割图。上述方案,能够在边缘设备实时部署全景分割。

    视频人脸表情识别模型训练方法、装置、设备及存储介质

    公开(公告)号:CN115063858A

    公开(公告)日:2022-09-16

    申请号:CN202210716287.2

    申请日:2022-06-23

    Abstract: 本申请公开了一种视频人脸表情识别方法、装置、设备及存储介质,本申请获取人脸视频集合,该集合无需进行表情类型的标注,进一步可以利用携带有标注的训练数据训练初始表情分类模型,利用该模型对集合中每一视频段进行表情类型的预测,得到预测的伪标签,该伪标签可能会存在少量的误差,但是预测结果大部分还是正确的,本申请中以人脸视频集合中各视频段作为训练样本,参考伪标签基于对比自监督学习策略,对视频人脸表情识别模型进行预训练,采用这种训练方式无需提供有标注的训练数据,也即不需要大规模有标注人脸表情数据,同时通过对比学习策略,能够很好的学习到不同表情类型的表征特征,基于此训练的视频人脸表情识别模型的精度会更高。

    说话者分离模型的训练方法和说话者分离方法及相关装置

    公开(公告)号:CN114360573A

    公开(公告)日:2022-04-15

    申请号:CN202111660100.3

    申请日:2021-12-31

    Abstract: 本申请公开了一种说话者分离模型的训练方法和说话者分离方法及相关装置,其中,说话者分离模型的训练方法包括:获取样本环境的样本数据,且样本数据包括同一时间段采集的样本语音数据和样本环境中若干说话者的样本图像序列;利用说话者分离模型,对样本数据进行处理得到各说话者的语音分离掩码,并对语音分离掩码和样本数据进行处理得到说话者分离结果,其中,说话者分离结果用于确定样本语音数据中的不同时间片段的说话者;利用语音分离掩码和说话者分离结果,调整说话者分离模型的网络参数。上述方案,能够提高说话者分离效果。

Patent Agency Ranking