一种身份认证的方法、设备及计算机可读存储介质

    公开(公告)号:CN112700568B

    公开(公告)日:2023-04-18

    申请号:CN202011581613.0

    申请日:2020-12-28

    Inventor: 沙文 邵博

    Abstract: 本申请公开了一种身份认证的方法、设备及计算机可读存储介质,其中,该方法包括:利用图像采集装置对预设范围内的目标对象进行图像采集,得到待分析图像;对待分析图像进行意图分析,以确定目标对象是否存在身份认证的意图;若目标对象存在身份认证的意图,则对目标对象进行身份认证。通过上述方式,本申请能够提升身份识别设备唤醒的准确率。

    人脸跟踪方法、装置、电子设备及存储介质

    公开(公告)号:CN115810027A

    公开(公告)日:2023-03-17

    申请号:CN202211457378.5

    申请日:2022-11-17

    Abstract: 本发明提供一种人脸跟踪方法、装置、电子设备及存储介质,所述方法包括:获取视频帧序列中的当前帧,并获取所述当前帧的人脸关键点信息;对所述当前帧的人脸关键点信息与上一帧的人脸关键点信息进行相似度计算,并确定所述相似度是否满足预设需求;若确定所述相似度满足预设需求,则根据获取到的人脸区域深度信息确定需要跟踪的目标,其中所述人脸区域深度信息表示所述当前帧的人脸区域的特征点到摄像设备的实际距离。由于引入了相似度和人脸区域深度信息,使得本发明即使在复杂的场景下,也能实现正确跟踪。

    情绪识别方法、装置、电子设备和存储介质

    公开(公告)号:CN115588227A

    公开(公告)日:2023-01-10

    申请号:CN202211401340.6

    申请日:2022-11-09

    Abstract: 本发明提供一种情绪识别方法、装置、电子设备和存储介质,其中方法包括:确定待识别人员的语音数据和图像数据;基于语音数据和所述图像数据进行情绪识别,得到待识别人员的情绪类别;基于图像数据进行人脸检测,得到待识别人员的嘴部关键点的位置信息,基于嘴部关键点的位置信息,确定待识别人员在情绪类别下的情绪强度,通过多模态的情绪信息实现了高效准确的情绪识别,克服了传统方案中情绪识别精度不高,以及对于算力要求较高,以致应用范围受限的缺陷,能够在不依赖硬件条件的情况下,保证高召回率,提高了情绪识别的精确度和准确率,不仅减少了运行系统的资源占用,还延长了硬件的使用期限,保证了资源的充分利用,降低了运行成本。

    视线估计模型的训练方法及装置、视线估计方法及装置

    公开(公告)号:CN115565162A

    公开(公告)日:2023-01-03

    申请号:CN202211378229.X

    申请日:2022-11-04

    Abstract: 本申请提供了一种视线估计模型的训练方法及装置、视线估计方法及装置,涉及计算机视觉技术领域。该训练方法包括基于目标对象的双眼区域图像集合,确定目标对象的样本图像对,样本图像对中包括两幅样本图像;确定两幅样本图像各自对应的第一视线特征;基于两幅样本图像各自对应的第一视线特征,确定待训练神经网络模型的损失函数;基于损失函数训练待训练神经网络模型,得到视线估计模型。与现有视线估计模型训练方法相比,显著提升了视线特征的表示能力,扩大了视线估计模型的有效工作范围,提升了视线方向预测的精准度。此外,本申请实施例训练生成的视线估计模型能够为分析驾驶员的驾驶状态提供全面、准确的支持,从而提高车辆行驶的安全性。

    一种对象识别方法、装置、设备及存储介质

    公开(公告)号:CN113486804A

    公开(公告)日:2021-10-08

    申请号:CN202110769197.5

    申请日:2021-07-07

    Abstract: 本申请提供了一种对象识别方法、装置、设备及存储介质,其中,识别方法包括:获取目标异质场景中的待识别图像;基于预先建立的多个识别模型中的一个,对待识别图像中的待识别对象进行识别,多个识别模型采用目标异质场景中的训练样本集训练得到,每个识别模型根据对应的预测损失进行参数更新,每个识别模型对应的预测损失根据训练样本集的目标分类结果确定,训练样本集的目标分类结果通过对训练样本集分别在多个识别模型上的分类结果融合得到,训练样本集在一识别模型上的分类结果根据从该识别模型针对训练样本集中每个样本确定的特征表示向量中提取的唯一性特征向量确定。本申请提供的对象识别方法对目标异质场景中的图像具有较好的识别效果。

    一种操作意图识别方法、交互方法及相关装置

    公开(公告)号:CN119536609A

    公开(公告)日:2025-02-28

    申请号:CN202411654731.8

    申请日:2024-11-19

    Abstract: 本申请公开了一种操作意图识别方法、交互方法及相关装置,涉及人机交互技术领域,操作意图识别方法包括:获取目标用户的多模态数据,多模态数据包括手部图像数据和语音数据;根据目标用户的多模态数据,获取手指端点三维坐标、手指指向向量弧度、目标操作以及操作置信度;根据操作置信度,确定目标用户是否有操作意图;若目标用户有操作意图,则根据手指端点三维坐标和手指指向向量弧度,确定目标操作对应的操作对象,以得到包含目标操作以及目标操作对应的操作对象的操作意图识别结果。本申请公开的操作意图识别方法能够较为准确地识别出操作意图,进而能够提升交互准确率,从而能够提升用户体验。

    图像预处理方法、装置、电子设备和存储介质

    公开(公告)号:CN117593502A

    公开(公告)日:2024-02-23

    申请号:CN202311559240.0

    申请日:2023-11-21

    Abstract: 本发明提供一种图像预处理方法、装置、电子设备和存储介质,所述方法包括:对待处理的原始图像进行图像分割,得到多个原始图块,并为各原始图块创建对应的线程;并行在各线程上对各原始图块进行预处理,得到对应的预处理图块;对各预处理图块进行合并,得到预处理图像。本发明提供的图像预处理方法、装置、电子设备和存储介质,对待处理的原始图像进行图像分割,得到多个原始图块,并为各原始图块创建对应的线程,从而可以并行在各线程上对各原始图块进行预处理,大幅度提高图像预处理的效率,进而能够高效率地实现推理过程中的预处理,降低推理的延迟并且提高吞吐。

    悬停追踪方法、悬停追踪装置、悬停追踪设备及存储介质

    公开(公告)号:CN116012910A

    公开(公告)日:2023-04-25

    申请号:CN202211674674.0

    申请日:2022-12-26

    Inventor: 沙文 殷保才 殷兵

    Abstract: 本发明提供了一种悬停追踪方法、悬停追踪装置、悬停追踪设备及存储介质,方法包括:当基于麦克风阵列获取的声音信息中包含唤醒语音时,确定发出唤醒语音的对象的位置作为目标位置;基于摄像头获取目标位置处的图像,基于获取的图像确定追踪对象;控制悬停追踪设备运动至与追踪对象之间的距离在预设距离范围内且追踪对象的人脸位于摄像头画面的指定区域的位置,基于追踪对象的图像确定追踪对象的人脸运动轨迹和头姿变化情况,基于人脸运动轨迹和头姿变化情况控制悬停追踪设备对追踪对象的人脸进行追踪。本发明提供的追踪设备无使用场景的限制,且无需用户手持,本发明提供的追踪方法使得追踪设备能够长时间稳定的对追踪对象的人脸进行追踪。

Patent Agency Ranking