-
公开(公告)号:CN115564834A
公开(公告)日:2023-01-03
申请号:CN202211338236.7
申请日:2022-10-28
Applicant: 科大讯飞股份有限公司
Abstract: 本申请提供了一种视线估计方法及装置、存储介质及电子设备,涉及计算机视觉技术领域。该视线估计方法获取相机系统在当前时刻针对目标用户采集的多帧用户图像;基于多帧用户图像,确定目标用户在相机坐标系下的视线方向信息;基于多帧用户图像,确定目标用户在相机坐标系下的瞳孔坐标信息;基于目标用户在相机坐标系下的视线方向信息和瞳孔坐标信息,确定目标用户在世界坐标系下的视线方向信息和瞳孔坐标信息;基于目标用户在世界坐标系下的视线方向信息和瞳孔坐标信息,确定目标用户的视线估计信息。与传统的视线估计方法相比,有效利用了多视角信息,降低了对训练数据量的依赖,扩大了视线估计系统的有效工作范围,提升了视线方向估计的精准度。此外,本申请实施例能够为分析驾驶员的驾驶状态提供全面、准确的支持和依据,具有适用范围广泛的优势。
-
公开(公告)号:CN119252514B
公开(公告)日:2025-04-29
申请号:CN202411765514.6
申请日:2024-12-04
Applicant: 科大讯飞股份有限公司
Abstract: 本发明涉及人工智能技术领域,提供一种健康监测方法、装置、电子设备和存储介质,其中方法包括:对当前采集的视频帧进行人脸检测,得到当前帧的人脸区域图像;对人脸区域图像进行关键点检测,得到人脸关键点;基于人脸关键点,从人脸区域图像中确定出人脸局部区域;基于人脸区域图像中的目标关键点,将当前帧的人脸局部区域与上一帧的人脸局部区域进行对齐,并应用对齐后的人脸局部区域进行健康监测,得到健康指标。本发明通过基于检测到的人脸关键点,从人脸区域图像中确定出人脸局部区域,可以抑制过多干扰像素对特征提取的影响,通过将当前帧的人脸局部区域与上一帧进行对齐,可以显著缓解像素错位带来的影响,从而提高健康监测的准确性。
-
公开(公告)号:CN119206676A
公开(公告)日:2024-12-27
申请号:CN202411392557.4
申请日:2024-10-08
Applicant: 科大讯飞股份有限公司
Abstract: 本发明提供一种疲劳检测方法、装置、电子设备和存储介质,其中方法包括:获取人脸图像,对所述人脸图像的眼部区域进行眼部关键点检测,得到所述眼部区域的关键点位置信息,并基于所述关键点位置信息,确定眼部开合度;对所述人脸图像进行头姿估计,得到所述人脸图像的头姿信息,并基于所述头姿信息,对所述眼部开合度进行校正,得到校正开合度;基于所述校正开合度,确定所述人脸图像的疲劳检测结果。本发明提供的方法、装置、电子设备和存储介质,头姿信息在眼部开合度校正中的应用,消除了头姿变化对于眼部开合度的影响,能够有效提升基于关键点检测得到的眼部开合度的可靠性,进而保证疲劳检测的可靠性和准确性。
-
公开(公告)号:CN118968558A
公开(公告)日:2024-11-15
申请号:CN202411120920.7
申请日:2024-08-15
Applicant: 科大讯飞股份有限公司
IPC: G06V40/10 , G06V10/764 , G06V10/766 , G06V10/42 , G06V10/44 , G06V10/80 , G06V10/82 , G06N3/098
Abstract: 本申请公开了一种学习专注度评估方法及相关装置,涉及计算机视觉技术领域,包括:利用预测模型分别确定学习者的待处理的学习视频中每帧原始图像中学习者与物品的交互关系,并根据各帧原始图像中学习者与物品的交互关系,确定学习者的学习专注度评估结果。预测模型是通过将目标检测分支和注视区域热图回归预测分支整合到一个统一的网络框架中,并通过对目标检测分支和注视区域热图回归预测分支进行联合训练得到的。由于这种联合训练不仅简化了预测模型的训练过程,还显著提升了预测模型的推理效率和效果,提升了学习者与物品的交互关系的确定效率和确定精度,因此,保证了学习专注度评估的效率和专注度评估结果的准确性。
-
公开(公告)号:CN118657930A
公开(公告)日:2024-09-17
申请号:CN202411040055.5
申请日:2024-07-31
Applicant: 科大讯飞股份有限公司
IPC: G06V10/25 , G06V10/26 , G06V10/774 , G06V10/40 , G06V10/764 , G06V10/80
Abstract: 本申请公开了一种目标检测方法、目标检测模型训练方法、装置及相关设备,目标检测模型在训练阶段与语义分割网络联合训练,语义分割网络以目标检测模型提取的隐层特征作为输入,用于预测语义分割结果,联合训练的总损失值包括目标检测模型的目标检测损失值和所述语义分割网络的语义分割损失值。采用联合训练策略后,可以使得目标检测模型在学习目标检测的同时,也能学习到语义分割信息,具备对局部细节刻画的能力,有助于提高对遮挡目标的检测效果。此外,本申请中的目标检测模型可以采用轻量化模型结构,实现提升对遮挡目标的检测效果。
-
公开(公告)号:CN117333514B
公开(公告)日:2024-04-16
申请号:CN202311636539.1
申请日:2023-12-01
Applicant: 科大讯飞股份有限公司
IPC: G06T7/246 , G06T7/223 , G06N3/0464 , G06N3/0455 , G06N3/08
Abstract: 本申请公开了一种单目标视频跟踪方法、装置、存储介质及设备,该方法包括:首先在获取到包含待跟踪的单目标对象的目标视频后,从目标视频中确定出包含第一帧图像对应的图像跟踪模板的M张图像跟踪模板,然后提取M张图像跟踪模板的模板图像特征,以及提取目标视频中每一帧搜索图像的搜索图像特征,并将模板图像特征和搜索图像特征输入预先构建的编码器网络进行编码,得到编码特征;接着将编码特征和开始标志位向量输入预先构建的解码器网络进行解码,预测出编码特征对应的搜索图像中单目标对象的位置和尺寸,从而能够提高目标视频中每一帧搜索图像中对于单目标视频跟踪结果的准确性。
-
公开(公告)号:CN117608407A
公开(公告)日:2024-02-27
申请号:CN202311649601.0
申请日:2023-12-01
Applicant: 科大讯飞股份有限公司
Abstract: 本发明公开了一种交互方法、装置及存储介质、电子设备,该方法包括:获取手部图像;当检测到所述手部图像中存在多个交互手时,确定主交互手;识别所述主交互手的第一手指轨迹,并根据所述第一手指轨迹确定目标指令和目标对象;根据所述目标指令对所述目标对象进行控制。该方法在检测到手部图像中存在多个交互手时,通过确定主交互手,对主交互手的指尖轨迹进行追踪识别,确定目标指令和目标对象并根据目标指令对目标对象进行控制,实现主交互手的操作意图,具有识别准确,不易被干扰的优点。
-
公开(公告)号:CN111241992B
公开(公告)日:2024-02-20
申请号:CN202010018116.3
申请日:2020-01-08
Applicant: 科大讯飞股份有限公司
IPC: G06V40/16
Abstract: 本申请提供了一种人脸识别模型构建方法、识别方法、装置、设备及存储介质,其中,人脸识别模型构建方法包括:利用预先构建的、作为教师模型的人脸识别模型对标注有同一类别的多幅训练人脸图像分别提取人脸特征,获得多幅训练人脸图像分别对应的第一人脸特征;对多幅训练人脸图像分别对应的第一人脸特征进行聚类,并根据聚类结果确定多幅训练人脸图像分别所属类别的类中心;利用多幅训练人脸图像和多幅训练人脸图像分别所属类别的类中心,训练作为学生模型的人脸识别模型,对作为学生模型的人脸识别模型训练至收敛,得到构建出的人脸识别模型。本申请提供的人脸识别模型构建方法能够构建出识别速度快、识别精度高的人脸识别模型。
-
公开(公告)号:CN109683135A
公开(公告)日:2019-04-26
申请号:CN201811625787.5
申请日:2018-12-28
Applicant: 科大讯飞股份有限公司
Abstract: 本申请提供了一种声源定位方法及装置,依据包括目标的图像,确定目标相对于摄像头的第一位置信息,获取依据声音信号确定的第二位置信息,依据所述第一位置信息和所述第二位置信息,确定所述声源的位置信息,其中,声音信号的采集时间与图像的采集时间的差值不大于预设第一阈值,可见,使用依据图像确定的位置信息与依据音频确定的位置信息,确定目标的位置信息,与仅使用麦克风阵列定位声源的位置的方式相比,定位结果具有更高的准确性。
-
公开(公告)号:CN118618231B
公开(公告)日:2025-01-24
申请号:CN202411105233.8
申请日:2024-08-13
Applicant: 科大讯飞股份有限公司
IPC: B60R16/023 , B60W50/08 , G06N5/04 , G06N3/0455 , G06F18/241 , G06F18/25 , G06F18/27
Abstract: 本申请公开了一种汽车座舱监控方法、装置、相关设备及计算机程序产品,涉及汽车座舱监控技术领域,方法包括:获取对汽车座舱环境监测到的多模态信息;按照预先配置的各类型的监测任务,在多任务提示指令集合中获取与每一监测任务对应的提示指令;利用多模态信息及每一监测任务的提示指令,生成每一监测任务的监测结果。本申请能够整合汽车座舱内不同的监测任务,不同监测任务可以共享多模态信息,充分发挥各模态信息间的互补作用,优化了不同监测任务间的互补性,提升了整体监控性能。此外,本申请通过统一的框架可以实现跨任务的处理,无需单独部署各独立的任务功能模块,从而减轻了相关功能模型部署时的负担。
-
-
-
-
-
-
-
-
-