-
公开(公告)号:CN119206676A
公开(公告)日:2024-12-27
申请号:CN202411392557.4
申请日:2024-10-08
Applicant: 科大讯飞股份有限公司
Abstract: 本发明提供一种疲劳检测方法、装置、电子设备和存储介质,其中方法包括:获取人脸图像,对所述人脸图像的眼部区域进行眼部关键点检测,得到所述眼部区域的关键点位置信息,并基于所述关键点位置信息,确定眼部开合度;对所述人脸图像进行头姿估计,得到所述人脸图像的头姿信息,并基于所述头姿信息,对所述眼部开合度进行校正,得到校正开合度;基于所述校正开合度,确定所述人脸图像的疲劳检测结果。本发明提供的方法、装置、电子设备和存储介质,头姿信息在眼部开合度校正中的应用,消除了头姿变化对于眼部开合度的影响,能够有效提升基于关键点检测得到的眼部开合度的可靠性,进而保证疲劳检测的可靠性和准确性。
-
公开(公告)号:CN118968558A
公开(公告)日:2024-11-15
申请号:CN202411120920.7
申请日:2024-08-15
Applicant: 科大讯飞股份有限公司
IPC: G06V40/10 , G06V10/764 , G06V10/766 , G06V10/42 , G06V10/44 , G06V10/80 , G06V10/82 , G06N3/098
Abstract: 本申请公开了一种学习专注度评估方法及相关装置,涉及计算机视觉技术领域,包括:利用预测模型分别确定学习者的待处理的学习视频中每帧原始图像中学习者与物品的交互关系,并根据各帧原始图像中学习者与物品的交互关系,确定学习者的学习专注度评估结果。预测模型是通过将目标检测分支和注视区域热图回归预测分支整合到一个统一的网络框架中,并通过对目标检测分支和注视区域热图回归预测分支进行联合训练得到的。由于这种联合训练不仅简化了预测模型的训练过程,还显著提升了预测模型的推理效率和效果,提升了学习者与物品的交互关系的确定效率和确定精度,因此,保证了学习专注度评估的效率和专注度评估结果的准确性。
-
公开(公告)号:CN111161268B
公开(公告)日:2024-04-30
申请号:CN201911275373.9
申请日:2019-12-12
Applicant: 科大讯飞股份有限公司
IPC: G06T7/10 , G06T7/00 , G06N3/0464
Abstract: 本申请提供了一种图像处理方法、装置、电子设备及计算机存储介质,首先获取目标用户的胸片图像;接着,将所述胸片图像输入训练好的分割模型,根据所述训练好的分割模型的输出确定原始肋骨图像;最后,对所述原始肋骨图像进行分割处理,得到目标肋骨图像,所述分割处理用于获取无粘连的肋骨图像。可以将深度学习的神经网络模型与后续处理结合,自动分割出每一根肋骨都独立的目标肋骨图像,提升图像处理的准确性和效率,也为医生提供了便利。
-
公开(公告)号:CN117608407A
公开(公告)日:2024-02-27
申请号:CN202311649601.0
申请日:2023-12-01
Applicant: 科大讯飞股份有限公司
Abstract: 本发明公开了一种交互方法、装置及存储介质、电子设备,该方法包括:获取手部图像;当检测到所述手部图像中存在多个交互手时,确定主交互手;识别所述主交互手的第一手指轨迹,并根据所述第一手指轨迹确定目标指令和目标对象;根据所述目标指令对所述目标对象进行控制。该方法在检测到手部图像中存在多个交互手时,通过确定主交互手,对主交互手的指尖轨迹进行追踪识别,确定目标指令和目标对象并根据目标指令对目标对象进行控制,实现主交互手的操作意图,具有识别准确,不易被干扰的优点。
-
公开(公告)号:CN115830350A
公开(公告)日:2023-03-21
申请号:CN202211710848.4
申请日:2022-12-29
Applicant: 科大讯飞股份有限公司
Abstract: 本发明提供了一种图像语义匹配方法、装置、设备及存储介质,其中,图像语义匹配方法包括:获取待匹配图像和参考图像;以图像变换矩阵为优化对象,以使基于图像变换矩阵对待匹配图像进行变换得到的变换后图像与参考图像的语义匹配为目标,对图像变换矩阵进行优化;将基于最后一次优化后的图像变换矩阵对待匹配图像进行变换得到的图像,确定为与参考图像的语义匹配的图像。本发明提供的图像语义匹配方法以图像变换矩阵为优化对象,通过不断优化得到待匹配图像与参考图像间的图像变换矩阵,优化过程即是对待匹配图像进行变换的过程,优化完成时即完成图像语义匹配,本发明提供的图像语义匹配方法具有较好的匹配效果和较强的泛化能力。
-
公开(公告)号:CN115578487A
公开(公告)日:2023-01-06
申请号:CN202211405675.5
申请日:2022-11-10
Applicant: 科大讯飞股份有限公司
Abstract: 本申请提供了虚拟换装方法、装置、设备及存储介质,具体实现方案为:对获取到的服装区域图像进行姿态矫正处理,得到所述服装区域图像中服装的标准形状信息;其中,所述标准形状信息包括所述服装区域图像中服装处于自然平展状态下所呈现的形状信息;从所述服装区域图像中提取得到服装样式信息;利用所述服装样式信息和所述标准形状信息,对目标对象进行换装。根据本申请的技术方案,能够有效提升目标对象的换装效果。
-
公开(公告)号:CN114333863A
公开(公告)日:2022-04-12
申请号:CN202111544776.6
申请日:2021-12-16
Applicant: 科大讯飞股份有限公司
IPC: G10L21/007 , G10L21/0208 , G10L21/0232 , G10L25/21 , G06V10/80
Abstract: 本申请公开了一种语音增强方法、装置、电子设备及计算机可读存储介质,其中,该方法包括:获取目标的视频数据和原始音频数据,其中,视频数据是获取原始音频数据时对目标拍摄得到的;利用视频数据提取视觉特征,以及利用原始音频数据提取语义特征和语音特征;基于视觉特征、语义特征和语音特征进行语音增强处理,得到增强音频数据。通过上述方式,本申请能够提升语音增强的鲁棒性。
-
公开(公告)号:CN111738992A
公开(公告)日:2020-10-02
申请号:CN202010500226.3
申请日:2020-06-04
Applicant: 科大讯飞股份有限公司
Abstract: 本发明实施例提供一种肺部病灶区域提取方法、装置、电子设备和存储介质,其中方法包括:确定肺部影像;将肺部影像输入至病灶检测模型,得到病灶检测模型输出的病灶检测结果;将肺部影像输入至病灶分割模型,得到病灶分割模型输出的病灶分割结果;基于病灶检测结果和病灶分割结果,确定肺部影像的病灶区域提取结果。本发明实施例提供的方法、装置、电子设备和存储介质,通过病灶检测模型得到病灶检测结果,通过病灶分割模型得到病灶分割结果,实现了自动化的病灶区域提取,在保证病灶区域提取效率的同时,通过结合病灶检测模型和病灶分割模型两个模型的优势,得到兼顾了区域提取准确性和提取精度的肺部影像的病灶区域提取结果。
-
公开(公告)号:CN111161268A
公开(公告)日:2020-05-15
申请号:CN201911275373.9
申请日:2019-12-12
Applicant: 科大讯飞股份有限公司
Abstract: 本申请提供了一种图像处理方法、装置、电子设备及计算机存储介质,首先获取目标用户的胸片图像;接着,将所述胸片图像输入训练好的分割模型,根据所述训练好的分割模型的输出确定原始肋骨图像;最后,对所述原始肋骨图像进行分割处理,得到目标肋骨图像,所述分割处理用于获取无粘连的肋骨图像。可以将深度学习的神经网络模型与后续处理结合,自动分割出每一根肋骨都独立的目标肋骨图像,提升图像处理的准确性和效率,也为医生提供了便利。
-
公开(公告)号:CN119851342A
公开(公告)日:2025-04-18
申请号:CN202411860754.4
申请日:2024-12-17
Applicant: 科大讯飞股份有限公司
Abstract: 本发明提供一种行为识别方法、装置及车辆,所述方法包括:对待识别图像进行人脸检测,提取得到目标人物的人脸图像;基于待识别图像的全图特征,以及人脸图像的人脸特征,确定目标人物的视线落点区域;在视线落点区域在待识别图像范围内的情况下,在视线落点区域内,对待识别图像进行目标检测;基于目标检测结果,确定目标人物的行为识别结果。本发明提供的行为识别方法、装置及车辆,不再需要处理复杂的空间映射关系,简化了系统架构和算法复杂度,提高了行为识别的准确性和实时性。
-
-
-
-
-
-
-
-
-