-
公开(公告)号:CN119964165A
公开(公告)日:2025-05-09
申请号:CN202411812393.6
申请日:2024-12-10
Applicant: 科大讯飞股份有限公司
IPC: G06V30/14 , G06V30/416 , G06V30/412 , G06V30/22 , G06F16/334 , G06V30/19 , G06F16/35 , G06F40/30 , G06F40/258 , G06Q10/0639 , G06Q50/20
Abstract: 本申请公开了一种答题内容评价方法、系统和装置,该方法包括:获取当前答卷对应的初始图像,确定所述初始图像对应的至少一个一级标题;获取所述一级标题匹配的类别信息,基于所述类别信息,确定所述一级标题对应的目标答题分区;其中,所述目标答题分区包括至少一个二级标题;获取所述目标答题分区中每个所述二级标题对应的手写区域,确定所述手写区域对应的识别文本;基于所述识别文本,获取对应的评价结果。通过上述方式,本申请能够提高对答题内容进行评价的效率和灵活性。
-
公开(公告)号:CN119850719A
公开(公告)日:2025-04-18
申请号:CN202411821607.6
申请日:2024-12-11
Applicant: 科大讯飞股份有限公司
Abstract: 本发明提供一种视线估计方法、装置、电子设备和存储介质,其中方法包括:确定待估计的人脸图像,以及人脸图像中的眼部图像;对人脸图像和眼部图像进行特征提取,并基于特征提取所得到的人脸特征和眼部特征进行混合注意力交互,以及基于人脸特征进行自注意力交互,得到眼部融合特征和脸部姿态特征;基于眼部融合特征和脸部姿态特征进行视线估计,得到人脸图像对应的视线方向,克服了目前视线估计易受到各种因素干扰,导致估计结果准确性前欠佳的缺陷,通过混合注意力交互深度挖掘互补信息,并通过互补特征融合实现信息互补,在此基础上进行视线估计,不仅能够实现信息的最大利用,还能提升视线估计的精细度和准确性,能够得到准确可靠的视线方向。
-
公开(公告)号:CN119428733A
公开(公告)日:2025-02-14
申请号:CN202411881172.4
申请日:2024-12-19
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种人机交互方法、装置、相关设备及计算机程序产品,涉及人工智能技术领域。其中人机交互方法包括,通过获取车内目标用户提出的交互问题,利用车内的第一摄像头拍摄来获取目标用户的影像,根据影像确定目标用户的视线方向信息,从而能够更好地理解用户的意图和需求。利用第一摄像头确定目标用户的视线方向信息,并据此调整第二摄像头的视角,并获取第二摄像头拍摄的车外图像,使得系统能够看到用户所关注的对象或场景,并通过调用多模态大模型,结合车外图像和用户的交互问题,能够进行更深层次的信息处理和理解,通过理解用户的交互问题,根据车外图像生成对应的回复结果,使得回复更加准确和相关,提高了交互的效率和质量。
-
公开(公告)号:CN119066604A
公开(公告)日:2024-12-03
申请号:CN202410916403.4
申请日:2024-07-09
Applicant: 科大讯飞股份有限公司
IPC: G06F18/25 , G06V40/20 , G10L25/63 , G06V20/40 , G06F18/2431 , G06V10/764
Abstract: 本申请公开了一种情绪识别方法及相关装置、智能座舱和存储介质,其中,情绪识别方法包括:获取目标对象的行为动作数据,并获取目标对象所处场景的多模态数据;基于行为动作数据,提取行为动作特征,并基于多模态数据,提取多模态特征;至少基于行为动作特征和多模态特征进行融合,得到目标情绪特征;基于目标情绪特征,预测得到目标对象的目标情绪。上述方案,能够提高情绪识别的准确性和适用性。
-
公开(公告)号:CN113486804B
公开(公告)日:2024-02-20
申请号:CN202110769197.5
申请日:2021-07-07
Applicant: 科大讯飞股份有限公司
IPC: G06V40/16 , G06V10/774 , G06V10/764 , G06V10/80 , G06V10/762
Abstract: 本申请提供了一种对象识别方法、装置、设备及存储介质,其中,识别方法包括:获取目标异质场景中的待识别图像;基于预先建立的多个识别模型中的一个,对待识别图像中的待识别对象进行识别,多个识别模型采用目标异质场景中的训练样本集训练得到,每个识别模型根据对应的预测损失进行参数更新,每个识别模型对应的预测损失根据训练样本集的目标分类结果确定,训练样本集的目标分类结果通过对训练样本集分别在多个识别模型上的分类结果融合得到,训练样本集在一识别模型上的分类结果根据从该识别模型针对训练样本集中每个样本确定的特征表示向量中提取的唯一性特征向量确定。本申请提供的对象识别方法对目标异质场景中的图像具有较好的识别效果。
-
公开(公告)号:CN117475160A
公开(公告)日:2024-01-30
申请号:CN202311199417.0
申请日:2023-09-15
Applicant: 科大讯飞股份有限公司
IPC: G06V10/40 , G06V10/74 , G06V10/774 , G06V10/764
Abstract: 本申请公开了目标对象跟随方法、系统以及相关装置,该方法包括:响应于获取到跟随指令,从当前帧中获取目标对象的第一图像特征和第一朝向信息,将第一图像特征存储至队列集合中的目标队列;获取下一帧中的所有候选对象,响应于下一帧中至少部分候选对象之间产生遮挡,获取每个候选对象的第二图像特征和第二朝向信息;基于第二图像特征、第二朝向信息以及队列集合,将满足预设条件的候选对象作为目标对象;将目标对象的第二朝向信息更新为第一朝向信息,以及将目标对象的第二图像特征更新为第一图像特征,并返回至将第一图像特征存储至队列集合中的目标队列的步骤。通过上述方式,本申请能够提高对目标对象进行跟随的效率和准确性。
-
公开(公告)号:CN111259738B
公开(公告)日:2023-10-27
申请号:CN202010020092.5
申请日:2020-01-08
Applicant: 科大讯飞股份有限公司
IPC: G06V40/16 , G06V10/82 , G06V10/774 , G06N3/045 , G06N3/08
Abstract: 本申请实施例公开了一种人脸识别模型构建方法、人脸识别方法及相关装置,方法包括:根据预先训练好的N个人脸识别教师模型和样本数子集更新原始类中心矩阵,得到更新后的N个原始类中心矩阵;获取当前训练周期的N个特征空间转换矩阵;根据N个特征空间转换矩阵和N个原始类中心矩阵,确定融合类中心矩阵;根据融合类中心矩阵和预设的监督损失函数对当前训练的人脸识别学生模型进行训练,得到训练后的人脸识别学生模型;若训练后的人脸识别学生模型满足预设条件,则确定当前训练的人脸识别学生模型收敛;若训练后的人脸识别学生模型不满足预设条件,则继续下一个训练周期,直至满足预设条件。本申请有利于提高人脸学生识别模型的效率和准确度。
-
公开(公告)号:CN112700568A
公开(公告)日:2021-04-23
申请号:CN202011581613.0
申请日:2020-12-28
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种身份认证的方法、设备及计算机可读存储介质,其中,该方法包括:利用图像采集装置对预设范围内的目标对象进行图像采集,得到待分析图像;对待分析图像进行意图分析,以确定目标对象是否存在身份认证的意图;若目标对象存在身份认证的意图,则对目标对象进行身份认证。通过上述方式,本申请能够提升身份识别设备唤醒的准确率。
-
公开(公告)号:CN109712188A
公开(公告)日:2019-05-03
申请号:CN201811625798.3
申请日:2018-12-28
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种目标跟踪方法及装置,获取摄像机在当前时刻对目标拍摄的图像,对图像进行分析,以确定目标在当前时刻的第一位置,以及,获取麦克风阵列确定的作为声源的目标在当前时刻的第二位置,进一步根据第一位置和第二位置,确定目标在当前时刻的修正位置,调整摄像机的拍摄控制参数,以使摄像机对准修正位置进行拍摄。本申请同时考虑通过拍摄图像所确定的第一位置以及通过麦克风阵列所确定的第二位置,据此确定的目标的修正位置更准确,进而调整摄像机的拍摄控制参数,使其对准修正位置进行拍摄,也即对目标跟踪时,摄像机对准目标进行拍摄,有效提高了目标的跟踪拍摄效果。
-
公开(公告)号:CN119252514A
公开(公告)日:2025-01-03
申请号:CN202411765514.6
申请日:2024-12-04
Applicant: 科大讯飞股份有限公司
Abstract: 本发明涉及人工智能技术领域,提供一种健康监测方法、装置、电子设备和存储介质,其中方法包括:对当前采集的视频帧进行人脸检测,得到当前帧的人脸区域图像;对人脸区域图像进行关键点检测,得到人脸关键点;基于人脸关键点,从人脸区域图像中确定出人脸局部区域;基于人脸区域图像中的目标关键点,将当前帧的人脸局部区域与上一帧的人脸局部区域进行对齐,并应用对齐后的人脸局部区域进行健康监测,得到健康指标。本发明通过基于检测到的人脸关键点,从人脸区域图像中确定出人脸局部区域,可以抑制过多干扰像素对特征提取的影响,通过将当前帧的人脸局部区域与上一帧进行对齐,可以显著缓解像素错位带来的影响,从而提高健康监测的准确性。
-
-
-
-
-
-
-
-
-