-
公开(公告)号:CN115861747A
公开(公告)日:2023-03-28
申请号:CN202211457780.3
申请日:2022-11-21
Applicant: 科大讯飞股份有限公司
IPC: G06V10/80 , G06F40/289 , G06V10/764 , G06T3/40 , G06N3/0464 , G06N3/08
Abstract: 本发明提供一种图像生成方法、装置、电子设备及存储介质,其中方法包括:获取待绘制目标的描述文本,从所述描述文本中提取所述绘制目标的预设属性的关键词;基于所述关键词,生成所述预设属性的属性图像;以所述描述文本和所述属性图像为约束,生成所述待绘制目标的目标图像。本发明提供的方法、装置、电子设备及存储介质,以描述文本和属性图像为约束,生成待绘制目标的目标图像,目标图像不仅符合描述文本的限定,还符合属性图像的限定,由此,保证了生成的目标图像中目标的预设属性与描述文本中的关键词一致,目标图像在预设属性的呈现上是符合常识认知的,不会生成稀奇古怪的图像结果,提高了生成的目标图像的准确性和可靠性。
-
公开(公告)号:CN115564834A
公开(公告)日:2023-01-03
申请号:CN202211338236.7
申请日:2022-10-28
Applicant: 科大讯飞股份有限公司
Abstract: 本申请提供了一种视线估计方法及装置、存储介质及电子设备,涉及计算机视觉技术领域。该视线估计方法获取相机系统在当前时刻针对目标用户采集的多帧用户图像;基于多帧用户图像,确定目标用户在相机坐标系下的视线方向信息;基于多帧用户图像,确定目标用户在相机坐标系下的瞳孔坐标信息;基于目标用户在相机坐标系下的视线方向信息和瞳孔坐标信息,确定目标用户在世界坐标系下的视线方向信息和瞳孔坐标信息;基于目标用户在世界坐标系下的视线方向信息和瞳孔坐标信息,确定目标用户的视线估计信息。与传统的视线估计方法相比,有效利用了多视角信息,降低了对训练数据量的依赖,扩大了视线估计系统的有效工作范围,提升了视线方向估计的精准度。此外,本申请实施例能够为分析驾驶员的驾驶状态提供全面、准确的支持和依据,具有适用范围广泛的优势。
-
公开(公告)号:CN112506510A
公开(公告)日:2021-03-16
申请号:CN202011479287.2
申请日:2020-12-15
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种系统皮肤生成方法、装置、设备及存储介质,本申请获取到皮肤背景图以及能够提供图标模板信息的图标模板,进而分别提取皮肤背景图和图标模板的特征信息,基于二者各自的特征信息来生成系统皮肤,本申请生成的系统皮肤包含有与皮肤背景图风格适配的图标。由此可见,本申请在生成系统皮肤时,参考了皮肤背景图的特征信息以及图标模板的特征信息,其中皮肤背景图的特征信息能够提供皮肤背景图的风格特征,图标模板的特征信息能够提供图标的模板信息,如空间结构分布信息等,基于此生成的系统皮肤中的图标风格与皮肤背景图相适配,且图标的空间结构分布与图标模板一致。
-
公开(公告)号:CN119360417A
公开(公告)日:2025-01-24
申请号:CN202411459811.8
申请日:2024-10-18
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种单目手势识别方法及相关装置,涉及手势识别技术领域,单目手势识别方法包括:获取目标手部图像序列;基于预先训练得到的单目3D手部姿态估计模型,获取目标手部图像序列的每个目标手部图像对应的手部3D关键点位置信息,得到目标手部3D关键点位置信息序列,其中,单目3D手部姿态估计模型采用标注有手部3D关键点位置信息的训练手部图像,同时辅以训练手部图像的手部姿态描述文本和/或真实手部3D重建标签训练得到;根据目标手部3D关键点位置信息序列,进行手势识别,得到手势识别结果。本申请公开的单目手势识别方法具有较高的识别精度。
-
公开(公告)号:CN119252514A
公开(公告)日:2025-01-03
申请号:CN202411765514.6
申请日:2024-12-04
Applicant: 科大讯飞股份有限公司
Abstract: 本发明涉及人工智能技术领域,提供一种健康监测方法、装置、电子设备和存储介质,其中方法包括:对当前采集的视频帧进行人脸检测,得到当前帧的人脸区域图像;对人脸区域图像进行关键点检测,得到人脸关键点;基于人脸关键点,从人脸区域图像中确定出人脸局部区域;基于人脸区域图像中的目标关键点,将当前帧的人脸局部区域与上一帧的人脸局部区域进行对齐,并应用对齐后的人脸局部区域进行健康监测,得到健康指标。本发明通过基于检测到的人脸关键点,从人脸区域图像中确定出人脸局部区域,可以抑制过多干扰像素对特征提取的影响,通过将当前帧的人脸局部区域与上一帧进行对齐,可以显著缓解像素错位带来的影响,从而提高健康监测的准确性。
-
公开(公告)号:CN118675089A
公开(公告)日:2024-09-20
申请号:CN202410847707.X
申请日:2024-06-27
Applicant: 科大讯飞股份有限公司
IPC: G06V20/40 , G06V40/16 , G06V20/52 , G06F18/25 , G06N20/00 , G06V10/82 , G06N3/0464 , G06N3/044 , G06N3/045 , G06N3/0442 , G16H50/30 , A61B5/0205 , A61B5/00 , A61B5/145
Abstract: 本发明提供一种生理健康监测方法、装置、车辆、电子设备和存储介质,方法包括获取包括待监测对象的视频,对所述视频中的各帧图像进行面部检测,得到所述各帧图像中的面部图块;预测所述面部图块对应的基本属性,提取包括所述基本属性的描述文本的文本特征,并提取各所述面部图块的图像时序特征;基于所述文本特征和所述图像时序特征,对所述待监测对象的生理健康进行监测。本发明提供的生理健康监测方法、装置、车辆、电子设备和存储介质,能够从复杂的视频信号中提取出微弱的生理指标信号,相比于传感器监测的方式更加便捷,能够提高监测效率的同时保证了监测精度。
-
公开(公告)号:CN117373076A
公开(公告)日:2024-01-09
申请号:CN202311149747.9
申请日:2023-09-06
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种属性识别方法、系统以及相关装置,该方法包括:获取待识别图像;其中,所述待识别图像属于预设对象;将所述待识别图像输入至训练后的学生模型进行属性识别,得到所述待识别图像中所述预设对象的属性识别结果;其中,所述学生模型及其对应的教师模型均包括属性预测网络,且所述学生模型还包括空间变换网络,所述教师模型是基于变换训练图像训练得到的,所述变换训练图像是基于原始训练图像进行仿射变换后得到的,训练后的所述教师模型用于指导所述学生模型对所述原始训练图像进行属性识别,得到训练后的所述学生模型。通过上述方式,本申请能够提高属性识别效率和准确性。
-
公开(公告)号:CN117173798A
公开(公告)日:2023-12-05
申请号:CN202311139689.1
申请日:2023-09-05
Applicant: 科大讯飞股份有限公司
IPC: G06V40/40 , G06V40/16 , G06V10/80 , G06V10/44 , G06V10/764 , G06V10/77 , G06V10/774 , G06V10/82
Abstract: 本发明提供一种活体识别方法、装置、电子设备及存储介质,该方法包括:获取目标用户在目标模态下的待识别图像;将待识别图像输入第一检测模型中,输出目标用户的活体检测结果,第一检测模型是基于第二检测模型确定的第一类别token对初始第一检测模型进行约束得到的,第二检测模型为基于多模态的图像样本训练得到的;第一类别token为第二检测模型对图像样本对应的用户进行活体检测时的参数。该方法中,第二检测模型能利用多模态图像样本中不同模态的数据特征,充分挖掘数据间的关系;通过第二检测模型确定的第一类别token对初始第一检测模型进行约束,使第一检测模型能对任意模态的图像进行活体识别,提高了活体识别的灵活度。
-
公开(公告)号:CN115565162A
公开(公告)日:2023-01-03
申请号:CN202211378229.X
申请日:2022-11-04
Applicant: 科大讯飞股份有限公司
IPC: G06V20/59 , G06V10/774 , G06V10/82 , G06N3/04 , G06N3/08
Abstract: 本申请提供了一种视线估计模型的训练方法及装置、视线估计方法及装置,涉及计算机视觉技术领域。该训练方法包括基于目标对象的双眼区域图像集合,确定目标对象的样本图像对,样本图像对中包括两幅样本图像;确定两幅样本图像各自对应的第一视线特征;基于两幅样本图像各自对应的第一视线特征,确定待训练神经网络模型的损失函数;基于损失函数训练待训练神经网络模型,得到视线估计模型。与现有视线估计模型训练方法相比,显著提升了视线特征的表示能力,扩大了视线估计模型的有效工作范围,提升了视线方向预测的精准度。此外,本申请实施例训练生成的视线估计模型能够为分析驾驶员的驾驶状态提供全面、准确的支持,从而提高车辆行驶的安全性。
-
公开(公告)号:CN115424356A
公开(公告)日:2022-12-02
申请号:CN202211381906.3
申请日:2022-11-07
Applicant: 科大讯飞股份有限公司
Abstract: 本发明公开了一种座舱内手势交互方法及装置,座舱内手势交互方法包括:接收座舱内的实时图像;将实时图像输入手势识别模型,获得手势识别模型输出的第一手势类别检测结果和第一位置类别检测结果;依据第一座舱位置上第一手势对应的控制指令控制座舱内的设备;其中,对于不同的第一座舱位置,相同的第一手势对应的控制指令不同。本发明通过手势识别模型直接获得手势类别检测结果,避免两阶段手势识别导致的车机工作压力,并通过识别手势动作人所在的座舱位置,为不同座舱位置上的相同手势配置不同的功能,提高了手势交互的丰富度。
-
-
-
-
-
-
-
-
-