-
公开(公告)号:CN118609096A
公开(公告)日:2024-09-06
申请号:CN202410655097.3
申请日:2024-05-24
Applicant: 中国第一汽车股份有限公司 , 一汽(南京)科技开发有限公司
IPC: G06V20/59 , G06V10/25 , G06V10/764
Abstract: 本发明实施例公开了一种基于感兴趣区域的安全带佩戴检测方法、装置及设备。该方法包括:获取车辆的车内人员图像;根据车内人员图像中座位安全带的预设始末点确定斜向安全带预设线,并在斜向安全带预设线的中垂线上确定第一圆点;以第一圆点为圆心,第一圆心与预设始末点中的起点或者终点之间的长度为半径,绘制第一目标圆;根据第一目标圆、第一圆心、以及预设始末点,确定目标感兴趣区域;将目标感兴趣区域输入至预设安全带佩戴分类模型中,确定车内人员是否佩戴安全带。该方法可以基于感兴趣区域对安全带佩戴情况进行检测,降低非感兴趣区域的干扰,提高检测准确性,并具有良好的适应性。
-
公开(公告)号:CN117935841A
公开(公告)日:2024-04-26
申请号:CN202311738072.1
申请日:2023-12-15
Applicant: 中国第一汽车股份有限公司
Abstract: 本发明实施例公开了一种车载声纹唤醒方法、装置、电子设备及存储介质。该方法包括:构建声纹唤醒数据集以及声纹唤醒网络;所述声纹唤醒网络是由声纹识别网络与语音唤醒网络进行拟合得到的;获取车载场景下的车载噪声数据,并将具备模拟能力的车载噪声数据添加至声纹唤醒数据集中,对声纹唤醒数据集进行车载噪声增强;采用车载噪声增强后的声纹唤醒数据集对声纹唤醒网络进行训练得到目标声纹唤醒网络,并采用所述目标声纹唤醒网络对车载声纹进行唤醒。采用本方案,将声纹识别网络和语音唤醒网络在算法层面进行融合,构建一个声纹唤醒网络,减少因短语句降低声纹提取网络性能的影响;针对车载场景对车载噪声进行增强,以提高模型的鲁棒性。
-
公开(公告)号:CN117351934A
公开(公告)日:2024-01-05
申请号:CN202311508652.1
申请日:2023-11-13
Applicant: 中国第一汽车股份有限公司 , 一汽(南京)科技开发有限公司
Abstract: 本发明公开了一种流式语音合成方法、装置、电子设备和存储介质。该方法包括:确定当前次处理周期使用的当前尺寸信息,并基于当前尺寸信息确定当前特征块,确定对当前特征块进行语音合成推理的当前推理消耗时间,基于当前尺寸信息确定当前特征块的当前时长信息,并基于当前推理消耗时间和当前时长信息确定语音合成模型的当前实时率,基于当前尺寸信息和当前实时率确定下一尺寸信息;当下一尺寸信息大于或等于当前剩余特征的帧数,则将当前剩余特征全部送入语音合成模块得到剩余语音音频,否则继续重复上述步骤。本申请解决了因固定分块尺寸而导致首帧时延与整体推理速度降低及合成效果无法兼顾的问题,提高了整体推理速度和合成效果。
-
公开(公告)号:CN117275451A
公开(公告)日:2023-12-22
申请号:CN202311267127.5
申请日:2023-09-27
Applicant: 中国第一汽车股份有限公司 , 一汽(南京)科技开发有限公司
Abstract: 本发明公开了一种合成方法、装置、设备及存储介质,该方法包括:从云侧合成服务和端侧合成服务中,选取对应云端网络状态的当前合成服务;在基于当前合成服务合成当前待合成文本的情况下,若云端网络状态发生变更,则确定当前合成服务对应的当前合成状态;确定合成当前待合成文本的目标合成服务;基于目标合成服务在当前合成状态的基础上继续合成当前待合成文本,得到对应的音频。本发明根据云端网络状态的变更,将当前合成服务切换为目标合成服务,目标合成服务在当前合成状态的基础上继续合成当前待合成文本,得到对应的音频,为用户带来任意网络场景下更加自然流畅的语音合成体验,避免了对当前合成状态的重新计算,在进一步解放算力的同时,提升了合成的质量。
-
公开(公告)号:CN115035896A
公开(公告)日:2022-09-09
申请号:CN202210609856.3
申请日:2022-05-31
Applicant: 中国第一汽车股份有限公司
Abstract: 本发明公开了一种车用语音唤醒方法、装置、电子设备及存储介质,该方法包括:获取目标车辆的车联网数据以及预设帧数的座舱语音数据;根据所述车联网数据,确定车联网编码数据,并根据所述座舱语音数据,确定音频特征编码数据;根据所述车联网编码数据以及所述音频特征编码数据,确定特征融合数据;将所述特征融合数据输入至预先训练完成的唤醒模型中,得到与所述特征融合数据相对应的唤醒数据;其中,所述唤醒模型基于多尺度深度可分时域卷积网络构建;基于所述唤醒数据,对所述目标车辆的语音交互系统进行处理。通过本发明实施例的技术方案,实现了提高车用语音唤醒的场景适应性,并提高用户体验度的技术效果。
-
公开(公告)号:CN119478900A
公开(公告)日:2025-02-18
申请号:CN202411401850.2
申请日:2024-10-09
Applicant: 中国第一汽车股份有限公司 , 一汽(南京)科技开发有限公司
IPC: G06V20/59 , G06V10/25 , G06V10/26 , G06V10/40 , G06V10/44 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本申请公开了一种驾驶行为确定方法、装置、电子设备及存储介质,涉及智能驾驶技术,该方法包括:将视频流中的当前帧图像输入至唇部分割模型中,获得唇部分割结果,唇部分割结果用于指示在当前帧图像中驾驶员的唇部是否可见;根据唇部分割结果确定目标检测模型;将当前帧图像输入至目标检测模型,确定驾驶员的当前驾驶行为。本申请在当前时刻下只调取与唇部分割结果相关的检测模型,能够提升模型的运行效率,使得快速获得检测结果;并通过目标检测模型对当前驾驶行为进行针对性检测的方式,取到了提高驾驶行为检测精准度的有益效果。
-
公开(公告)号:CN119018028B
公开(公告)日:2025-02-18
申请号:CN202411515640.6
申请日:2024-10-29
Applicant: 中国第一汽车股份有限公司 , 一汽(南京)科技开发有限公司
Abstract: 本发明公开了一种基于情绪状态的座位排列方法、装置、设备、介质及产品。该方法包括:在检测到目标车辆外部存在乘员上车动作时,确定外部乘员的外部乘员面部图像和外部乘员身高,以及内部乘员的内部乘员面部图像和内部乘员身高;根据外部乘员身高和内部乘员身高,以及内部乘员面部图像中各内部乘员的图像检测框之间的相对位置,对外部乘员面部图像和内部乘员面部图像进行图像融合,确定至少一种乘员座位排列组合方式分别对应的乘员座位融合图像;对乘员座位融合图像进行图像分析,确定各乘员座位排列组合方式下驾驶员与其他乘员之间的情绪影响程度;根据各乘员座位排列组合方式分别对应的情绪影响程度,确定目标乘员座位排列组合方式。
-
公开(公告)号:CN119206818A
公开(公告)日:2024-12-27
申请号:CN202411228364.5
申请日:2024-09-03
Applicant: 中国第一汽车股份有限公司 , 一汽(南京)科技开发有限公司
Abstract: 本发明实施例公开了一种车辆座舱内乘员的年龄估计方法、装置、电子设备及存储介质。包括:获取车辆座舱内乘员的人脸面部图像,并标注对应的年龄标签;依据标注后的人脸面部图像构建不同年龄段的人脸面部图像数据集,并对年龄标签构建对应的散度特征;依据人脸检测算法及人脸关键点检测算法对人脸面部图像进行裁剪确定至少三个尺寸的人脸面部图像框,并依据至少三个尺寸的人脸面部图像框构建年龄估计预测模型;依据人脸面部图像数据集以及年龄标签对年龄估计预测模型进行训练,直至年龄估计预测模型的总损失函数收敛;依据训练得到的目标年龄估计预测模型对车辆座舱内乘员进行年龄估计。采用本方案,提高了车辆座舱内乘员年龄估计的准确性和效率。
-
公开(公告)号:CN119018028A
公开(公告)日:2024-11-26
申请号:CN202411515640.6
申请日:2024-10-29
Applicant: 中国第一汽车股份有限公司 , 一汽(南京)科技开发有限公司
Abstract: 本发明公开了一种基于情绪状态的座位排列方法、装置、设备、介质及产品。该方法包括:在检测到目标车辆外部存在乘员上车动作时,确定外部乘员的外部乘员面部图像和外部乘员身高,以及内部乘员的内部乘员面部图像和内部乘员身高;根据外部乘员身高和内部乘员身高,以及内部乘员面部图像中各内部乘员的图像检测框之间的相对位置,对外部乘员面部图像和内部乘员面部图像进行图像融合,确定至少一种乘员座位排列组合方式分别对应的乘员座位融合图像;对乘员座位融合图像进行图像分析,确定各乘员座位排列组合方式下驾驶员与其他乘员之间的情绪影响程度;根据各乘员座位排列组合方式分别对应的情绪影响程度,确定目标乘员座位排列组合方式。
-
公开(公告)号:CN117475499A
公开(公告)日:2024-01-30
申请号:CN202311444406.4
申请日:2023-11-01
Applicant: 中国第一汽车股份有限公司 , 一汽(南京)科技开发有限公司
IPC: G06V40/18 , G06V40/16 , G06V10/764 , G06N3/09
Abstract: 本发明实施例公开了一种视线注视点估计方法、装置、电子设备及存储介质。该方法包括:采用已标记人眼数据对瞳孔检测模型进行训练,确定目标瞳孔检测模型;采用所述目标瞳孔检测模型对车载视频中的人脸图像进行瞳孔检测,并确定车载视频中的人脸瞳孔位置信息以及面部图像信息;依据人脸瞳孔位置信息以及面部图像信息确定视线注视点坐标,并对视线注视点坐标进行编码,将编码后的视线注视点坐标信息与面部图像信息进行结合,构建视线注视点估计模型;将所述视线注视点估计模型进行训练,确定目标视线注视点估计模型,并采用所述目标视线注视点估计模型对车载视频中的目标人脸图像进行视线注视点估计。采用本方案,实现对视线注视点的有效估计。
-
-
-
-
-
-
-
-
-