-
公开(公告)号:CN119672593A
公开(公告)日:2025-03-21
申请号:CN202411522413.6
申请日:2024-10-29
Applicant: 中国第一汽车股份有限公司 , 一汽(南京)科技开发有限公司
Abstract: 本发明实施例公开了一种车辆异常区域确定方法、装置、设备及介质,该方法包括:获取当前车辆的车辆环境视频,确定候选行人的候选注视焦点和候选手势焦点;根据车辆边界区间和预设焦点距离阈值,从候选行人中确定目标行人;确定目标行人的行人数量,在行人数量达到预设行人数量阈值时,根据各目标行人的目标注视焦点和目标手势焦点,确定当前车辆的异常区域中心;基于车辆环境视频,确定各目标行人的候选注视时间以及候选视线夹角,并确定目标注视时长和目标视线夹角;根据行人数量、目标注视时长和目标视线夹角,确定异常区域半径,并基于异常区域半径和异常区域中心,确定当前车辆的车辆异常区域。提高了确定的车辆异常区域的准确度。
-
公开(公告)号:CN119168946A
公开(公告)日:2024-12-20
申请号:CN202411153515.5
申请日:2024-08-21
Applicant: 中国第一汽车股份有限公司 , 一汽(南京)科技开发有限公司
Abstract: 本发明公开了一种轮胎气压检测方法、装置、设备、介质及程序产品,涉及轮胎检测技术领域。该方法包括:获取目标轮胎的目标轮胎图像;对目标轮胎图像进行检测,获取辐条框架参考线、目标轮胎的胎身检测线,以及辐条框架参考线与目标轮胎的胎身检测线之间的最大距离;将辐条框架参考线向目标轮胎方向径向延伸最大距离,生成目标轮胎的胎身实际线;构建胎身检测线和胎身实际线之间的胎身形变区域,以及辐条框架参考线与胎身实际线之间的胎身原始区域;计算胎身形变区域和胎身原始区域之间的面积占比值,并根据面积占比值,确定目标轮胎的轮胎气压状态。本发明实施例的技术方案可以提高了轮胎气压状态检测的准确度、便捷性、高效性和智能化。
-
公开(公告)号:CN114999534B
公开(公告)日:2024-12-20
申请号:CN202210657570.2
申请日:2022-06-10
Applicant: 中国第一汽车股份有限公司
IPC: G10L25/63 , G10L25/48 , G10L25/30 , G06V40/16 , G06V10/774 , G06V10/82 , G06N3/044 , G06N3/0464 , G06N3/08 , G11B31/00 , G11C7/16
Abstract: 本发明实施例公开了一种车载音乐的播放控制方法、装置、设备和存储介质。该方法包括:获取目标车辆的当前播放音乐,确定与所述当前播放音乐对应的情绪检测参考点;当所述当前播放音乐对播放至所述情绪检测参考点处时,获取所述目标车辆内的目标对象的对象图像信息和对象声音信息;根据所述对象图像信息和所述对象声音信息确定所述目标对象的目标情绪;根据所述目标情绪确定所述当前播放音乐的播放方式,其中,所述播放方式包括继续播放或停止播放。从而实现对车载音乐智能化实时调整,提高了用户的体验。
-
公开(公告)号:CN119037472A
公开(公告)日:2024-11-29
申请号:CN202411256664.4
申请日:2024-09-09
Applicant: 中国第一汽车股份有限公司 , 一汽(南京)科技开发有限公司
IPC: B60W60/00
Abstract: 本发明公开了一种车辆自动驾驶启动参数的确定方法、装置、车辆和存储介质,涉及汽车技术领域。该方法包括:获取车辆挡风玻璃上的雨滴图像,并根据雨滴图像确定雨滴在当前位置的质量,得到当前质量;确定雨滴从历史位置移动到当前位置的时间,得到雨滴的移动时间;根据历史位置和当前位置确定雨滴的偏移距离;根据当前质量、移动时间和偏移距离确定风力;根据风力确定车辆自动驾驶的启动参数。通过本发明实施例的技术方案可以降低根据风力确定车辆自动驾驶启动参数的成本。
-
公开(公告)号:CN118770263A
公开(公告)日:2024-10-15
申请号:CN202410770643.8
申请日:2024-06-14
Applicant: 中国第一汽车股份有限公司 , 一汽(南京)科技开发有限公司
Abstract: 本发明涉及计算机技术领域,尤其涉及一种车辆控制方法、装置、设备及介质。其中,方法包括:在监测到唤醒指令之后,采集驾驶员的语音信号,并在采集语音信号的过程中,采集车内图像;确定与驾驶员对应的待控制部件的部件名称和操作名称;确定驾驶员的视线角度和头部姿态角度;确定驾驶员的视线目标名称;检测部件名称是否是模糊部件名称;若是,则根据视线目标名称对部件名称进行修正,根据操作名称以及修正后的部件名称,控制待控制部件执行与操作名称对应的操作。本发明实施例可以自动根据基于车内图像确定的视线目标名称,将不准确的部件名称修正为准确的部件名称,准确地确定待控制部件的部件名称,控制待控制部件执行对应的操作。
-
公开(公告)号:CN118609536A
公开(公告)日:2024-09-06
申请号:CN202410777954.7
申请日:2024-06-17
Applicant: 中国第一汽车股份有限公司 , 一汽(南京)科技开发有限公司
IPC: G10L13/02 , G10L13/04 , G10L13/047 , G10L13/08 , G10L25/03 , G10L25/27 , G06F18/23 , G06F18/2321 , G06F18/23213
Abstract: 本发明公开了一种音频生成方法、装置、设备和存储介质,涉及音频技术领域。该方法包括:响应接收到的文本信息,获取目标用户的历史音频信息,文本信息由目标用户通过目标终端发送;从历史音频信息中提取音色特征;对提取的音色特征进行聚类,以确定聚类中心的音色特征;根据聚类中心的音色特征确定目标用户的当前音色特征;将目标用户的当前音色特征和文本信息输入语音生成模型,以生成具有目标用户的当前音色特征的目标音频。通过本发明实施例的技术方案可以生成个性化语音,从而提高用户体验。
-
公开(公告)号:CN118609099A
公开(公告)日:2024-09-06
申请号:CN202410655106.9
申请日:2024-05-24
Applicant: 中国第一汽车股份有限公司 , 一汽(南京)科技开发有限公司
Abstract: 本发明实施例公开了一种安全带松弛状态检测方法、装置、设备及存储介质。该方法包括:获取车辆的车内人员图像,并确定车内人员图像中车内人员肩部上方至安全带收纳位置,且包含安全带的目标感兴趣区域;根据目标感兴趣区域中的安全带图像,确定安全带佩戴边界线,并确定安全带佩戴边界线与目标水平线的夹角;根据夹角,确定安全带松弛状态。该方法基于感兴趣区域对安全带的松弛状态进行检测,以便于督促车内人员规范佩戴安全带,增强安全带的保护功能。
-
公开(公告)号:CN117935841A
公开(公告)日:2024-04-26
申请号:CN202311738072.1
申请日:2023-12-15
Applicant: 中国第一汽车股份有限公司
Abstract: 本发明实施例公开了一种车载声纹唤醒方法、装置、电子设备及存储介质。该方法包括:构建声纹唤醒数据集以及声纹唤醒网络;所述声纹唤醒网络是由声纹识别网络与语音唤醒网络进行拟合得到的;获取车载场景下的车载噪声数据,并将具备模拟能力的车载噪声数据添加至声纹唤醒数据集中,对声纹唤醒数据集进行车载噪声增强;采用车载噪声增强后的声纹唤醒数据集对声纹唤醒网络进行训练得到目标声纹唤醒网络,并采用所述目标声纹唤醒网络对车载声纹进行唤醒。采用本方案,将声纹识别网络和语音唤醒网络在算法层面进行融合,构建一个声纹唤醒网络,减少因短语句降低声纹提取网络性能的影响;针对车载场景对车载噪声进行增强,以提高模型的鲁棒性。
-
公开(公告)号:CN117351934A
公开(公告)日:2024-01-05
申请号:CN202311508652.1
申请日:2023-11-13
Applicant: 中国第一汽车股份有限公司 , 一汽(南京)科技开发有限公司
Abstract: 本发明公开了一种流式语音合成方法、装置、电子设备和存储介质。该方法包括:确定当前次处理周期使用的当前尺寸信息,并基于当前尺寸信息确定当前特征块,确定对当前特征块进行语音合成推理的当前推理消耗时间,基于当前尺寸信息确定当前特征块的当前时长信息,并基于当前推理消耗时间和当前时长信息确定语音合成模型的当前实时率,基于当前尺寸信息和当前实时率确定下一尺寸信息;当下一尺寸信息大于或等于当前剩余特征的帧数,则将当前剩余特征全部送入语音合成模块得到剩余语音音频,否则继续重复上述步骤。本申请解决了因固定分块尺寸而导致首帧时延与整体推理速度降低及合成效果无法兼顾的问题,提高了整体推理速度和合成效果。
-
公开(公告)号:CN117275451A
公开(公告)日:2023-12-22
申请号:CN202311267127.5
申请日:2023-09-27
Applicant: 中国第一汽车股份有限公司 , 一汽(南京)科技开发有限公司
Abstract: 本发明公开了一种合成方法、装置、设备及存储介质,该方法包括:从云侧合成服务和端侧合成服务中,选取对应云端网络状态的当前合成服务;在基于当前合成服务合成当前待合成文本的情况下,若云端网络状态发生变更,则确定当前合成服务对应的当前合成状态;确定合成当前待合成文本的目标合成服务;基于目标合成服务在当前合成状态的基础上继续合成当前待合成文本,得到对应的音频。本发明根据云端网络状态的变更,将当前合成服务切换为目标合成服务,目标合成服务在当前合成状态的基础上继续合成当前待合成文本,得到对应的音频,为用户带来任意网络场景下更加自然流畅的语音合成体验,避免了对当前合成状态的重新计算,在进一步解放算力的同时,提升了合成的质量。
-
-
-
-
-
-
-
-
-