-
公开(公告)号:CN118918517A
公开(公告)日:2024-11-08
申请号:CN202411397962.5
申请日:2024-10-09
Applicant: 中国第一汽车股份有限公司 , 一汽(南京)科技开发有限公司
Abstract: 本申请公开了一种吸烟行为确定方法、装置、电子设备及存储介质,涉及计算机技术,该方法包括:获取若干帧连续的呼气图像,每个呼气图像包括胸部关键点和手部关键点;根据每个胸部关键点和每个手部关键点分别确定手部角度变化序列和胸部角度变化序列;计算手部角度变化序列和胸部角度变化序列的序列特征,根据序列特征确定用户是否存在吸烟行为。本申请通过分析手部角度变化序列对应的变化方向以及胸部角度变化序列对应的变化方向确定出序列特征,实质是在用户呼气过程中,分析胸部关键点和手部关键点的运动方向,从而可以确定出用户的吸烟行为。本方案的实现过程,能够提高确定的吸烟行为的准确度。
-
公开(公告)号:CN118500268A
公开(公告)日:2024-08-16
申请号:CN202410597540.6
申请日:2024-05-14
Applicant: 中国第一汽车股份有限公司 , 一汽(南京)科技开发有限公司
Abstract: 本发明涉及计算机技术领域,尤其涉及一种冰层厚度检测方法、装置、设备及介质。其中,方法包括:获取覆盖有冰层的待检测区域在目标光线照射下的图像,对图像进行语义分割,得到冰层表面区域;将冰层表面区域输入至预先训练的图像检测模型,得到图像检测模型输出的冰层表面区域中的光线入射点所在像素点的位置坐标和光线出射点所在像素点的位置坐标;确定光线入射点的光强度和光线出射点的光强度;根据光线入射点的光强度、光线出射点的光强度以及预设冰层厚度估算公式,确定待检测区域上的冰层的厚度。本发明实施例可以基于覆盖有冰层的区域在目标光线照射下的图像,快速、准确地确定区域上的冰层的厚度,提高检测过程的效率和准确性。
-
公开(公告)号:CN117409762A
公开(公告)日:2024-01-16
申请号:CN202311267145.3
申请日:2023-09-27
Applicant: 中国第一汽车股份有限公司 , 一汽(南京)科技开发有限公司
IPC: G10L13/033 , G10L13/08 , G10L19/16
Abstract: 本发明公开了一种语音编辑及优化方法、装置、设备及存储介质,该方法包括:将原始音频对应的掩盖后音频和待合成文本输入至语音编辑模型,得到编辑后音频,编辑后音频为将掩盖后音频和待合成文本进行编辑合成后生成的音频;将编辑后音频和原始音频输入声音转换模型,得到转换后音频,转换后音频为基于原始音频对编辑后音频的音频特征进行转换后的音频,本发明将原始音频对应的掩盖后音频和待合成文本输入语音编辑模型,得到编辑后音频,完成了自定义角色名场景下的配音任务,提升了用户的沉浸感;将编辑后音频和原始音频输入声音转换模型,优化了编辑后音频与原始音频边界的过渡,且保留了声优原始录制状态,提升了声音编辑后语音的表现力。
-
公开(公告)号:CN117059071A
公开(公告)日:2023-11-14
申请号:CN202311139611.X
申请日:2023-09-05
Applicant: 中国第一汽车股份有限公司 , 一汽(南京)科技开发有限公司
Abstract: 本发明公开了一种语音识别系统、方法及介质。其中,所述系统包括用户模块,用于根据待识别语音数据确定声学特征频谱,并根据声学特征频谱,以及,基于语音识别模型确定待识别语音数据的隐私特征,并将隐私特征发送至云端模块;用户模块,用于根据隐私特征以及基于语音识别模型确定第一文本数据以及第一文本数据得分;云端模块,用于根据隐私特征以及基于语音识别模型确定第二文本数据以及第二文本数据得分,将第二文本数据、第二文本数据得分发送至用户模块;用户模块,还用于基于各文本数据以及各文本数据得分确定目标文本数据。通过执行本方案,可以实现在保护用户隐私的同时保证了语音识别的实时性和准确性,可以提升用户体验。
-
公开(公告)号:CN118918517B
公开(公告)日:2025-02-21
申请号:CN202411397962.5
申请日:2024-10-09
Applicant: 中国第一汽车股份有限公司 , 一汽(南京)科技开发有限公司
Abstract: 本申请公开了一种吸烟行为确定方法、装置、电子设备及存储介质,涉及计算机技术,该方法包括:获取若干帧连续的呼气图像,每个呼气图像包括胸部关键点和手部关键点;根据每个胸部关键点和每个手部关键点分别确定手部角度变化序列和胸部角度变化序列;计算手部角度变化序列和胸部角度变化序列的序列特征,根据序列特征确定用户是否存在吸烟行为。本申请通过分析手部角度变化序列对应的变化方向以及胸部角度变化序列对应的变化方向确定出序列特征,实质是在用户呼气过程中,分析胸部关键点和手部关键点的运动方向,从而可以确定出用户的吸烟行为。本方案的实现过程,能够提高确定的吸烟行为的准确度。
-
公开(公告)号:CN118570857A
公开(公告)日:2024-08-30
申请号:CN202410662306.7
申请日:2024-05-27
Applicant: 中国第一汽车股份有限公司 , 一汽(南京)科技开发有限公司
Abstract: 本发明公开了一种车内滞留儿童识别方法、装置、设备及存储介质。该方法包括:获取待检测车辆的目标位置区域下的至少一个车内用户的人脸识别图像;根据各人脸识别图像,确定各车内用户的用户年龄信息;若各车内用户中存在用户年龄信息满足预设年龄判断条件的目标用户,且各车内用户中不存在除目标用户之外的其他用户,则对目标用户进行关键点检测,得到目标用户的目标关键点;根据所述目标用户的目标关键点,对所述待检测车辆的车内滞留儿童的进行识别,得到识别结果。上述技术方案提高车内滞留儿童的识别精准度。
-
公开(公告)号:CN117153142A
公开(公告)日:2023-12-01
申请号:CN202311101067.X
申请日:2023-08-29
Applicant: 中国第一汽车股份有限公司 , 一汽(南京)科技开发有限公司
IPC: G10L13/02 , G10L13/047
Abstract: 本发明公开了一种语音信号合成方法、装置、电子设备及存储介质。该方法包括:对输入文本进行正则化处理;将输入文本输入至经过训练的多任务模型;通过声学模型,根据音素序列和韵律结构特征的拼接结果预测语音的声音成分;通过声码器基于声音成分合成语音信号。上述技术方案,通过多任务模型基于指令集将输入文本转换为对应的韵律结构特征和音素序列,最后通过声学模型和声码器将音素序列和韵律结构特征合成语音信号,避免了为每个任务单独构建多任务模型,从而降低了多任务模型的复杂度,增强了文本转音素的精度和质量,提高了语音信号合成的处理效率和准确性,有助于在多语言场景中更加准确地预测出语音信号合成中的发音信息。
-
公开(公告)号:CN115064177A
公开(公告)日:2022-09-16
申请号:CN202210669839.9
申请日:2022-06-14
Applicant: 中国第一汽车股份有限公司
Abstract: 本发明实施例公开了一种基于声纹编码器的语音转换方法、装置、设备及介质。其中,该方法包括:获取第一个体的音频数据;获取第二个体的声纹特征;其中,所述第二个体的声纹特征是采用预先训练的声纹编码器输出得到的;将所述第一个体的音频数据和所述声纹特征输入至预先训练的语音转换模型,以供所述语音转换模型基于所述第一个体的音频数据和所述声纹特征的编码结果,得到由第一个体到第二个体的语音转换结果。本技术方案,能够实现第一个体到第二个体的语音转换,且保留了第一个体的说话习惯,并能够实现对第一个体和第二个体的任意切换。
-
公开(公告)号:CN115034409A
公开(公告)日:2022-09-09
申请号:CN202210612068.X
申请日:2022-05-31
Applicant: 中国第一汽车股份有限公司
Abstract: 本发明实施例公开了车辆维修方案确定方法、装置、设备及存储介质。该方法包括:获取目标车辆的原始故障描述数据,其中,原始故障描述数据包括车主的描述数据和/或维修人员的描述数据,将原始故障描述数据转换为满足预设要求的标准知识表示信息,其中,预设要求与预设维修知识图谱相关联,得到目标故障描述信息,将目标故障描述信息与预设维修知识图谱进行匹配,并根据匹配结果输出至少一个推荐维修方案。通过采用上述技术方案,利用车辆的故障描述数据和知识图谱可以快速输出有针对性的推荐维修方案,帮助车主或维修人员快速获知解决当前车辆故障问题的解决方式,提高车辆维修效率。
-
公开(公告)号:CN119693979A
公开(公告)日:2025-03-25
申请号:CN202411522419.3
申请日:2024-10-29
Applicant: 中国第一汽车股份有限公司 , 一汽(南京)科技开发有限公司
IPC: G06V40/16 , G06V20/59 , G06V10/82 , G06N3/0464 , B60W40/08 , B60W30/182
Abstract: 本发明公开了一种基于情绪识别的车辆控制方法、装置、设备及介质。该方法包括:获取车辆内部的实时图像数据;根据当前面部信息,确定每一驾乘人员人脸上的各预设面部关键点的当前位置信息;其中,不同驾乘人员人脸上的各预设面部关键点所覆盖的人脸位置相同;根据各预设面部关键点的当前位置信息和初始位置信息,确定该各预设面部关键点的偏移量;其中,初始位置信息可以是各预设面部关键点在对应人脸处于平静状态时的位置信息;根据各预设面部关键点的偏移量,确定车辆对应的情绪状态,并根据该情绪状态,控制执行对应的车辆功能。上述技术方案实现了对相应车辆功能的自动控制执行,提高相应车辆控制的智能化程度。
-
-
-
-
-
-
-
-
-