-
公开(公告)号:CN119005587A
公开(公告)日:2024-11-22
申请号:CN202411022926.0
申请日:2024-07-29
Applicant: 中国第一汽车股份有限公司 , 一汽(南京)科技开发有限公司
Abstract: 本发明公开一种座位分配方法、装置、电子设备和存储介质,涉及智能分配技术领域。方法包括:获取车辆搭载旅客行驶过程中所采集的包括旅客活动信息的视频帧序列;基于视频帧序列,对旅客的活动状态进行分析,得到任意两个旅客之间的活动相似度和活动干扰度;根据活动相似度和活动干扰度,为每个旅客分配下次乘车时的最佳座位,得到旅客下次乘车时的座位分配结果;响应于旅客下车后又重新排队上车时,根据座位分配结果,提示每个所述旅客到各自对应的最佳座位处就坐。本方案通过分析旅客的活动状态,进而根据分析得到的旅客之间的活动相似度和活动干扰度,为每个旅客安排下次乘车时的最佳座位,提高了座位分配的准确性,避免旅客之间相互干扰。
-
公开(公告)号:CN119005586A
公开(公告)日:2024-11-22
申请号:CN202411022922.2
申请日:2024-07-29
Applicant: 中国第一汽车股份有限公司 , 一汽(南京)科技开发有限公司
Abstract: 本发明公开一种座位分配方法、装置、电子设备和存储介质,涉及智能分配技术领域。方法包括:在旅客开始排队上车的情况下,获取图像采集器所采集的包括所述旅客面部图像信息的视频帧序列;基于包括旅客面部图像信息的视频帧序列,对每个旅客的情绪状态进行分析,得到每个旅客的情绪活跃度和情绪波动度;根据每个旅客的情绪活跃度和情绪波动度,为每个旅客分配最佳座位,得到座位分配结果;根据座位分配结果,提示每个旅客到各自对应的最佳座位处就坐。本方案通过分析旅客的情绪状态,为每个旅客安排最合理的座位,提高了座位分配的准确性;而且是在旅客排队上车的过程中完成座位分配,提高了座位分配效率。
-
公开(公告)号:CN118942140A
公开(公告)日:2024-11-12
申请号:CN202411376935.X
申请日:2024-09-30
Applicant: 中国第一汽车股份有限公司 , 一汽(南京)科技开发有限公司
Abstract: 本发明公开了一种基于时间衰减机制的表情识别方法、装置、设备及介质。该方法包括:基于预设区域检测模型及预设表情识别模型分类处理当前标准化视频帧确定表情信息,并基于预设上肢体关键点检测模型及预设动作识别模型识别处理当前标准化视频帧确定动作信息;基于动作信息与对应表情信息的一致性关系,确定当前标准化视频帧对应的第一强信息度帧或第二强信息度帧;基于时间衰减机制及第一强信息度帧或第二强信息度帧对当前标准化视频帧进行置信度融合处理得到融合表情置信度值,并基于融合表情置信度值确定当前标准化视频帧对应的表情识别结果。通过本发明的技术方案,能够识别出视频序列中的表情类别,提高了表情识别的准确性和鲁棒性。
-
公开(公告)号:CN118918517A
公开(公告)日:2024-11-08
申请号:CN202411397962.5
申请日:2024-10-09
Applicant: 中国第一汽车股份有限公司 , 一汽(南京)科技开发有限公司
Abstract: 本申请公开了一种吸烟行为确定方法、装置、电子设备及存储介质,涉及计算机技术,该方法包括:获取若干帧连续的呼气图像,每个呼气图像包括胸部关键点和手部关键点;根据每个胸部关键点和每个手部关键点分别确定手部角度变化序列和胸部角度变化序列;计算手部角度变化序列和胸部角度变化序列的序列特征,根据序列特征确定用户是否存在吸烟行为。本申请通过分析手部角度变化序列对应的变化方向以及胸部角度变化序列对应的变化方向确定出序列特征,实质是在用户呼气过程中,分析胸部关键点和手部关键点的运动方向,从而可以确定出用户的吸烟行为。本方案的实现过程,能够提高确定的吸烟行为的准确度。
-
公开(公告)号:CN118609222A
公开(公告)日:2024-09-06
申请号:CN202411081486.6
申请日:2024-08-08
Applicant: 中国第一汽车股份有限公司 , 一汽(南京)科技开发有限公司
IPC: G06V40/20 , G06V20/40 , G06V10/764 , G06V10/80 , G06V10/82
Abstract: 本发明公开了一种基于特征融合的手势识别方法、装置、设备及介质。该方法包括:获取目标车辆对应的标准化视频,并区域剪裁处理标准化视频,生成包含手部区域的目标视频;基于空间注意力模型对目标视频进行空间特征提取,生成目标视频对应的姿态特征,并基于时间注意力模型对目标视频进行时间特征提取,生成目标视频对应的结合光流信息的运动特征;特征融合处理姿态特征以及运动特征,生成目标视频对应的目标融合特征;基于全连接分类网络确定目标融合特征对应的手势类别,作为目标视频对应的目标手势识别信息。通过本发明的技术方案,能够准确且实时地识别动态手势,提高了手势识别的准确性及鲁棒性。
-
公开(公告)号:CN118500268A
公开(公告)日:2024-08-16
申请号:CN202410597540.6
申请日:2024-05-14
Applicant: 中国第一汽车股份有限公司 , 一汽(南京)科技开发有限公司
Abstract: 本发明涉及计算机技术领域,尤其涉及一种冰层厚度检测方法、装置、设备及介质。其中,方法包括:获取覆盖有冰层的待检测区域在目标光线照射下的图像,对图像进行语义分割,得到冰层表面区域;将冰层表面区域输入至预先训练的图像检测模型,得到图像检测模型输出的冰层表面区域中的光线入射点所在像素点的位置坐标和光线出射点所在像素点的位置坐标;确定光线入射点的光强度和光线出射点的光强度;根据光线入射点的光强度、光线出射点的光强度以及预设冰层厚度估算公式,确定待检测区域上的冰层的厚度。本发明实施例可以基于覆盖有冰层的区域在目标光线照射下的图像,快速、准确地确定区域上的冰层的厚度,提高检测过程的效率和准确性。
-
公开(公告)号:CN117409762A
公开(公告)日:2024-01-16
申请号:CN202311267145.3
申请日:2023-09-27
Applicant: 中国第一汽车股份有限公司 , 一汽(南京)科技开发有限公司
IPC: G10L13/033 , G10L13/08 , G10L19/16
Abstract: 本发明公开了一种语音编辑及优化方法、装置、设备及存储介质,该方法包括:将原始音频对应的掩盖后音频和待合成文本输入至语音编辑模型,得到编辑后音频,编辑后音频为将掩盖后音频和待合成文本进行编辑合成后生成的音频;将编辑后音频和原始音频输入声音转换模型,得到转换后音频,转换后音频为基于原始音频对编辑后音频的音频特征进行转换后的音频,本发明将原始音频对应的掩盖后音频和待合成文本输入语音编辑模型,得到编辑后音频,完成了自定义角色名场景下的配音任务,提升了用户的沉浸感;将编辑后音频和原始音频输入声音转换模型,优化了编辑后音频与原始音频边界的过渡,且保留了声优原始录制状态,提升了声音编辑后语音的表现力。
-
公开(公告)号:CN117059071A
公开(公告)日:2023-11-14
申请号:CN202311139611.X
申请日:2023-09-05
Applicant: 中国第一汽车股份有限公司 , 一汽(南京)科技开发有限公司
Abstract: 本发明公开了一种语音识别系统、方法及介质。其中,所述系统包括用户模块,用于根据待识别语音数据确定声学特征频谱,并根据声学特征频谱,以及,基于语音识别模型确定待识别语音数据的隐私特征,并将隐私特征发送至云端模块;用户模块,用于根据隐私特征以及基于语音识别模型确定第一文本数据以及第一文本数据得分;云端模块,用于根据隐私特征以及基于语音识别模型确定第二文本数据以及第二文本数据得分,将第二文本数据、第二文本数据得分发送至用户模块;用户模块,还用于基于各文本数据以及各文本数据得分确定目标文本数据。通过执行本方案,可以实现在保护用户隐私的同时保证了语音识别的实时性和准确性,可以提升用户体验。
-
-
-
-
-
-
-