-
公开(公告)号:CN118861329A
公开(公告)日:2024-10-29
申请号:CN202410843880.2
申请日:2024-06-27
Applicant: 科大讯飞股份有限公司
IPC: G06F16/432 , G06F16/483 , G06F16/487 , G06N3/0442 , G06N3/0455
Abstract: 本发明提供一种车外环境信息问答方法、装置、车辆、电子设备及存储介质,涉及车辆技术领域,该方法通过抽取用户的语音问题中的关键词信息,并结合电子地图和车辆的当前位姿信息,可以快速准确地定位语音问题中的对象主体,避免图像质量较差、图像残缺等问题导致对象主体识别不准确的问题出现,提高为用户提供的回复信息的准确性。而且,该方法由用户主动提供语音问题,可以针对语音问题为用户提供个性化介绍服务,提高用户体验。此外,该方法应用搜索引擎和/或大型语言模型,可以实时为用户提供生动有用的回复信息,进一步提高用户体验。
-
公开(公告)号:CN118844934A
公开(公告)日:2024-10-29
申请号:CN202410848089.0
申请日:2024-06-27
Applicant: 科大讯飞股份有限公司
IPC: A61B5/00 , G06V40/16 , G06N3/0464 , G06N3/08 , A61B5/0205 , G10L25/66 , G10L25/30 , G08B21/02
Abstract: 本发明提供一种用户健康状态感知方法、装置、车辆、电子设备及存储介质,涉及医疗健康技术领域,该方法首先获取用户的声音信息;然后将声音信息进行特征提取,得到声学特征,并基于声学特征,对声音信息进行分类识别,确定声音信息的分类结果;最后基于分类结果,对用户的健康状态进行感知,得到健康状态感知结果。该方法通过语音交互,可以主动侦测用户的健康状态,对于用户出现咳嗽、鼻音、喉咙沙哑等症状时,可以及时识别到用户的身体健康状态,提高驾驶安全性,便于后续对用户进行及时救治。
-
公开(公告)号:CN116386639A
公开(公告)日:2023-07-04
申请号:CN202310091983.3
申请日:2023-01-17
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种语音交互方法及相关装置、设备、系统和存储介质,其中,语音交互方法包括:获取语音交互场景的拍摄图像和采集语音;基于拍摄图像进行检测,得到拍摄图像中目标对象的视线注视情况和唇部运动情况;基于唇部运动情况,从采集语音中提取目标对象的目标语音,并获取语音交互场景中交互设备的控制指令与目标语音的语义匹配情况;响应于视线注视情况包括目标对象的视线注视交互设备且存在语义匹配情况满足预设要求的控制指令,控制交互设备执行语义匹配情况满足预设要求的控制指令。上述方案,能够在语音交互之前免于语音唤醒,提升语音交互的便利性,同时提升语音交互的准确性。
-
-