-
公开(公告)号:CN119024257A
公开(公告)日:2024-11-26
申请号:CN202310619029.7
申请日:2023-05-26
Applicant: 科大讯飞股份有限公司
Inventor: 李俊 , 宫韬 , 蔡明琦 , 杨杰 , 刘铱豪 , 马旭 , 宋若淼 , 翟晓伟 , 刘颖 , 车骋 , 徐甲甲 , 李心 , 储汉卿 , 任颖 , 苏海涛 , 梁华 , 胡琼英 , 方昕 , 高建清 , 刘聪 , 胡国平
Abstract: 本申请公开了一种声源成像系统的性能测试方法以及相关装置,该方法包括:使两个测试声源分别与声源成像系统之间具有第一预设距离;两个测试声源分别相对声源成像系统具有相同的第一预设俯仰角和不同的第一预设方位角,且两个第一预设方位角差值的绝对值为180°;使两个测试声源同时发出声波,声源成像系统获得两个测试声源的第一检测结果;其中,第一检测结果包括对应测试声源的第一测试俯仰角和第一测试方位角;基于两个测试声源的第一检测结果、以及相应的第一预设俯仰角和第一预设方位角判定声源成像系统的分辨率精度是否符合对应的要求。通过上述方式,本申请能够高效准确地判断声源成像系统对于多声源的定位是否准确。
-
公开(公告)号:CN116417003A
公开(公告)日:2023-07-11
申请号:CN202211131821.X
申请日:2022-09-16
Applicant: 科大讯飞股份有限公司
Abstract: 本发明提供一种语音交互系统、方法、电子设备和存储介质,系统包括:声学采集组件,用于采集用户语音流;语音识别组件,用于对用户语音流执行语音端点检测和语音识别,得到识别文本;对话处理组件,用于对识别文本执行自然语言理解、对话管理和自然语言生成,得到交互文本;语音合成组件,用于对交互文本执行语音合成操作,得到交互合成语音;语音播报组件,用于播报交互合成语音;用户语音流的采集通过上行通道执行,交互合成语音的播报通过下行通道执行,上下行通道并行。本发明提供的系统、方法、电子设备和存储介质,使得用户与机器之间的交互可以更加贴近真实的对话习惯,保证了语音交互的自然性。
-
公开(公告)号:CN119066604A
公开(公告)日:2024-12-03
申请号:CN202410916403.4
申请日:2024-07-09
Applicant: 科大讯飞股份有限公司
IPC: G06F18/25 , G06V40/20 , G10L25/63 , G06V20/40 , G06F18/2431 , G06V10/764
Abstract: 本申请公开了一种情绪识别方法及相关装置、智能座舱和存储介质,其中,情绪识别方法包括:获取目标对象的行为动作数据,并获取目标对象所处场景的多模态数据;基于行为动作数据,提取行为动作特征,并基于多模态数据,提取多模态特征;至少基于行为动作特征和多模态特征进行融合,得到目标情绪特征;基于目标情绪特征,预测得到目标对象的目标情绪。上述方案,能够提高情绪识别的准确性和适用性。
-
公开(公告)号:CN118536055A
公开(公告)日:2024-08-23
申请号:CN202410478187.X
申请日:2024-04-19
Applicant: 科大讯飞股份有限公司
IPC: G06F18/25 , G06F18/214 , G06F18/213 , G06N3/045 , G06N3/096
Abstract: 本申请公开了一种情绪识别方法、系统以及相关装置,该方法包括:获取待识别样本;其中,待识别样本包含多个目标模态中部分目标模态的采样数据,待识别样本中缺失的目标模态为缺失模态;获取待识别样本中每个目标模态匹配的目标特有特征和目标共有特征;其中,每个目标特有特征对应有与目标模态相匹配的特征提取方式,所有目标共有特征对应有相同的特征提取方式;基于目标模态匹配的参考特征和目标共有特征,得到缺失模态对应的构建特征;基于目标特有特征、目标共有特征和构建特征,获取待识别样本对应的目标情绪类别。通过上述方式,本申请能够在部分模态的采样数据缺失时,提高对待识别样本进情绪识别的准确性。
-
公开(公告)号:CN116088675A
公开(公告)日:2023-05-09
申请号:CN202211643916.X
申请日:2022-12-20
Applicant: 科大讯飞股份有限公司
IPC: G06F3/01 , G10L15/22 , G10L15/30 , G10L13/04 , G10L21/10 , G10L21/18 , H04N5/262 , H04N5/04 , G06T13/40
Abstract: 本申请公开了一种虚拟形象交互方法及相关装置、设备、系统和介质,其中,虚拟形象交互方法包括:获取并播放第一视频流;响应于用户在播放第一视频流时的第二交互请求,发送打断合成请求和第二交互请求至交互应答服务器;其中,交互应答服务器响应于打断合成请求而暂停合成第一视频流,并响应于第二交互请求实时合成第二视频流,以及在第二视频流合成完毕之后,基于标志符,确定是否从打断位置开始继续合成新的第一视频流;获取并播放交互应答服务器新合成的视频流。上述方案,能够提升虚拟形象交互的自然度。
-
-
-
-