-
公开(公告)号:CN119626205A
公开(公告)日:2025-03-14
申请号:CN202510154037.8
申请日:2025-02-12
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种基于语音的年龄预测方法及相关装置,涉及语音处理技术领域,包括:在获取待预测说话者的语音数据之后,先对语音数据进行识别,得到识别文本,再根据语音数据以及识别文本,确定待预测说话者的年龄预测参考特征,年龄预测参考特征包括声学特征和人物事件关系特征;最后,基于待预测说话者的年龄预测参考特征,确定待预测说话者的年龄预测结果。本方案中,由于人物事件关系特征用于表征基于待预测说话者年龄相关的人物事件确定的待预测说话者的年龄范围及其可信度,具有较高的参考性,因此,在基于语音进行年龄预测时,考虑了人物事件关系特征,能够提升年龄预测结果的准确性。
-
公开(公告)号:CN119541535A
公开(公告)日:2025-02-28
申请号:CN202411425512.2
申请日:2024-10-12
Applicant: 科大讯飞股份有限公司
IPC: G10L25/48 , G10L15/22 , B60R16/037
Abstract: 本申请公开了一种语音唤醒方法及相关装置、设备、系统和存储介质,其中,语音唤醒方法包括:获取各个座椅处的音频采集结果和状态检测结果;基于音频采集结果和状态检测结果,确定目标音区数,基于状态检测结果,从音频采集结果中提取得到音频通道数为目标音区数的第一音频;基于目标音区数调用唤醒引擎,得到第一唤醒实例;其中,第一唤醒实例中唤醒引擎的实际通道数为目标音区数;输入第一音频至第一唤醒实例并运行,得到第一唤醒结果。上述方案,能够在实现多音区唤醒的前提下,尽可能地提升多音区唤醒对不同驾驶场景的唤醒准确性和自适应性,并尽快地减少多音区唤醒的资源消耗。
-