-
公开(公告)号:CN112562727A
公开(公告)日:2021-03-26
申请号:CN202011506902.4
申请日:2020-12-18
Applicant: 科大讯飞股份有限公司
Abstract: 本发明公开了一种应用于音频监控的音频场景分类方法、装置以及设备,本发明的构思在于针对现有音频场景分类方式耗时且浪费资源的问题,从两个方面解决,一方面是基于处理时效性,实时针对每一个音频分段进行质量研判,保证只对有效音频片段进行检测,并且是以音频片段作为处理单位,一旦检测出分类结果便终止对其他可用片段的处理,这样可以大幅减少不必要的检测过程;另一方面,利用RNN架构的特点在场景类型检测过程中无需再保存各音频片段的信息,仅需要将前一步处理结果作为后续处理的输入,这样可以充分节约资源空间。由此可见,本发明既能够保证处理时效,又能够使系统轻量化,从而可以灵活适用于各种规模的音频监控应用环境。
-
公开(公告)号:CN112562727B
公开(公告)日:2024-04-26
申请号:CN202011506902.4
申请日:2020-12-18
Applicant: 科大讯飞股份有限公司
Abstract: 本发明公开了一种应用于音频监控的音频场景分类方法、装置以及设备,本发明的构思在于针对现有音频场景分类方式耗时且浪费资源的问题,从两个方面解决,一方面是基于处理时效性,实时针对每一个音频分段进行质量研判,保证只对有效音频片段进行检测,并且是以音频片段作为处理单位,一旦检测出分类结果便终止对其他可用片段的处理,这样可以大幅减少不必要的检测过程;另一方面,利用RNN架构的特点在场景类型检测过程中无需再保存各音频片段的信息,仅需要将前一步处理结果作为后续处理的输入,这样可以充分节约资源空间。由此可见,本发明既能够保证处理时效,又能够使系统轻量化,从而可以灵活适用于各种规模的音频监控应用环境。
-
公开(公告)号:CN112735391B
公开(公告)日:2024-05-31
申请号:CN202011596480.4
申请日:2020-12-29
Applicant: 科大讯飞股份有限公司
Abstract: 本申请实施例公开了一种分布式语音的响应方法及相关装置,该方法包括:接收至少一个拾音终端的语音信号,对所述语音信号进行识别确定是否具有唤醒关键词;若具有唤醒关键词,则获取拾音终端的位置信息、响应时间以及语音信息的能量信息;依据所述位置信息、响应时间以及能量信息从所述至少一个拾音终端中选择所述语音信号的响应终端。本申请提供的技术方案具有用户体验度高的优点。
-
公开(公告)号:CN112735391A
公开(公告)日:2021-04-30
申请号:CN202011596480.4
申请日:2020-12-29
Applicant: 科大讯飞股份有限公司
Abstract: 本申请实施例公开了一种分布式语音的响应方法及相关装置,该方法包括:接收至少一个拾音终端的语音信号,对所述语音信号进行识别确定是否具有唤醒关键词;若具有唤醒关键词,则获取拾音终端的位置信息、响应时间以及语音信息的能量信息;依据所述位置信息、响应时间以及能量信息从所述至少一个拾音终端中选择所述语音信号的响应终端。本申请提供的技术方案具有用户体验度高的优点。
-
-
-