-
公开(公告)号:CN116635932A
公开(公告)日:2023-08-22
申请号:CN202180084448.4
申请日:2021-11-23
Applicant: 微软技术许可有限责任公司
IPC: G10L15/08
Abstract: 所公开的语音识别技术通过以下操作改进用户感知的延迟,同时维持准确性:由主(例如,准确)语音识别引擎(SRE)和辅(例如,快速)SRE并行地接收音频流;利用主SRE生成主结果;利用辅SRE生成辅结果;将辅结果附加到词列表;以及将主结果合并到词列表中的辅结果中。将来自主SRE和辅SRE的输出组合到如本文中所描述的单个解码器中改善了用户感知的延迟,同时维持或者提高了准确性,以及其他优点。
-
公开(公告)号:CN114981887B
公开(公告)日:2025-02-14
申请号:CN202080093002.3
申请日:2020-12-15
Applicant: 微软技术许可有限责任公司
Abstract: 实施例可以包括收集第一批次的音频信号的声学特征帧,第一批次的声学特征帧的数目等于第一批次尺寸,将第一批次输入到语音识别网络,响应于检测由语音识别网络输出的单词假设,收集第二批次的音频信号的声学特征帧,第二批次的声学特征帧的数目等于第二批次尺寸,该第二批次尺寸大于第一批次尺寸,并且将第二批次输入到语音识别网络。
-
公开(公告)号:CN114981887A
公开(公告)日:2022-08-30
申请号:CN202080093002.3
申请日:2020-12-15
Applicant: 微软技术许可有限责任公司
Abstract: 实施例可以包括收集第一批次的音频信号的声学特征帧,第一批次的声学特征帧的数目等于第一批次尺寸,将第一批次输入到语音识别网络,响应于检测由语音识别网络输出的单词假设,收集第二批次的音频信号的声学特征帧,第二批次的声学特征帧的数目等于第二批次尺寸,该第二批次尺寸大于第一批次尺寸,并且将第二批次输入到语音识别网络。
-
-