-
公开(公告)号:CN117813651A
公开(公告)日:2024-04-02
申请号:CN202180095035.6
申请日:2021-12-22
Applicant: 微软技术许可有限责任公司
Inventor: S·D·帕塔克 , H·A·海莉尔 , N·帕瑞哈 , P·贝赫雷 , S·常 , C·H·巴索格鲁 , S·W·谭 , E·沙尔马 , J·吴 , 刘阳 , 林恒慷 , A·K·阿加瓦尔
IPC: G10L15/04
Abstract: 提供了用于使用基于前瞻的声学语言特征的智能音频分段的系统和方法。例如,提供了用于获得音频、处理音频、标识音频内的潜在分段边界以及确定是否要在该潜在分段边界处生成分段中断的系统和方法。标识出现在潜在分段边界之后的一个或多个前瞻词,其中生成与该潜在分段边界和一个或多个前瞻词相关联的声学分段分数和语言分段分数。随后,系统基于声学和/或语言分段分数至少达到或超过分段分数阈值来避免在潜在分段边界处生成分段中断或者在潜在分段边界处生成分段中断。
-
公开(公告)号:CN116783649A
公开(公告)日:2023-09-19
申请号:CN202180092220.X
申请日:2021-11-15
Applicant: 微软技术许可有限责任公司
IPC: G10L15/06
Abstract: 提供了一种用于标识目标数据集的系统和方法,其被配置成促进包括在自动语音识别系统中的声学模型的准确度的改进。系统获得测试数据集,该测试数据集包括(i)具有自然语音话语的音频数据和(ii)该自然语音话语的转录。系统基于自然语音话语的转录来生成包括具有合成语音话语的音频数据的文本转语音数据集。系统将测试数据集和文本转语音数据集应用于声学模型以分别获得第一声学模型输出和第二声学模型输出。系统标识第一声学模型输出中的第一错误集和第二声学模型输出中的第二错误集。最终,声学模型错误率基于比较第一错误集和第二错误集被生成。
-
公开(公告)号:CN106933320A
公开(公告)日:2017-07-07
申请号:CN201511027609.9
申请日:2015-12-30
Applicant: 微软技术许可有限责任公司
CPC classification number: G09G3/3208 , G06F1/3212 , G09G3/32 , G09G3/36 , G09G2330/021 , G09G2330/026 , G09G2354/00 , G09G2360/18 , Y02D10/174 , G06F1/26 , G06F3/14
Abstract: 在本文所描述的主题的实现中,提供了一种设备。该设备包括电源和显示器。该设备还包括与显示器通信的缓冲器。该缓冲器被配置为存储要被显示在显示器上的信息。该设备进一步包括电源管理单元。在该设备的断电模式中,其中电源的剩余电量低于阈值,电源管理单元对显示器和缓冲器供电,从而使得显示器能够显示存储在缓冲器中的信息。通过这种方式,即使该设备由于电源的低电量而处于断电模式,显示器仍然能够为用户呈现有用信息。
-
-