-
公开(公告)号:CN111785263A
公开(公告)日:2020-10-16
申请号:CN202010566109.7
申请日:2015-03-17
Applicant: 微软技术许可有限责任公司
IPC: G10L15/14 , G10L15/06 , G10L15/32 , G10L19/005
Abstract: 一种增量语言识别系统。该增量语言识别系统仅当额外的言语译码器很可能对组合结果增加显著益处时才使用额外的言语译码器对所讲言语进行增量地译码。基于精度、性能、多样性和其它因素对可用的言语译码器按系列进行定序。识别管理引擎协调言语译码器系列对所讲言语的译码,组合译码后言语,以及判定额外的处理是否可能显著地改善识别结果,如果是,则识别管理引擎接合下一言语译码器且循环继续。如果精度不能得到显著改善,则结果被接受,译码停止。因此,精度接近该系列的最大值的译码后言语被获得,而不使用系列中的全部言语译码器对所讲言语进行译码,从而最小化资源使用。
-
公开(公告)号:CN106133826B
公开(公告)日:2019-12-17
申请号:CN201580016605.2
申请日:2015-03-23
Applicant: 微软技术许可有限责任公司
IPC: G10L15/183 , G10L15/30 , G06F17/27
Abstract: 提供了对用于语音识别的语言模型组件的自定义。可以使得语言模式组件的列表可以由计算设备使用。接着,将用于对来自列表的多个语言模型组件进行组合的提示发送至识别服务提供者。该提示可以基于多个不同的领域。接着,可以从识别服务提供者处接收基于该提示的语言模型组件的自定义的组合。
-
公开(公告)号:CN106462608A
公开(公告)日:2017-02-22
申请号:CN201580025456.6
申请日:2015-05-15
Applicant: 微软技术许可有限责任公司
Inventor: M·阿克巴恰克 , D·Z·哈卡尼-图尔 , G·图尔 , L·P·赫克 , B·杜莫林
Abstract: 提供了通过针对特定用户或用户群体特点将语言模型所使用的知识源个性化来改进用于话音识别的语言模型的系统和方法。通过将来自用户的使用历史如查询记录的实体或用户动作映射到知识源,对特定用户个性化诸如知识图的知识源。个性化知识源可用于通过利用对应于出现在使用历史中的实体或实体对的查询训练语言模型来构建个人语言模型。在一些实施例中,用于特定用户的个性化知识源可以基于类似用户的个性化知识源来进行扩展。
-
公开(公告)号:CN105556516A
公开(公告)日:2016-05-04
申请号:CN201480044555.4
申请日:2014-08-06
Applicant: 微软技术许可有限责任公司
IPC: G06F17/30
CPC classification number: G06F17/30038 , G06F17/3002 , G06F17/30997
Abstract: 提供了用于保持用户加标签地内容的一种或多种技术和/或系统。例如,用户可以体验用户期望保存和/或组织以便之后检索的内容(例如,观看电影场景,创建照片,创建社交网络帖子,阅读电子邮件等)。因此,可以从用户处接收到针对内容的个性化标签(例如,“巴黎度假照片”)。该内容可以在个性化索引内利用个性化标签来索引(例如,能够由与用户相关联的任意设备访问的针对用户的基于云的索引)。通过这种方式,用户可以在稍后的时间点从任意设备检索该内容。例如,可以从用户接收搜索查询“巴黎照片”。可以利用搜索查询来查询个性化索引以识别可以提供给用户的内容。
-
公开(公告)号:CN111785263B
公开(公告)日:2024-09-03
申请号:CN202010566109.7
申请日:2015-03-17
Applicant: 微软技术许可有限责任公司
IPC: G10L15/14 , G10L15/06 , G10L15/32 , G10L19/005
Abstract: 一种增量语言识别系统。该增量语言识别系统仅当额外的言语译码器很可能对组合结果增加显著益处时才使用额外的言语译码器对所讲言语进行增量地译码。基于精度、性能、多样性和其它因素对可用的言语译码器按系列进行定序。识别管理引擎协调言语译码器系列对所讲言语的译码,组合译码后言语,以及判定额外的处理是否可能显著地改善识别结果,如果是,则识别管理引擎接合下一言语译码器且循环继续。如果精度不能得到显著改善,则结果被接受,译码停止。因此,精度接近该系列的最大值的译码后言语被获得,而不使用系列中的全部言语译码器对所讲言语进行译码,从而最小化资源使用。
-
公开(公告)号:CN106165010B
公开(公告)日:2020-07-24
申请号:CN201580014680.5
申请日:2015-03-17
Applicant: 微软技术许可有限责任公司
IPC: G10L15/32
Abstract: 一种增量语言识别系统。该增量语言识别系统仅当额外的言语译码器很可能对组合结果增加显著益处时才使用额外的言语译码器对所讲言语进行增量地译码。基于精度、性能、多样性和其它因素对可用的言语译码器按系列进行定序。识别管理引擎协调言语译码器系列对所讲言语的译码,组合译码后言语,以及判定额外的处理是否可能显著地改善识别结果,如果是,则识别管理引擎接合下一言语译码器且循环继续。如果精度不能得到显著改善,则结果被接受,译码停止。因此,精度接近该系列的最大值的译码后言语被获得,而不使用系列中的全部言语译码器对所讲言语进行译码,从而最小化资源使用。
-
公开(公告)号:CN106462608B
公开(公告)日:2019-11-12
申请号:CN201580025456.6
申请日:2015-05-15
Applicant: 微软技术许可有限责任公司
Inventor: M·阿克巴恰克 , D·Z·哈卡尼-图尔 , G·图尔 , L·P·赫克 , B·杜莫林
IPC: G06F16/635 , G06F16/332 , G06F16/36 , G10L15/18
Abstract: 提供了通过针对特定用户或用户群体特点将语言模型所使用的知识源个性化来改进用于话音识别的语言模型的系统和方法。通过将来自用户的使用历史如查询记录的实体或用户动作映射到知识源,对特定用户个性化诸如知识图的知识源。个性化知识源可用于通过利用对应于出现在使用历史中的实体或实体对的查询训练语言模型来构建个人语言模型。在一些实施例中,用于特定用户的个性化知识源可以基于类似用户的个性化知识源来进行扩展。
-
公开(公告)号:CN106165010A
公开(公告)日:2016-11-23
申请号:CN201580014680.5
申请日:2015-03-17
Applicant: 微软技术许可有限责任公司
IPC: G10L15/32
Abstract: 一种增量语言识别系统。该增量语言识别系统仅当额外的言语译码器很可能对组合结果增加显著益处时才使用额外的言语译码器对所讲言语进行增量地译码。基于精度、性能、多样性和其它因素对可用的言语译码器按系列进行定序。识别管理引擎协调言语译码器系列对所讲言语的译码,组合译码后言语,以及判定额外的处理是否可能显著地改善识别结果,如果是,则识别管理引擎接合下一言语译码器且循环继续。如果精度不能得到显著改善,则结果被接受,译码停止。因此,精度接近该系列的最大值的译码后言语被获得,而不使用系列中的全部言语译码器对所讲言语进行译码,从而最小化资源使用。
-
公开(公告)号:CN106133826A
公开(公告)日:2016-11-16
申请号:CN201580016605.2
申请日:2015-03-23
Applicant: 微软技术许可有限责任公司
IPC: G10L15/183 , G10L15/30 , G06F17/27
Abstract: 提供了对用于语音识别的语言模型组件的自定义。可以使得语言模式组件的列表可以由计算设备使用。接着,将用于对来自列表的多个语言模型组件进行组合的提示发送至识别服务提供者。该提示可以基于多个不同的领域。接着,可以从识别服务提供者处接收基于该提示的语言模型组件的自定义的组合。
-
-
-
-
-
-
-
-