-
公开(公告)号:CN108028043B
公开(公告)日:2021-11-19
申请号:CN201680056137.6
申请日:2016-09-17
Applicant: 微软技术许可有限责任公司
Inventor: D·Z·哈卡尼-图尔 , 何晓冬 , 陈缊侬
Abstract: 本文描述了用于检测语音中的可行动项的计算机实现的技术。在一种操作方式中,该技术需要:接收话语信息,该话语信息表达由对话的一个参与者向对话的至少一个其他参与者说出的至少一个话语;将话语信息转换为识别的语音信息;使用机器训练的模型来识别与识别的语音信息相关联的至少一个可行动项;以及执行与一个或多个可行动项相关联的至少一个计算机实现的动作。机器训练的模型可以对应于深度结构的卷积神经网络。在一些实现方式中,该技术使用源环境语料库来产生机器训练的模型,该源环境语料库并非最佳地适用该模型旨在被应用于其中的目标环境。该技术进一步提供了用于适配源‑环境模型以使得其更适合目标环境的各种适配技术。
-
公开(公告)号:CN108028043A
公开(公告)日:2018-05-11
申请号:CN201680056137.6
申请日:2016-09-17
Applicant: 微软技术许可有限责任公司
Inventor: D·Z·哈卡尼-图尔 , 何晓冬 , 陈缊侬
CPC classification number: G10L15/16 , G06F17/2785 , G06F17/279 , G06N99/005 , G06Q10/10 , G10L15/20 , G10L15/22 , G10L15/26
Abstract: 本文描述了用于检测语音中的可行动项的计算机实现的技术。在一种操作方式中,该技术需要:接收话语信息,该话语信息表达由对话的一个参与者向对话的至少一个其他参与者说出的至少一个话语;将话语信息转换为识别的语音信息;使用机器训练的模型来识别与识别的语音信息相关联的至少一个可行动项;以及执行与一个或多个可行动项相关联的至少一个计算机实现的动作。机器训练的模型可以对应于深度结构的卷积神经网络。在一些实现方式中,该技术使用源环境语料库来产生机器训练的模型,该源环境语料库并非最佳地适用该模型旨在被应用于其中的目标环境。该技术进一步提供了用于适配源‑环境模型以使得其更适合目标环境的各种适配技术。
-