专利检索 ap:("微软技术许可有限责任公司") AND inv:"J·李" 第 1 页

1.

发明公开
生成和使用用于关键词检出系统的文本到语音数据和语音识别系统中的说话者适配有权

公开(公告)号：CN113470662A

公开(公告)日：2021-10-01

申请号：CN202010244661.4

申请日：2020-03-31

申请人： 微软技术许可有限责任公司

发明人： 叶国力 , Y·黄 , 魏文宁 , 何磊 , E·沙玛 , J·吴 , 田垚 , E·C·林 , Y·龚 , 赵蕤 , J·李 , W·M·盖尔

IPC分类号： G10L17/24 , G10L17/04 , G10L13/08 , G10L25/30

摘要： 提供了用于生成和使用文本到语音(TTS)数据以供改进的语音识别模型的系统、方法和设备。利用关键词无关的基线训练数据来训练主模型。在一些实例中，利用新的TTS训练数据来修改主模型的声学和语言模型子组件。在一些实例中，新的TTS训练是从用于在基线训练数据中代表不足的关键词的多说话者神经TTS系统获得的。在一些实例中，新的TTS训练数据被用于关键词检出(KWS)应用中的发音学习和关键词相关置信评分的归一化。在一些实例中，新的TTS训练数据被用于语音识别模型中的快速说话者适配。

2.

发明授权
用于稳健语音识别的变量组件深度神经网络有权

公开(公告)号：CN105960672B

公开(公告)日：2019-11-26

申请号：CN201480075008.2

申请日：2014-09-09

申请人： 微软技术许可有限责任公司

发明人： J·李 , R·赵 , Y·宫

IPC分类号： G10L15/16 , G10L15/20

摘要： 提供了用于结合环境变量的语音识别的系统和方法。该系统包括：语音捕捉设备(202)；特征提取模块(204)；环境变量模块(206)，其中所述环境变量模块确定环境变量的值；以及语音识别解码器(208)，其中所述语音识别译码器利用深度神经网络(DNN)来识别由所述语音捕捉装置捕捉的语音，其中所述DNN的一个或多个组件被建模为环境变量的一组函数。

3.

发明授权
注视滑扫选择有权

公开(公告)号：CN106415444B

公开(公告)日：2019-10-01

申请号：CN201580005721.4

申请日：2015-01-16

申请人： 微软技术许可有限责任公司

发明人： J·斯科特 , A·C·汤姆林 , M·托马斯 , M·卡普兰 , C·G·布朗 , J·普鲁姆 , N·G·法杰特 , D·J·麦克洛克 , J·李

IPC分类号： G06F3/01 , G06F3/0484

摘要： 描述了用于实现对虚拟对象的免动手选择的方法。在一些实施例中，注视滑扫姿势可以被用于选择虚拟对象。注视滑扫姿势可涉及头戴式显示设备(HMD)的终端用户执行由HMD跟踪的头部移动以检测终端用户控制的虚拟指针是否已经滑扫跨过虚拟对象的两条或更多条边。在一些情形中，注视滑扫姿势可包括在终端用户注视虚拟对象的同时终端用户使用他们的头部移动来将虚拟指针移动通过虚拟对象的两条边。响应于检测到注视滑扫姿势，HMD可基于注视滑扫姿势的速度和虚拟对象的大小来确定要被显示在HMD上的第二虚拟对象。

4.

发明公开
从时间线创建日历事件无效

公开(公告)号：CN106796684A

公开(公告)日：2017-05-31

申请号：CN201580033344.5

申请日：2015-06-19

申请人： 微软技术许可有限责任公司

发明人： N·乔希 , J·博纳 , J·李 , M·鲁梅尔 , J·霍金斯 , M·希利

IPC分类号： G06Q10/10

CPC分类号： G06F3/0482 , G06F3/04842 , G06F3/04847 , G06F3/0485 , G06F3/04855 , G06F3/0486 , G06F3/04883 , G06F17/30867 , G06F17/30964 , G06Q10/109 , G06Q10/1093 , H04L12/1813 , H04L51/08 , H04L67/02

摘要： 提供了从时间线创建日历事件。诸如日历应用之类的应用可以检测用于在时间线上创建事件的创建动作。对包括事件的主题名称以及事件日期的事件的细节进行捕获。基于所述细节来在时间线上显示事件。检测用于保存事件的保存动作。基于所述细节而在与时间线相关联的日历上显示事件。

5.

发明公开
为选定上下文构造词典有权

公开(公告)号：CN106462579A

公开(公告)日：2017-02-22

申请号：CN201480077830.2

申请日：2014-10-15

申请人： 微软技术许可有限责任公司

发明人： D·常 , J·李 , Z·刘 , C·C·B·麦克

IPC分类号： G06F17/30

摘要： 本文提出了与构造针对限定上下文的词典有关的各种技术。社交媒体文本被获取，其中所述社交媒体文本具有与其对应的上下文数据。社交媒体文本被编码以形成编码文本(Unicode格式)，并且上下文数据被指派给该编码文本。通过基于诸如位置之类的上下文数据对编码文本进行过滤来形成针对限定上下文的文本语料库。单词或短语在文本语料库中出现的频率被用于标识要被包括在词典中的单词或短语。

6.

发明公开
姿势参数调节有权

公开(公告)号：CN106104423A

公开(公告)日：2016-11-09

申请号：CN201580013497.3

申请日：2015-03-09

申请人： 微软技术许可有限责任公司

发明人： M·斯卡维泽 , A·G·鲍罗斯 , J·比维斯 , J·李 , D·J·麦克洛克 , N·G·法杰特

IPC分类号： G06F3/01

CPC分类号： G06F3/0346 , G06F3/012 , G06F3/017

摘要： 本文公开了涉及调节配置成接收基于姿势的用户输入的设备的姿势识别特性的各实施例。例如，一个所公开的实施例提供了一种头戴式显示设备，包括：多个传感器；配置成呈现用户界面的显示器；逻辑机；以及存储机，所述存储机保持能由所述逻辑机执行以进行以下的指令：基于从所述多个传感器中的第一传感器接收到的信息来检测姿势，响应于检测到所述姿势来执行动作，以及确定所述姿势是否匹配有意姿势输入。该指令进一步能执行以在确定检测到的姿势不匹配该有意姿势输入的情况下更新定义该有意姿势输入的姿势参数。

7.

发明公开
用于稳健语音识别的变量组件深度神经网络有权

公开(公告)号：CN105960672A

公开(公告)日：2016-09-21

申请号：CN201480075008.2

申请日：2014-09-09

申请人： 微软技术许可有限责任公司

发明人： J·李 , R·赵 , Y·宫

IPC分类号： G10L15/16 , G10L15/20

CPC分类号： G10L15/20 , G10L15/16 , G10L19/24 , G10L25/84

摘要： 提供了用于结合环境变量的语音识别的系统和方法。该系统包括：语音捕捉设备(202)；特征提取模块(204)；环境变量模块(206)，其中所述环境变量模块确定环境变量的值；以及语音识别解码器(208)，其中所述语音识别译码器利用深度神经网络(DNN)来识别由所述语音捕捉装置捕捉的语音，其中所述DNN的一个或多个组件被建模为环境变量的一组函数。

8.

发明公开
自动内容滚动有权

公开(公告)号：CN105934730A

公开(公告)日：2016-09-07

申请号：CN201580005760.4

申请日：2015-01-16

申请人： 微软技术许可有限责任公司

发明人： M·J·斯卡维泽 , A·G·鲍罗斯 , J·R·比维斯 , N·G·法杰特 , C·G·布朗 , D·J·麦克洛克 , J·李

IPC分类号： G06F3/01 , G06F3/0485 , H04M1/725

CPC分类号： G06T7/20 , G02B27/0172 , G02B2027/0178 , G06F3/012 , G06F3/013 , G06F3/0485 , G06F2203/04804 , G06T11/60 , G09G5/10 , G09G5/34 , H04M1/72569

摘要： 描述了用于当内容由头戴式显示设备(HMD)的最终用户查看时控制所述内容的显示的方法。在一些实施例中，HMD可以使用用于阅读内容的虚拟内容阅读器来显示内容。所述内容可以包括文本和/或图像，例如与电子书、电子杂志、文字处理文档、网页或电子邮件相关联的文本或图像。虚拟内容阅读器可以基于最终用户阅读在虚拟内容阅读器上所显示的内容的一部分的速率来提供自动内容滚动。在一个实施例中，HMD可以将显示在虚拟内容阅读器上的内容的自动滚动与用户控制的滚动(例如通过HMD的最终用户的头部跟踪)相组合。

9.

发明授权
为选定上下文构造词典有权

公开(公告)号：CN106462579B

公开(公告)日：2019-09-27

申请号：CN201480077830.2

申请日：2014-10-15

申请人： 微软技术许可有限责任公司

发明人： D·常 , J·李 , Z·刘 , C·C·B·麦克

IPC分类号： G06F17/22 , G06F17/27

摘要： 本文提出了与构造针对限定上下文的词典有关的各种技术。社交媒体文本被获取，其中所述社交媒体文本具有与其对应的上下文数据。社交媒体文本被编码以形成编码文本(Unicode格式)，并且上下文数据被指派给该编码文本。通过基于诸如位置之类的上下文数据对编码文本进行过滤来形成针对限定上下文的文本语料库。单词或短语在文本语料库中出现的频率被用于标识要被包括在词典中的单词或短语。

10.

发明授权
自动内容滚动有权

公开(公告)号：CN105934730B

公开(公告)日：2019-05-10

申请号：CN201580005760.4

申请日：2015-01-16

申请人： 微软技术许可有限责任公司

发明人： M·J·斯卡维泽 , A·G·鲍罗斯 , J·R·比维斯 , N·G·法杰特 , C·G·布朗 , D·J·麦克洛克 , J·李

IPC分类号： G06F3/01 , G06F3/0485 , H04M1/725

摘要： 描述了用于当内容由头戴式显示设备(HMD)的最终用户查看时控制所述内容的显示的方法。在一些实施例中，HMD可以使用用于阅读内容的虚拟内容阅读器来显示内容。所述内容可以包括文本和/或图像，例如与电子书、电子杂志、文字处理文档、网页或电子邮件相关联的文本或图像。虚拟内容阅读器可以基于最终用户阅读在虚拟内容阅读器上所显示的内容的一部分的速率来提供自动内容滚动。在一个实施例中，HMD可以将显示在虚拟内容阅读器上的内容的自动滚动与用户控制的滚动(例如通过HMD的最终用户的头部跟踪)相组合。

搜索结果

国家/区域

专利有效性

申请日

公布(公告)日

申请人

申请人所在国/区域

发明人

IPC

IPC部

IPC大类

IPC小类

IPC大组

IPC小组

外观分类