-
公开(公告)号:CN112075075B
公开(公告)日:2022-12-06
申请号:CN201980030272.7
申请日:2019-04-27
Applicant: 微软技术许可有限责任公司
Inventor: A·迪亚曼特 , K·马斯特本-多尔 , E·克鲁普卡 , R·哈雷 , Y·斯莫林 , I·古维奇 , A·赫维兹 , 秦莉娟 , 熊炜 , 张世雄 , 吴凌峰 , 肖雄 , I·莱希特尔 , M·大卫 , X·黃 , A·K·阿加瓦尔
IPC: H04N7/14
Abstract: 一种用于促进远程会议的方法包括:接收数字视频和计算机可读音频信号。面部识别机被操作为识别数字视频中的第一会议参与者的面部,语音识别机被操作为将计算机可读音频信号转换为第一文本。归属机将该文本归属于第一会议参与者。类似地,对第二计算机可读音频信号进行处理,以获得归属于第二会议参与者的第二文本。转录机自动地创建包含归属于第一会议参与者的第一文本和归属于第二会议参与者的第二文本的转录本。
-
公开(公告)号:CN112075075A
公开(公告)日:2020-12-11
申请号:CN201980030272.7
申请日:2019-04-27
Applicant: 微软技术许可有限责任公司
Inventor: A·迪亚曼特 , K·马斯特本-多尔 , E·克鲁普卡 , R·哈雷 , Y·斯莫林 , I·古维奇 , A·赫维兹 , 秦莉娟 , 熊炜 , 张世雄 , 吴凌峰 , 肖雄 , I·莱希特尔 , M·大卫 , X·黃 , A·K·阿加瓦尔
IPC: H04N7/14
Abstract: 一种用于促进远程会议的方法包括:接收数字视频和计算机可读音频信号。面部识别机被操作为识别数字视频中的第一会议参与者的面部,语音识别机被操作为将计算机可读音频信号转换为第一文本。归属机将该文本归属于第一会议参与者。类似地,对第二计算机可读音频信号进行处理,以获得归属于第二会议参与者的第二文本。转录机自动地创建包含归属于第一会议参与者的第一文本和归属于第二会议参与者的第二文本的转录本。
-
公开(公告)号:CN106922185A
公开(公告)日:2017-07-04
申请号:CN201580052576.5
申请日:2015-09-28
Applicant: 微软技术许可有限责任公司
CPC classification number: G06F3/011 , G06F1/163 , G06F3/014 , G06F3/017 , G06F3/0346 , H04M1/7253 , H04M2250/12 , G06F3/01
Abstract: “自然运动控制器”标识用户的身体的一个或多个部分的各种运动以与电子设备交互,由此实现各种自然用户接口(NUI)场景。自然运动控制器通过连结从多个分离的惯性传感器集接收到的惯性传感器数据的可调整数目的顺序时段来构建复合运动识别窗口。这些分离的惯性传感器集中的每个惯性传感器集被耦合到分离的用户穿戴、携带或者手持的移动计算设备,或者提供与分离的用户穿戴、携带或者手持的移动计算设备有关的传感器数据。每个复合运动识别窗口然后被传递到由一个或多个基于机器的深度学习过程训练的运动识别模型。该运动识别模型然后被应用到复合运动识别窗口以标识一个或多个预定义运动的序列。所标识的运动然后被用作触发一个或多个应用命令的执行的基础。
-
-