-
公开(公告)号:CN106233384A
公开(公告)日:2016-12-14
申请号:CN201580020195.9
申请日:2015-04-07
Applicant: 微软技术许可有限责任公司
IPC: G10L25/78
Abstract: 公开了涉及检测在计算设备上呈现内容期间的对话,并且响应于检测到所述对话采取一个或多个动作的各实施例。在一个示例中,音频数据流被从一个或多个传感器接收,基于该音频数据流检测第一用户和第二用户之间的对话,以及响应于检测到该对话通过该计算设备修改数字内容项的呈现。
-
公开(公告)号:CN105324811B
公开(公告)日:2021-06-11
申请号:CN201480026549.6
申请日:2014-05-09
Applicant: 微软技术许可有限责任公司
Abstract: 公开了涉及将来自环境的音频输入转换成文本的各实施例。例如,在一个公开的实施例中,语音转换程序接收来自头戴式显示设备的话筒阵列的音频输入。从环境中捕捉图像数据,并且从图像数据中检测一个或多个可能的脸。眼睛跟踪数据被用于确定用户聚焦于的目标脸。波束成形技术被应用于音频输入的至少一部分以标识与目标脸相关联的目标音频输入。这些目标音频输入被转换成通过头戴式显示设备的透明显示器来显示的文本。
-
公开(公告)号:CN106233384B
公开(公告)日:2019-11-26
申请号:CN201580020195.9
申请日:2015-04-07
Applicant: 微软技术许可有限责任公司
IPC: G10L25/78
Abstract: 公开了涉及检测在计算设备上呈现内容期间的对话,并且响应于检测到所述对话采取一个或多个动作的各实施例。在一个示例中,音频数据流被从一个或多个传感器接收,基于该音频数据流检测第一用户和第二用户之间的对话,以及响应于检测到该对话通过该计算设备修改数字内容项的呈现。
-
公开(公告)号:CN105324811A
公开(公告)日:2016-02-10
申请号:CN201480026549.6
申请日:2014-05-09
Applicant: 微软技术许可有限责任公司
Abstract: 公开了涉及将来自环境的音频输入转换成文本的各实施例。例如,在一个公开的实施例中,语音转换程序接收来自头戴式显示设备的话筒阵列的音频输入。从环境中捕捉图像数据,并且从图像数据中检测一个或多个可能的脸。眼睛跟踪数据被用于确定用户聚焦于的目标脸。波束成形技术被应用于音频输入的至少一部分以标识与目标脸相关联的目标音频输入。这些目标音频输入被转换成通过头戴式显示设备的透明显示器来显示的文本。
-
-
-