SPATIALLY INFORMED AUDIO SIGNAL PROCESSING FOR USER SPEECH

发明申请

US20210074316A1 SPATIALLY INFORMED AUDIO SIGNAL PROCESSING FOR USER SPEECH 有权

请登陆查看更多内容

专利标题： SPATIALLY INFORMED AUDIO SIGNAL PROCESSING FOR USER SPEECH
申请号： US16708296

申请日： 2019-12-09
公开(公告)号： US20210074316A1

公开(公告)日： 2021-03-11
发明人: Mehrez SOUDEN , Ante JUKIC , Jason WUNG , Ashrith DESHPANDE , Joshua D. ATKINS
申请人： Apple Inc.
申请人地址： US CA Cupertino
专利权人： Apple Inc.
当前专利权人： Apple Inc.
当前专利权人地址： US CA Cupertino
主分类号： G10L25/81
IPC分类号： G10L25/81 ; G10L25/18 ; G10L21/0232 ; G06K9/00 ; G10L15/25 ; G10L15/22 ; G06N7/00 ; G06N20/00

SPATIALLY INFORMED AUDIO SIGNAL PROCESSING FOR USER SPEECH

摘要：

A device implementing a system for processing speech in an audio signal includes at least one processor configured to receive an audio signal corresponding to at least one microphone of a device, and to determine, using a first model, a first probability that a speech source is present in the audio signal. The at least one processor is further configured to determine, using a second model, a second probability that an estimated location of a source of the audio signal corresponds to an expected position of a user of the device, and to determine a likelihood that the audio signal corresponds to the user of the device based on the first and second probabilities.

公开/授权文献

US11514928B2 Spatially informed audio signal processing for user speech 公开/授权日：2022-11-29

信息查询

Global Dossier Espacenet

IPC分类:

G	物理
G10	乐器；声学
G10L	语音分析或合成；语音识别；语音或声音处理；语音或音频编码或解码
G10L25/00	不限于组G10L 15/00-G10L 21/00的语言或者声音分析技术(当利用语音检测器来感知一些信号特殊特征的基于半导体的静噪放大器，如无信号时的感知入H03G3/34)
G10L25/78	.语音信号存在或不存在的检测（在双向扩音电话系统中通过语音频率切换传输的方向入H04M9/10）
G10L25/81	..从音乐中判别声音