基于神经网络的语音处理

    公开(公告)号:CN107112006A

    公开(公告)日:2017-08-29

    申请号:CN201580053898.1

    申请日:2015-10-01

    Abstract: 获得表示语音的特征向量对。一些对表示来自相同说话者的两个语音样本,并且其他对表示来自不同说话者的两个语音样本。神经网络利用彼此关联的两个向量的输入上的权重矩阵,将样本对中的每个特征向量馈送到单独的瓶颈层中。该神经网络使用特征向量和目标函数被训练,该目标函数诱导网络对语音样本是否来自相同说话者进行分类。来自关联的权重矩阵的权重被提取以供在生成用于语音处理系统的导出特征中使用,该语音处理系统可以受益于特征,该特征因此被变换为更好地反映说话者身份。

    用于支持改进语音识别的对视觉内容的修改

    公开(公告)号:CN106463119A

    公开(公告)日:2017-02-22

    申请号:CN201580029986.8

    申请日:2015-06-03

    Abstract: 本文中描述的技术涉及修改用于在显示器上呈现的视觉内容以支持改进自动语音识别(ASR)系统的性能。视觉内容被修改以将元素移动为进一步远离彼此,其中被移动的元素引起来自ASR系统的角度的歧义。视觉内容被修改以考虑凝视跟踪的准确性。当用户查看所修改的视觉内容中的元素时,ASR系统根据正被用户查看的元素来被定制。

    基于神经网络的语音处理

    公开(公告)号:CN107112006B

    公开(公告)日:2020-10-23

    申请号:CN201580053898.1

    申请日:2015-10-01

    Abstract: 获得表示语音的特征向量对。一些对表示来自相同说话者的两个语音样本,并且其他对表示来自不同说话者的两个语音样本。神经网络利用彼此关联的两个向量的输入上的权重矩阵,将样本对中的每个特征向量馈送到单独的瓶颈层中。该神经网络使用特征向量和目标函数被训练,该目标函数诱导网络对语音样本是否来自相同说话者进行分类。来自关联的权重矩阵的权重被提取以供在生成用于语音处理系统的导出特征中使用,该语音处理系统可以受益于特征,该特征因此被变换为更好地反映说话者身份。

    用于支持改进语音识别的对视觉内容的修改

    公开(公告)号:CN106463119B

    公开(公告)日:2020-07-10

    申请号:CN201580029986.8

    申请日:2015-06-03

    Abstract: 本文中描述的技术涉及修改用于在显示器上呈现的视觉内容以支持改进自动语音识别(ASR)系统的性能。视觉内容被修改以将元素移动为进一步远离彼此,其中被移动的元素引起来自ASR系统的角度的歧义。视觉内容被修改以考虑凝视跟踪的准确性。当用户查看所修改的视觉内容中的元素时,ASR系统根据正被用户查看的元素来被定制。

Patent Agency Ranking