基于音频的人机混合交互系统及方法

    公开(公告)号:CN106409283B

    公开(公告)日:2020-01-10

    申请号:CN201610791966.0

    申请日:2016-08-31

    Abstract: 本发明公开了一种基于音频的人机混合交互系统,语音识别模块与语义识别模块相连并传输语音对应的文字信息,异常处理模块与语音识别模块和语义识别模块相连,语音识别模块传输文字信息给异常处理模块,语义识别模块传输语义解析结果给异常处理模块;异常处理模块与语音合成模块相连并传输干预信息。本发明还公开了一种基于音频的人机混合交互方法,语音识别模块将语音信息转换为文字信息并输出至语义识别单元;语义识别单元从文字信息中提取用户目的以及相应的关键信息;异常处理模块根据语音识别模块的文字信息以及语义识别模块的语义信息判断人机对话当前是否出现异常并针对异常处理消息的回复。本发明的技术方案提供统一的人机对话体验。

    语言模型压缩方法和系统
    2.
    发明公开

    公开(公告)号:CN108874754A

    公开(公告)日:2018-11-23

    申请号:CN201810539084.4

    申请日:2018-05-30

    Abstract: 本发明公开语言模型压缩方法和系统,方法包括:响应于获取的输入参数,查找与所述输入参数对应的二值化向量;至少将所述二值化向量经过二值化的循环网络层,以得到二值化的循环网络层输出;至少将所述循环网络层输出经过二值化的线性层并输出结果。通过使用二值化向量来编码词嵌入以及LSTM的参数,从而达到较高的内存压缩率。开创性地探索了二值化LSTM在大词表语言模型中的应用。进一步地,通过实验表明,本申请提出的模型在中文和英文数据集上达到了11.3的无损压缩比,在损失小部分性能的情况下,可以达到31.6的压缩比。

    用于神经网络语言模型的压缩方法和系统

    公开(公告)号:CN108415888A

    公开(公告)日:2018-08-17

    申请号:CN201810145363.2

    申请日:2018-02-12

    Inventor: 俞凯 石开宇

    Abstract: 本发明公开用于神经网络语言模型的压缩方法和系统,方法包括:将训练数据输入神经网络语言模型进行预训练;对输入和/或输出所述语言模型的词向量矩阵分别进行基分解和聚类量化操作,以对所述词向量矩阵进行压缩;再次将所述训练数据输入经过所述词向量矩阵压缩后的神经网络语言模型,以对所述语言模型进行微调。本发明提出了一种新颖有效的基于乘积量化的结构化单词嵌入框架,用以对输入/输出词向量矩阵进行压缩,在不损害NN LM性能的情况下,可以获得显著的内存减少率。

    基于音频的人机混合交互系统及方法

    公开(公告)号:CN106409283A

    公开(公告)日:2017-02-15

    申请号:CN201610791966.0

    申请日:2016-08-31

    Abstract: 本发明公开了一种基于音频的人机混合交互系统,语音识别模块与语义识别模块相连并传输语音对应的文字信息,异常处理模块与语音识别模块和语义识别模块相连,语音识别模块传输文字信息给异常处理模块,语义识别模块传输语义解析结果给异常处理模块;异常处理模块与语音合成模块相连并传输干预信息。本发明还公开了一种基于音频的人机混合交互方法,语音识别模块将语音信息转换为文字信息并输出至语义识别单元;语义识别单元从文字信息中提取用户目的以及相应的关键信息;异常处理模块根据语音识别模块的文字信息以及语义识别模块的语义信息判断人机对话当前是否出现异常并针对异常处理消息的回复。本发明的技术方案提供统一的人机对话体验。

Patent Agency Ranking