在线对话状态跟踪模型的优化方法及系统

    公开(公告)号:CN108962221A

    公开(公告)日:2018-12-07

    申请号:CN201810763146.X

    申请日:2018-07-12

    Inventor: 俞凯 陈志

    Abstract: 本发明实施例提供一种在线对话状态跟踪模型的优化方法。该方法包括:预训练辅助对话状态跟踪模型以确定教师模型;提取用户输入语句的语义特征,根据教师模型确定第一置信状态,根据在线对话状态跟踪模型确定第二置信状态;确定搜索空间的差距,进而确定基准分数;根据在线置信状态确定用户输入语句的反馈对话的语音时长确定代价分数;基于语义特征连同基准分数、代价分数,通过强化学习算法优化在线对话状态跟踪模型的搜索空间以及反馈对话的语音时长。本发明实施例还提供一种在线对话状态跟踪模型的优化系统。本发明实施例通过增加教师模型,通过所述教师模型减小在线对话状态跟踪模型的搜索空间,从而提高了在线对话状态跟踪模块的对话策略。

    对话状态跟踪器的训练方法及系统

    公开(公告)号:CN108847220A

    公开(公告)日:2018-11-20

    申请号:CN201810538670.7

    申请日:2018-05-30

    Inventor: 俞凯 谢凯歌

    Abstract: 本发明实施例提供一种对话状态跟踪器的训练方法。该方法包括:通过已标注对话集(L)预训练对话状态跟踪器,以确定未标注对话集(U)中各未标注对话的预测概率和对话轮数;来确定各未标注对话的时间代价参数和/或稳定性参数和/或多元化参数;根据所述参数,确定对应各未标注对话的优先权;按照优先权从未标注对话集(U)中选取部分的未标注对话进行标注,添加至已标注对话集(L);通过添加后的已标注对话集(L)训练对话状态跟踪器。本发明实施例还提供一种对话状态跟踪器的训练系统。本发明实施例的对话状态跟踪器的训练方法根据考虑不同的未标注对话具有不同的时间代价,增加了待标注对话的选择方式而提升对话状态跟踪器的训练效果。

    一种词嵌入语言模型训练方法、词语识别方法及系统

    公开(公告)号:CN108417210A

    公开(公告)日:2018-08-17

    申请号:CN201810022130.3

    申请日:2018-01-10

    Inventor: 俞凯 陈瑞年

    Abstract: 本发明公开一种词嵌入语言模型训练方法,包括:确定语料库中的所有词语的属性以生成词表,所述属性包括所有词语的词性分类、所有词性分类的概率分布和所有词语在所属词性分类下的概率分布;生成所述词表中所有词语的词向量;生成对应于所述词表中所有词语的词性分类的词性分类向量;以所述词表中的词语的词向量和所述词表中的词语的词性分类向量为输入,以所述词表中的词语所属的词性分类的概率分布和所述词表中的词语在所属词性分类下的概率分布为输出进行训练,以得到所述词嵌入语言模型。本发明实施例中在进行语言模型,即便是遇到OOV词语,也能通过该OOV词语的形态学信息和所述词性分类的句法级信息来进行准确的识别。

    音频数据识别方法及系统

    公开(公告)号:CN108389575A

    公开(公告)日:2018-08-10

    申请号:CN201810025834.6

    申请日:2018-01-11

    Abstract: 本发明实施例提供一种音频数据识别方法。该方法包括:将待识别的音频数据按照时间戳的先后顺序划分成多个音频数据片段;基于待识别的音频数据的声学特征,确定每个音频数据片段中各帧音频数据帧的预测概率集合;根据各帧音频数据帧的预测概率集合,确定各帧音频数据帧的类型;通过非空白音频数据帧相邻的上一音频数据帧和下一音频数据帧来确定非空白音频数据帧的最终预测概率集合;基于每个音频数据片段中的各非空白音频数据帧的最终预测概率集合,对各个音频数据片段进行音素同步解码,识别音频数据。本发明实施例还提供一种音频数据识别系统。本发明实施例的音频数据识别方法可用于任意声学模型,并且进一步提升了识别速度。

    基于单向自标注辅助信息的多视角语言识别方法

    公开(公告)号:CN107452374A

    公开(公告)日:2017-12-08

    申请号:CN201710561261.4

    申请日:2017-07-11

    Abstract: 一种基于单向自标注辅助信息的多视角语言识别方法,首先通过标注模型对当前词和词层面的辅助信息进行自标注,得到当前词的自标注辅助特征的概率分布;然后将自标注辅助特征的概率分布通过Viterbi解码得到相对准确的辅助特征,从而将双向辅助信息转换为单向辅助信息;再将单向辅助信息和当前词一起输入多视角语言模型进行解析,得到当前词的准确语义。本发明通过将多视角神经网络中的词层面的辅助特征,从而消除后文信息造成的负面影响,采用多种不同的词层面的辅助信息,引入具有树形结构的词层面辅助特征进行多视角语言模型训练,并且在标注模型和语言模块分别使用稳定算子来调整不同的适应各自的学习率等特点。

    对话策略优化的冷启动系统和方法

    公开(公告)号:CN107342078A

    公开(公告)日:2017-11-10

    申请号:CN201710483731.X

    申请日:2017-06-23

    Abstract: 一种对话策略优化的冷启动系统和方法,包括:用户输入模块、对话状态跟踪模块、教师决策模块、学生决策模块、从教师决策模块和学生决策模块产生的回复动作中随机选择一个最终的回复动作的动作选择模块、将最终的回复动作转换成更自然的表达并展现给用户的输出模块、将对话经验(transition)存储到经验池中并采样固定数量的经验,根据深度Q网络(DQN)算法进行网络参数更新的策略训练模块以及在对话的每一个轮回计算对话的奖励回报(Reward)并输出至策略训练模块的奖励函数模块。本发明能够显著提高对话策略在强化学习在线训练初期的性能;提高对话策略的学习速度,即减少其达到一定性能所用的对话数量。

    通过互联网进行云端信息服务的电话系统

    公开(公告)号:CN104618612B

    公开(公告)日:2017-07-18

    申请号:CN201510064921.9

    申请日:2015-02-09

    Inventor: 俞凯 郑达 周伟达

    Abstract: 一种通过互联网进行云端信息服务的电话系统,包括:云端服务器、由主控模块、互联网连接模块、语音电话板卡和语音输入输出模块组成的用户端,其中:主控模块分别与互联网连接模块、语音电话版卡和语音输入输出模块相连,互联网连接模块与主控模块相连,语音电话板卡和主控模块相连,语音输入输出模块和主控模块相连,云端服务器通过互联网与一个或多个用户端的互联网连接模块相连,接收连接请求并向主控模块回传网络数据,语音电话板卡与有线电话网络相连,进行电话网络的调制解调以使得所述系统用户端接入有线电话网络。本发明保留电话使用语音的优势,结合智能语音技术的发展,在电话的基础上加入了在云端将非语音信息处理成语音信息的功能和对用户语音请求的分析功能。

    基于对话交互的用户画像的构建方法及系统

    公开(公告)号:CN106446045A

    公开(公告)日:2017-02-22

    申请号:CN201610792303.0

    申请日:2016-08-31

    Abstract: 一种基于对话交互的用户画像的构建方法及系统,通过语义解析器对用户的输入进行实时解析,并根据解析到的用户语义对各个属性的权重的加权分布进行更新,从而生成准确细致的画像;系统包括:语音识别模块、语音合成模块、语义解析模块、对话管理模块、自然语言生成模块以及用户画像生成模块,语音识别模块与语义解析模块相连并传输文本信息,语义解析模块与用户画像生成模块相连并传输语义和相关时间戳信息,同时语义解析模块与对话管理模块相连传输语义信息,对话管理模块与自然语言生成模块相连并传输对话动作信息,自然语言生成模块与语音合成模块相连并传输文本信息。本发明通过此方法建立精确用户画像,从而统一人机交互的流程和体验。

    基于音频的人机混合交互系统及方法

    公开(公告)号:CN106409283A

    公开(公告)日:2017-02-15

    申请号:CN201610791966.0

    申请日:2016-08-31

    Abstract: 本发明公开了一种基于音频的人机混合交互系统,语音识别模块与语义识别模块相连并传输语音对应的文字信息,异常处理模块与语音识别模块和语义识别模块相连,语音识别模块传输文字信息给异常处理模块,语义识别模块传输语义解析结果给异常处理模块;异常处理模块与语音合成模块相连并传输干预信息。本发明还公开了一种基于音频的人机混合交互方法,语音识别模块将语音信息转换为文字信息并输出至语义识别单元;语义识别单元从文字信息中提取用户目的以及相应的关键信息;异常处理模块根据语音识别模块的文字信息以及语义识别模块的语义信息判断人机对话当前是否出现异常并针对异常处理消息的回复。本发明的技术方案提供统一的人机对话体验。

    基于上下文语义理解的人工对话辅助系统

    公开(公告)号:CN106354835A

    公开(公告)日:2017-01-25

    申请号:CN201610786689.4

    申请日:2016-08-31

    Abstract: 本发明公开了一种基于上下文语义理解的人工对话辅助系统,涉及人工智能领域,包括信息获取模块、语义理解模块、集成功能模块和人工确认模块,其中,信息获取模块被配置为获取用户当前输入、对话轮次和历史输入信息;语义理解模块被配置为结合上下文进行语义理解,获取用户当前意图,进过人工确认模块确认为用户真实意图;集成功能模块被配置为调用系统集成功能并搜索匹配给出解决用户问题的回答信息,经过人工确认模块确认后推送给客户。本发明所述系统着重在后端实现为客服人员服务,大幅减少客服人员的重复劳动和劳动强度,增加客服的处理能力,让客服人员更专注在一些细致体贴的客户体验上,从而提高系统响应效率和客户体验。

Patent Agency Ranking