一种对话系统回答生成方法及系统

    公开(公告)号:CN110020015A

    公开(公告)日:2019-07-16

    申请号:CN201711481699.8

    申请日:2017-12-29

    Abstract: 本发明涉及一种对话系统回答生成方法及系统,包括以下步骤:步骤S1)将多轮对话数据按照每一轮进行切割,每一轮对话表示为(U,Y);步骤S2)对U中的每个词进行词性标注和命名实体识别,找到词序列中的关键词序列;步骤S3)使用数据库查询或者神经网络自动生成的方法,得到目标关键词序列。然后对每个目标关键词,查找得到该关键词的词向量;步骤S4)模型训练,对训练集中所有轮次的对话,使用seq2seq模型获得预测的词序列Y’;步骤S5)训练完成后,对测试样本中的任意一个用户输入样本,进行步骤S4)的操作,获得预测的词序列Y’。本发明不仅可有效控制生成的回答的内容,还提高了回答的质量。

    基于卷积循环实体网络的端对端对话状态跟踪方法及系统

    公开(公告)号:CN110866403A

    公开(公告)日:2020-03-06

    申请号:CN201810916744.6

    申请日:2018-08-13

    Abstract: 本发明提出了基于卷积循环实体网络的端对端对话状态跟踪方法和系统,包括:步骤1)将对话表示成多个句子矩阵集合D={S1,...St},Si,1≤i≤t为第i个由若干词向量组成的句子矩阵;步骤2)该矩阵集合D经过一个可训练的卷积神经网络模块,最大池化后得到固定长度的句子向量;步骤3)使用动态记忆将各个固定长度的句子向量进行编码,使用动态记忆的最后一个隐层ht表示整个对话;步骤4)对于每个预先定义的语义槽,建立一层从ht到该语义槽所有可能值的全连接的神经网络,得到各个语义槽在各个值上的概率分布;步骤5)取最大概率所在的值作为该语义槽的预测结果,得到该对话当前的对话状态。本发明可自动学习和语义槽相关的文本表示,提高了对话状态跟踪的性能。

    一种自由定制的中文预处理方法及其系统

    公开(公告)号:CN107577666A

    公开(公告)日:2018-01-12

    申请号:CN201710827271.8

    申请日:2017-09-14

    Abstract: 本发明涉及一种自由定制的中文预处理方法,包括:步骤1)从配置文件中读取参数列表并记录;步骤2)判断输入是否为一个文件夹;步骤3)经过处理后,生成分词后的结果和带词频的结果,分别保存在用户指定的seg文件夹、tf文件夹;生成一个全局词典,保存在outputdir文件夹下的df文件夹中;步骤4)根据df文件夹中的全局词典和dfTheshold阈值,生成全局停用词词典,将其保存在df文件夹中;判断每个文件或子文件中的每个词是否在停用词词典中,将滤除后的文件或子文件保存到remove_words文件夹中;步骤5)判断步骤2)的输入是否为单文件且多进程;当步骤2)输入为单个文件且多进程时,合并remove_words文件夹中的子文件成一个大文件,并将这些子文件删除;否则,程序结束。

    基于卷积循环实体网络的端对端对话状态跟踪方法及系统

    公开(公告)号:CN110866403B

    公开(公告)日:2021-06-08

    申请号:CN201810916744.6

    申请日:2018-08-13

    Abstract: 本发明提出了基于卷积循环实体网络的端对端对话状态跟踪方法和系统,包括:步骤1)将对话表示成多个句子矩阵集合D={S1,...St},Si,1≤i≤t为第i个由若干词向量组成的句子矩阵;步骤2)该矩阵集合D经过一个可训练的卷积神经网络模块,最大池化后得到固定长度的句子向量;步骤3)使用动态记忆将各个固定长度的句子向量进行编码,使用动态记忆的最后一个隐层ht表示整个对话;步骤4)对于每个预先定义的语义槽,建立一层从ht到该语义槽所有可能值的全连接的神经网络,得到各个语义槽在各个值上的概率分布;步骤5)取最大概率所在的值作为该语义槽的预测结果,得到该对话当前的对话状态。本发明可自动学习和语义槽相关的文本表示,提高了对话状态跟踪的性能。

    一种自由定制的中文预处理方法及其系统

    公开(公告)号:CN107577666B

    公开(公告)日:2019-11-19

    申请号:CN201710827271.8

    申请日:2017-09-14

    Abstract: 本发明涉及一种自由定制的中文预处理方法,包括:步骤1)从配置文件中读取参数列表并记录;步骤2)判断输入是否为一个文件夹;步骤3)经过处理后,生成分词后的结果和带词频的结果,分别保存在用户指定的seg文件夹、tf文件夹;生成一个全局词典,保存在outputdir文件夹下的df文件夹中;步骤4)根据df文件夹中的全局词典和dfTheshold阈值,生成全局停用词词典,将其保存在df文件夹中;判断每个文件或子文件中的每个词是否在停用词词典中,将滤除后的文件或子文件保存到remove_words文件夹中;步骤5)判断步骤2)的输入是否为单文件且多进程;当步骤2)输入为单个文件且多进程时,合并remove_words文件夹中的子文件成一个大文件,并将这些子文件删除;否则,程序结束。

Patent Agency Ranking