-
公开(公告)号:CN114398904A
公开(公告)日:2022-04-26
申请号:CN202111386005.9
申请日:2021-11-22
Applicant: 重庆邮电大学
IPC: G06F40/35 , G06F16/35 , G06F40/216 , G06K9/62 , G06N3/08
Abstract: 本发明公开了一种基于多粒度特征解耦的开放领域对话生成方法,包括:获取数据集和对话类别;随机选取数据集中的若干个第一训练对输入条件变分自编码器CVAE模型,得到与对话类别对应的先验高斯分布;将数据集中的第二训练对输入高级条件变分自编码器A‑CVAE模型中,得到重构期望损失和KL散度;根据重构期望损失、KL散度、第一训练对对应的先验高斯分布,得到总损失;根据总损失对A‑CVAE模型进行反向梯度优化,得到训练A‑CVAE模型;获取待回复对话问题;将待回复对话问题输入训练A‑CVAE模型,生成对话回复。本发明能够解决现有模型不能很好的捕捉对话的类别语义,生成的对话可解释性不高的技术问题。
-
公开(公告)号:CN116932726A
公开(公告)日:2023-10-24
申请号:CN202310977148.X
申请日:2023-08-04
Applicant: 重庆邮电大学
IPC: G06F16/332 , G06F16/35 , G06F18/2415 , G06F18/214 , G06F18/21 , G06N3/0442 , G06N3/0455 , G06N3/09
Abstract: 本发明属于开放域聊天技术领域,具体涉及一种基于可控多空间特征解耦的开放域对话生成方法;M‑CVAE模型的预训练过程包括:获取问题文本序列和回复文本序列并将其嵌入到词空间中,将得到的词向量分别对应输入到输入编码器和输出编码器,得到问题文本特征表示和回复文本特征表示;将两种特征表示输入到识别网络和先验网络中进行计算,得到隐变量;采用解码器根据隐变量对参考回复进行处理,生成回复文本;将问题文本特征表示输入到分类器中,得到问题分类类别概率;预训练后进行再训练和测试,获得训练好的模型;将问题文本输入到训练好的M‑CVAE模型中,生成对应的回复文本;本发明能够生成高质量,可解释,一对多的可控对话文本。
-
公开(公告)号:CN115495566B
公开(公告)日:2024-11-12
申请号:CN202211238085.8
申请日:2022-10-11
Applicant: 重庆邮电大学
IPC: G06F16/332 , G06F40/30 , G06N5/04 , G06N3/0442 , G06N3/0455 , G06N3/084
Abstract: 本发明涉及人机对话领域,具体涉及一种增强文本特征的对话生成方法和系统;该方法包括获取问题文本和回复文本,通过TextRank算法提取问题文本中的关键词,得到关键词序列;引入关键词编码器,关键词编码器通过注意力机制对每一个关键词进行编码得到对应的关键词向量;将关键词向量与语义向量拼接后输入第一多层感知机,得到包含丰富语义的关键词语义向量;将关键词语义向量与问题文本向量拼接后通过第二多层感知机,得到输入向量;根据输入向量训练对话生成模型,采用损失函数计算损失值并反向传播,调整对话生成模型的参数;本发明加强关键词的权重,增强对文本的特征表达,达到生成更高质量的对话文本的目的。
-
公开(公告)号:CN114398904B
公开(公告)日:2024-08-23
申请号:CN202111386005.9
申请日:2021-11-22
Applicant: 重庆邮电大学
IPC: G06F40/35 , G06F16/35 , G06F40/216 , G06F18/214 , G06F18/241 , G06N3/084
Abstract: 本发明公开了一种基于多粒度特征解耦的开放领域对话生成方法,包括:获取数据集和对话类别;随机选取数据集中的若干个第一训练对输入条件变分自编码器CVAE模型,得到与对话类别对应的先验高斯分布;将数据集中的第二训练对输入高级条件变分自编码器A‑CVAE模型中,得到重构期望损失和KL散度;根据重构期望损失、KL散度、第一训练对对应的先验高斯分布,得到总损失;根据总损失对A‑CVAE模型进行反向梯度优化,得到训练A‑CVAE模型;获取待回复对话问题;将待回复对话问题输入训练A‑CVAE模型,生成对话回复。本发明能够解决现有模型不能很好的捕捉对话的类别语义,生成的对话可解释性不高的技术问题。
-
公开(公告)号:CN116932726B
公开(公告)日:2024-05-10
申请号:CN202310977148.X
申请日:2023-08-04
Applicant: 重庆邮电大学
IPC: G06F16/332 , G06F16/35 , G06F18/2415 , G06F18/214 , G06F18/21 , G06N3/0442 , G06N3/0455 , G06N3/09
Abstract: 本发明属于开放域聊天技术领域,具体涉及一种基于可控多空间特征解耦的开放域对话生成方法;M‑CVAE模型的预训练过程包括:获取问题文本序列和回复文本序列并将其嵌入到词空间中,将得到的词向量分别对应输入到输入编码器和输出编码器,得到问题文本特征表示和回复文本特征表示;将两种特征表示输入到识别网络和先验网络中进行计算,得到隐变量;采用解码器根据隐变量对参考回复进行处理,生成回复文本;将问题文本特征表示输入到分类器中,得到问题分类类别概率;预训练后进行再训练和测试,获得训练好的模型;将问题文本输入到训练好的M‑CVAE模型中,生成对应的回复文本;本发明能够生成高质量,可解释,一对多的可控对话文本。
-
公开(公告)号:CN115495566A
公开(公告)日:2022-12-20
申请号:CN202211238085.8
申请日:2022-10-11
Applicant: 重庆邮电大学
IPC: G06F16/332 , G06F40/30 , G06N3/04 , G06N3/08
Abstract: 本发明涉及人机对话领域,具体涉及一种增强文本特征的对话生成方法和系统;该方法包括获取问题文本和回复文本,通过TextRank算法提取问题文本中的关键词,得到关键词序列;引入关键词编码器,关键词编码器通过注意力机制对每一个关键词进行编码得到对应的关键词向量;将关键词向量与语义向量拼接后输入第一多层感知机,得到包含丰富语义的关键词语义向量;将关键词语义向量与问题文本向量拼接后通过第二多层感知机,得到输入向量;根据输入向量训练对话生成模型,采用损失函数计算损失值并反向传播,调整对话生成模型的参数;本发明加强关键词的权重,增强对文本的特征表达,达到生成更高质量的对话文本的目的。
-
公开(公告)号:CN114416948A
公开(公告)日:2022-04-29
申请号:CN202210052665.1
申请日:2022-01-18
Applicant: 重庆邮电大学
IPC: G06F16/332 , G06F16/35 , G06F40/151 , G06F40/216 , G06F40/35 , G06N5/02
Abstract: 本发明涉及对话系统领域,特别涉及一种基于语义感知的一对多对话生成方法及装置,包括获取实时输入问题并送入训练好的对话生成模型,对话生成模型根据输入问题得到多样性的回复,对话生成模型包括输入编码器、输出编码器、识别网络、先验网络、分类器、no emotion解码器、positive解码器、negative解码器;本发明的模型分为预训练和训练两个训练过程,本发明在模型中引入一个能识别出对话的情感或动作的可控变量,通过该可控件变量来选择不同类别的解码器并在训练过程中迫使隐空间特征解耦成不同语义类别的子空间,让相同语义类别的对话能映射到隐空间的相近的位置,进而生成个性化、高质量、可解释、多样性的文本。
-
-
-
-
-
-