-
公开(公告)号:CN115688794A
公开(公告)日:2023-02-03
申请号:CN202211190548.8
申请日:2022-09-28
Applicant: 中国科学院计算技术研究所
IPC: G06F40/30 , G06N3/0442
Abstract: 本发明提出一种零样本学习跨语言层级架构的自然语言理解方法和系统,包括建立一个分层框架,以共同完成意图检测和槽的填充。本发明模型学会了对高维空间的预设意图进行分类,并在低层次的预测意图的指导下填充语义槽,以找到更多相关的意图论据以提高槽的填充性能。并且本发明还采用了预先训练好的语言无关的BiLSTM编码器来得出句子嵌入,并直接用于后面的意图检测分类任务,其中不同语言的句子嵌入在句子层面上是一致的。本发明进行在一个公共任务导向的对话数据集上进行了实验,结果表明本发明提出的方法在零点适应上达到了最优性能。
-
公开(公告)号:CN115392263A
公开(公告)日:2022-11-25
申请号:CN202211023548.9
申请日:2022-08-25
Applicant: 中国科学院计算技术研究所
Abstract: 一种基于知识选择的对话模型,所述模型包括:编码模块,其包括文本编码器和知识编码器,所述文本编码器用于对提问者语句进行编码获得提问者语句编码向量,所述知识编码器用于对知识库中的知识进行编码获得知识编码向量;知识选择模块,用于根据编码模块获得的所述提问者语句编码向量和知识编码向量从知识库中为提问者语句选择知识,所述知识选择模块通过采用强化学习的方式以对话文本及其上下文为输入、为对话文本选择的知识为输出训练获得;解码模块,用于根据所述知识选择模块选择的知识与所述提问者语句编码向量进行解码生成提问者语句的回复语句。
-