一种基于分布式表示模型困惑度的人机对话方法与系统

    公开(公告)号:CN110825861A

    公开(公告)日:2020-02-21

    申请号:CN201911073080.2

    申请日:2019-11-05

    Abstract: 本发明涉及自然语言处理领域,特别涉及一种基于分布式表示模型困惑度的人机对话方法;本方法包括:获取文本数据;对文本数据进行处理,得到BERT模型和模型困惑度特征向量;将文本数据转换为768维句向量;利用768维句向量训练t-SNE模型,并结合k得到3维向量;利用3维向量训练单分类One-Class SVM模型,并判别输入数据属于域内还是域外;利用768维句向量训练逻辑回归文本分类模型,并对文本数据进行领域内分类;输入文本数据,判断输入的数据为域内还是域外,并做出回答;本发明实现了对文本域内域外的判断,从而判别出用户输入是否在问答系统解决能力范围内,避免了问答系统对不知情的问题乱回答的现象。

    一种基于分布式表示模型困惑度的人机对话方法与系统

    公开(公告)号:CN110825861B

    公开(公告)日:2022-05-03

    申请号:CN201911073080.2

    申请日:2019-11-05

    Abstract: 本发明涉及自然语言处理领域,特别涉及一种基于分布式表示模型困惑度的人机对话方法;本方法包括:获取文本数据;对文本数据进行处理,得到BERT模型和模型困惑度特征向量;将文本数据转换为768维句向量;利用768维句向量训练t‑SNE模型,并结合k得到3维向量;利用3维向量训练单分类One‑Class SVM模型,并判别输入数据属于域内还是域外;利用768维句向量训练逻辑回归文本分类模型,并对文本数据进行领域内分类;输入文本数据,判断输入的数据为域内还是域外,并做出回答;本发明实现了对文本域内域外的判断,从而判别出用户输入是否在问答系统解决能力范围内,避免了问答系统对不知情的问题乱回答的现象。

Patent Agency Ranking