-
公开(公告)号:CN113342950A
公开(公告)日:2021-09-03
申请号:CN202110625585.6
申请日:2021-06-04
Applicant: 北京信息科技大学
IPC: G06F16/332 , G06F16/35 , G06F40/211 , G06F40/253 , G06F40/30 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明提供一种基于语义联合的答案选取方法,文本预处理与输入层对原始数据预处理,删除无正确答案问题,将问题与答案语义联合拼成文段序列,使用特殊标志分割将问题和答案句子区分,得到格式数组;语义编码层将格式数组输入,用自注意力机制使单词成为隐藏文段中其他单词信息的语义向量,并输入向前传播层,得到文段的向量表示;特征提取层获取向量表示作为问题和答案的语义信息,用线性函数将高维向量转化为低维;并用进行特征提取,获得语义语法信息;语义关联层使用分类,对语义语法信息的相关联程度进行评分,得到二维向量,选取后一维度的数值,得到关联度。本发明的方法在问答数据集上表现出优越的性能,提取答案与问题关键信息能力显著。
-
公开(公告)号:CN113342950B
公开(公告)日:2023-04-21
申请号:CN202110625585.6
申请日:2021-06-04
Applicant: 北京信息科技大学
IPC: G06F16/332 , G06F16/35 , G06F40/211 , G06F40/253 , G06F40/30 , G06N3/0455 , G06N3/0442 , G06N3/0464 , G06N3/048 , G06N3/047 , G06N3/084
Abstract: 本发明提供一种基于语义联合的答案选取方法,文本预处理与输入层对原始数据预处理,删除无正确答案问题,将问题与答案语义联合拼成文段序列,使用特殊标志分割将问题和答案句子区分,得到格式数组;语义编码层将格式数组输入,用自注意力机制使单词成为隐藏文段中其他单词信息的语义向量,并输入向前传播层,得到文段的向量表示;特征提取层获取向量表示作为问题和答案的语义信息,用线性函数将高维向量转化为低维;并用进行特征提取,获得语义语法信息;语义关联层使用分类,对语义语法信息的相关联程度进行评分,得到二维向量,选取后一维度的数值,得到关联度。本发明的方法在问答数据集上表现出优越的性能,提取答案与问题关键信息能力显著。
-