-
公开(公告)号:CN116304749B
公开(公告)日:2023-08-15
申请号:CN202310565214.2
申请日:2023-05-19
Applicant: 中南大学
Abstract: 本发明公开了一种基于图卷积的长文本匹配方法,包括获取现有的长文本数据集;构建关键词图;获取节点的网络特征向量和概率统计特征,得到各个节点的初始特征表示;构建语义超图;构建长文本匹配模型;采用长文本数据集及得到的结果训练长文本匹配模型得到训练后的长文本匹配模型;采用训练后的长文本匹配模型进行实际的长文本匹配。本发明不仅实现了长文本的匹配,而且简化了任务难度,实现了文本对之间细粒度的语义对齐,实现了对匹配信号更准确的语义划分,保证了训练过程中超边节点间的特征相似性,可靠性高、精确性好且客观科学。
-
公开(公告)号:CN116304749A
公开(公告)日:2023-06-23
申请号:CN202310565214.2
申请日:2023-05-19
Applicant: 中南大学
Abstract: 本发明公开了一种基于图卷积的长文本匹配方法,包括获取现有的长文本数据集;构建关键词图;获取节点的网络特征向量和概率统计特征,得到各个节点的初始特征表示;构建语义超图;构建长文本匹配模型;采用长文本数据集及得到的结果训练长文本匹配模型得到训练后的长文本匹配模型;采用训练后的长文本匹配模型进行实际的长文本匹配。本发明不仅实现了长文本的匹配,而且简化了任务难度,实现了文本对之间细粒度的语义对齐,实现了对匹配信号更准确的语义划分,保证了训练过程中超边节点间的特征相似性,可靠性高、精确性好且客观科学。
-
公开(公告)号:CN116186562A
公开(公告)日:2023-05-30
申请号:CN202310466350.6
申请日:2023-04-27
Applicant: 中南大学
IPC: G06F18/22 , G06F18/213 , G06N3/084 , G06F16/35 , G06N3/0455
Abstract: 本发明公开了一种基于编码器的长文本匹配方法,包括获取现有的文档数据集;提取关键句;构建匹配数据集;构建长文本匹配初始模型;采用匹配数据集训练长文本匹配初始模型得到长文本匹配模型;采用长文本匹配模型进行实际的长文本对的匹配判定。本发明通过关键句提取方案和文本匹配框架,不仅能够更好地提取输入的长文本的关键信息,而且融合了交叉编码器和双编码器各自的优势,在长文本匹配任务中表现优异,尤其是在匹配描述同一事件的长文本时具有更高的准确性和鲁棒性;而且本发明的可靠性高、精确性好且效率较高。
-
公开(公告)号:CN116186562B
公开(公告)日:2023-07-21
申请号:CN202310466350.6
申请日:2023-04-27
Applicant: 中南大学
IPC: G06F18/22 , G06F18/213 , G06N3/084 , G06F16/35 , G06N3/0455
Abstract: 本发明公开了一种基于编码器的长文本匹配方法,包括获取现有的文档数据集;提取关键句;构建匹配数据集;构建长文本匹配初始模型;采用匹配数据集训练长文本匹配初始模型得到长文本匹配模型;采用长文本匹配模型进行实际的长文本对的匹配判定。本发明通过关键句提取方案和文本匹配框架,不仅能够更好地提取输入的长文本的关键信息,而且融合了交叉编码器和双编码器各自的优势,在长文本匹配任务中表现优异,尤其是在匹配描述同一事件的长文本时具有更高的准确性和鲁棒性;而且本发明的可靠性高、精确性好且效率较高。
-
-
-