-
公开(公告)号:CN115062103A
公开(公告)日:2022-09-16
申请号:CN202210534825.6
申请日:2022-05-17
Applicant: 北京理工大学
Abstract: 本发明涉及结合聚类与图注意力机制的多粒度语义融合文本匹配方法,属于自然语言处理与机器学习领域。本发明首先对实体、句子和主题三种不同粒度的语义信息分别建模得到相应的嵌入向量,实体和主题建模过程中引入外部语义知识;然后分别聚类实体、主题嵌入向量,使用聚类中心作为所在聚类中所有向量的统一表示;接着,利用图注意力机制学习句子级语义与实体、主题级语义之间的关联权重;最后,将训练后的句子向量作为句子的最终表示,进一步进行文本匹配任务。本发明能够有效提高特定领域短文本句子对的匹配效果,在一定程度上解决了待匹配文本过短且包含特定领域词汇导致语义稀疏,匹配准确率低的问题。