一种多特征匹配的文本匹配方法、终端及可读存储介质

    公开(公告)号:CN114461782A

    公开(公告)日:2022-05-10

    申请号:CN202210036918.6

    申请日:2022-01-13

    Inventor: 夏书银 杨宁 张勇

    Abstract: 本发明公开了一种多特征匹配的文本匹配方法、终端及可读存储介质,涉及自然语言处理领域,解决了现有的文本匹配方法忽略了文本中细粒度的信息以及文本整体语义信息,获取待匹配文本、候选文本,对所述待匹配文本、候选文本进行预处理;对预处理后的文本进行基于N‑Gram的多粒度解析,获得不同粒度下的文本序列,将所述文本序列进行向量化,获得文本向量;将所述文本向量列输入深度学习语言模型中进行训练,获得待匹配文本、候选文本的编码向量;将所述待匹配文本编码、候选文本的编码向量进行相似度计算后求和取平均,获得待匹配文本、候选文本的匹配度;本发明结合细粒度的词项语义信息与粗粒度的文本整体语义信息,提升了文本匹配的准确度。

Patent Agency Ranking