一种文本相似度计算方法及相关装置

    公开(公告)号:CN119720994A

    公开(公告)日:2025-03-28

    申请号:CN202411903347.7

    申请日:2024-12-23

    Inventor: 陈佳文 龚骏

    Abstract: 本申请公开了一种文本相似度计算方法及相关装置,涉及文本查重领域,包括:在获取待进行相似度计算的第一文本和第二文本之后;先分别对第一文本和第二文本进行多元化序列提取,得到至少一组序列;再分别计算各组序列的相似度;最后对各组序列的相似度进行加权求和,计算得到第一文本和第二文本的相似度。该方案中,通过对文本中的多元化信息分别进行相似度计算,再融合各多元化信息的相似度得到最终的相似度,能够提升多元化文本的相似度计算准确性。

Patent Agency Ranking