一种文本差异率确定方法、装置及电子设备

    公开(公告)号:CN116451092A

    公开(公告)日:2023-07-18

    申请号:CN202310445881.7

    申请日:2023-04-20

    Abstract: 本发明公开了一种文本差异率确定方法、装置及电子设备。对两个待比对文件分别解析处理,得到第一文本内容和第二文本内容;基于文件差异分析算法对第一文本内容和第二文本内容进行处理,确定文本匹配结果;基于第一文本内容中的文本段落信息,将文本匹配结果划分为多个子文本序列,并确定与多个子文本序列相对应的待验证段落组;基于待验证段落组以及相似判断模型,确定目标相似段落组,并确定与目标相似段落组相对应的字符总数;基于公共字符数、独有字符数、字符总数和差异率函数,确定差异率,解决了文件审核过程中工作量大,效率低,易出错的问题,提高了确定文件差异率的准确性,提升了确定文件差异的效率,减少了出错频率。

Patent Agency Ranking