一种文本相似度的确定方法、装置、电子设备及存储介质

    公开(公告)号:CN119538900A

    公开(公告)日:2025-02-28

    申请号:CN202311108038.6

    申请日:2023-08-30

    Abstract: 本发明公开了一种文本相似度的确定方法、装置、电子设备及存储介质,其中,该方法包括:获取待处理文本和待处理文本关联的至少一个参考文本;针对各参考文本,根据待处理文本的第一词分布信息和当前参考文本的第二词分布信息,确定待处理文本中的引用文本;从待处理文本中剔除引用文本得到待查重文本,以及从当前参考文本中剔除与引用文本对应的关联文本,得到待比对文本;基于至少一种相似度算法,确定待查重文本和待比对文本的文本相似度。解决了在待查重的文本中存在引用文本时,由于引用文本导致对待查重的文本的查重结果不准确的问题,通过剔除的引用文本,并对剔除引用文本后的文本进行查重处理,实现得到更加准确的查重结果的效果。

    一种统计数据处理方法、装置、电子设备及存储介质

    公开(公告)号:CN119441199A

    公开(公告)日:2025-02-14

    申请号:CN202310943858.0

    申请日:2023-07-28

    Abstract: 本发明实施例公开了一种统计数据处理方法、装置、电子设备及存储介质。该方法包括:确定待处理统计数据以及所述待处理统计数据的时间维度信息;获取与所述待处理统计数据关联的至少两个配置函数,并确定所述至少两个配置函数间的层级关系;确定与配置函数关联的至少两个操作数,并确定与操作数对应的指标数据;依据所述待处理统计数据的时间维度信息、配置函数的层级关系以及与操作数对应的指标数据,确定所述待处理统计数据的数值结果。采用本技术方案,以采集和初步汇总的基础数据进行处理,通过数据计算处理引擎,得到各个维度的待处理统计数据的数值结果。使统计业务工作做到智能化,并且能够保证数据的准确性,提高了数据的处理效率。

Patent Agency Ranking