一种异构数据差异对比更新方法及系统

    公开(公告)号:CN117520359A

    公开(公告)日:2024-02-06

    申请号:CN202311599170.1

    申请日:2023-11-27

    IPC分类号: G06F16/23

    摘要: 本发明公开了一种异构数据差异对比更新方法及系统包括,根据基于领域驱动设计的规范定义数据模型以及数据模型的关联关系;获取目标领域相关异构数据,并根据数据模型以及数据模型的关联关系对目标领域相关异构数据进行格式规范处理;将格式规范处理后数据与预存在数据库中的数据进行对比,获取数据差异,并更新数据库中存在差异的数据。根据领域驱动设计数据模型的配置进行数据差异对比,并将对比结果进行最小化提交到数据库存储,使数据更新更加高效存储到结构化数据库,为数据的集中存储提供更快捷稳定的支持。

    一种基于语义分析的文档查重方法及系统

    公开(公告)号:CN111325015B

    公开(公告)日:2024-01-30

    申请号:CN202010103483.3

    申请日:2020-02-19

    摘要: 本发明公开了一种基于语义分析的文档查重方法,包括对待查重文档进行切分,构建查询语句集合;遍历查询语句集合,根据查询语句与预设查重语句集合的关联度,选出各查询语句的若干候选查重语句,根据查询语句与相应候选查重语句的语义相似性,获得各查询语句的重复率;根据各查询语句的重复率,计算待查重文档的重复率。同时公开了相应的系统。本发明基于关联度进行查询语句和查重语句的匹配,缩小重复率计算范围,基于义相似性获得查询语句的重复率,从而获得查重文档的重复率,可对直接复制、词语变换、句式变换、段落变换等重复形式给出较好的关联结果。

    一种基于语义分析的文档查重方法及系统

    公开(公告)号:CN111325015A

    公开(公告)日:2020-06-23

    申请号:CN202010103483.3

    申请日:2020-02-19

    摘要: 本发明公开了一种基于语义分析的文档查重方法,包括对待查重文档进行切分,构建查询语句集合;遍历查询语句集合,根据查询语句与预设查重语句集合的关联度,选出各查询语句的若干候选查重语句,根据查询语句与相应候选查重语句的语义相似性,获得各查询语句的重复率;根据各查询语句的重复率,计算待查重文档的重复率。同时公开了相应的系统。本发明基于关联度进行查询语句和查重语句的匹配,缩小重复率计算范围,基于义相似性获得查询语句的重复率,从而获得查重文档的重复率,可对直接复制、词语变换、句式变换、段落变换等重复形式给出较好的关联结果。

    一种基于语义向量的短文本相似性度量方法

    公开(公告)号:CN109977418A

    公开(公告)日:2019-07-05

    申请号:CN201910279109.6

    申请日:2019-04-09

    IPC分类号: G06F17/27 G06F17/22

    摘要: 本发明公开一种基于语义向量的短文本相似性度量方法,对短文本t1和t2分词后,根据根动词的分布判断短文本是否存在事件块;如存在,基于根动词提取事件块,并对事件块的语义相似性进行分析。如相似,依据分词位置和词性提取修饰块,并对修饰块的语义相似性进行分析。在此基础上,以短文本t1的修饰块顺序为基准,在短文本t2中查找语义相同的块,调整到对应顺序。最后用词向量表示分词,构建短文本的语义向量,计算二者的余弦距离,作为语义相似性度量。本发明方法通过依存句法分析,提取事件块和修饰块,块内部是具有一定语义关系的若干分词,兼顾了局部的语义关系;通过基于语义分析的块交换,兼顾了多样化的语言表达特点。

    一种基于语义向量的短文本相似性度量方法

    公开(公告)号:CN109977418B

    公开(公告)日:2023-03-31

    申请号:CN201910279109.6

    申请日:2019-04-09

    摘要: 本发明公开一种基于语义向量的短文本相似性度量方法,对短文本t1和t2分词后,根据根动词的分布判断短文本是否存在事件块;如存在,基于根动词提取事件块,并对事件块的语义相似性进行分析。如相似,依据分词位置和词性提取修饰块,并对修饰块的语义相似性进行分析。在此基础上,以短文本t1的修饰块顺序为基准,在短文本t2中查找语义相同的块,调整到对应顺序。最后用词向量表示分词,构建短文本的语义向量,计算二者的余弦距离,作为语义相似性度量。本发明方法通过依存句法分析,提取事件块和修饰块,块内部是具有一定语义关系的若干分词,兼顾了局部的语义关系;通过基于语义分析的块交换,兼顾了多样化的语言表达特点。