知识节点的多模态融合更新方法

    公开(公告)号:CN116028654B

    公开(公告)日:2023-06-13

    申请号:CN202310322871.4

    申请日:2023-03-30

    Abstract: 本发明提供知识节点的多模态融合更新方法,确定知识数据所包括的知识模态种类;根据每个知识节点的知识模态种类、相应知识模态种类的知识信息量计算,得到模态评价子系数,根据所有知识节点的模态评价子系数得到模态评价平均系数;根据模态评价子系数对第一知识节点进行升序排序得到知识节点序列;在知识节点序列中挑选前部的多个第一知识节点作为第二知识节点,根据第二知识节点在当前时刻的知识模态种类,生成相对应第二知识节点的推荐添加模态种类;根据所配置的新的知识模态种类和/或新的知识信息,对第二知识节点内的知识数据进行融合更新处理。

    数据处理方法及装置
    13.
    发明公开

    公开(公告)号:CN115292303A

    公开(公告)日:2022-11-04

    申请号:CN202211221664.1

    申请日:2022-10-08

    Abstract: 本发明公开了一种数据处理方法及装置,该方法包括:对数据集中的数据进行聚类,得到各类簇;对各类簇进行离群检测处理,所述离群检测处理包括:如果所述类簇中数据点的总数小于设定阈值,则将所述类簇中的所有数据点放入离群点候选集中;否则,依次计算所述类簇中各数据点到类簇中心的距离,并将所述距离大于等于半径的数据点放入离群点候选集中;对所述离群点候选集进行剪枝处理,得到剪枝后的离群点候选集;对剪枝后的离群点候选集中的数据点进行离群处理,确定数据点是否为离群点。利用本发明方案,可以有效提升大数据的数据质量。

    一种规则引擎驱动的数据融合方法

    公开(公告)号:CN110347878A

    公开(公告)日:2019-10-18

    申请号:CN201910515522.8

    申请日:2019-06-14

    Abstract: 本发明属于数据融合技术领域,公开了一种规则引擎驱动的数据融合方法,包括以下步骤:设置融合规则的表达规范;设置融合引擎的实现规范;制定数据预处理、数据集成、同名实体匹配、同名实体融合四个阶段的融合规则,并构建四个阶段相应的融合规则库;解析四个阶段融合规则库中的融合规则,针对每一个融合规则创建一个对应的融合引擎,并构建四个阶段相应的融合引擎库;读取多源异构数据;用户指定融合规则,创建数据融合任务,调用融合引擎自动完成数据的融合过程。本发明解决了现有技术中的数据融合方法难以满足对数据的动态需求的问题。

    融合领域知识的预训练模型训练方法、数据处理方法

    公开(公告)号:CN116028821B

    公开(公告)日:2023-06-13

    申请号:CN202310314738.4

    申请日:2023-03-29

    Abstract: 本发明提供融合领域知识的预训练模型训练方法、数据处理方法,服务器在判断接收到模型处理请求和目标领域样本集后,调取数据库中与每个第一预训练模型所对应的第一领域样本集;得到多个第一领域样本集与目标领域样本集的样本集相似度系数,将相似度系数最高的或次高的第一领域样本集作为第二领域样本集;确定与第二训练样本不同的目标训练样本,基于所确定的目标训练样本生成差异样本集;将第二领域样本集所对应的第一预训练模型作为第二预训练模型,控制第二预训练模型对所述差异训练语句进行分词处理得到至少一个训练词语,将槽位与训练语句的对应关系以及相应的槽位模板对应存储,得到最终模型。

Patent Agency Ranking