分布式图数据结构的处理方法、装置及系统

    公开(公告)号:CN119415743A

    公开(公告)日:2025-02-11

    申请号:CN202411467872.9

    申请日:2024-10-18

    Abstract: 本说明书提供一种分布式图数据结构的处理方法、装置及系统,该方法应用于分布式系统中的目标进程,分布式系统中还包括与目标进程通信的其他进程,图数据结构中的一条边被分配到分布式系统中的一个进程,在第i轮迭代中,该方法包括:获得分布式系统中各进程各自传播的子图,对获得的各子图中的任意子图中的边进行边定位,得到目标边,同一子图在不同进程下的边定位结果相同,不同子图在同一进程下的边定位结果不同,若目标边不是被分配给目标进程的边,则目标进程无需对任意子图进行处理,任意子图由分配有目标边的进程进行子图构造,并对第i轮迭代构造的子图进行传播。

    用户生物特征向量的聚类方法及装置

    公开(公告)号:CN118918348A

    公开(公告)日:2024-11-08

    申请号:CN202411104596.X

    申请日:2024-08-12

    Abstract: 本说明书实施例披露一种用户生物特征向量的聚类方法及装置。该方法包括:首先,采用近似最近邻搜索ANNS算法构建生物特征向量之间的ANNS图,其中部分节点对应的生物特征向量携带用户ID;接着,基于社区发现算法处理ANNS图,得到多个社区,其中各个社区包括若干节点标识;然后,针对各个社区,基于其中具有用户ID的节点对其他节点进行相似度计算和过滤处理,从而得到该用户ID对应的聚类类簇。如此,可以在大幅降低计算量的同时,得到对相似生物特征数据区分度高、可用性强的聚类结果。

    一种基于分布式集群的任务调度方法及相关设备

    公开(公告)号:CN118445296A

    公开(公告)日:2024-08-06

    申请号:CN202410508712.8

    申请日:2024-04-25

    Abstract: 本说明书提供了一种基于分布式集群的任务调度方法及相关设备,应用于分布式集群包括的多个节点中的任一目标节点;分布式集群中部署了目标数据库,目标数据库中维护了待执行的多个任务的任务分配结果。该方法包括:根据预设的选举策略,选举调度节点;响应于目标节点选举成为调度节点,访问目标数据库,根据目标数据库中维护的多个任务的任务分配结果,确定多个任务中是否存在可分配的若干任务;若是,从多个节点中为若干任务分配对应的节点,并将若干任务的任务分配结果更新至目标数据库中,以使多个节点根据目标数据库中维护的多个任务的任务分配结果,确定多个任务中是否存在分配给自己的任务,若是,则执行分配的任务。

    一种数据同步方法、装置、可读存储介质及电子设备

    公开(公告)号:CN115408468A

    公开(公告)日:2022-11-29

    申请号:CN202210922327.9

    申请日:2022-08-02

    Abstract: 本说明书公开了一种数据同步方法、装置、可读存储介质及电子设备,由分布式系统的目标从节点,主动从该分布式系统的其他从节点中,查询该其他从节点最近存储的业务数据的数据标识,再根据该数据标识以及该目标从节点自身存储的业务数据的数据标识,确定出该目标从节点需要补充才能参与到主节点发起的数据同步过程中的业务数据,作为待同步的业务数据,再基于同步协议,从其他从节点中获取待同步的业务数据,以此来实现该分布式系统中的数据同步。本方法在目标从节点未能及时和主节点之间同步数据的场景下,可由从该目标从节点自身从其他从节点中获取业务数据,减少了数据同步所需的时间,提高了同步效率。

    用于划分图数据的方法、装置、电子设备和程序产品

    公开(公告)号:CN119883614A

    公开(公告)日:2025-04-25

    申请号:CN202411940889.1

    申请日:2024-12-25

    Abstract: 本发明涉及用于划分图数据的方法、装置、电子设备和程序产品。该方法包括确定与图数据中的顶点和边二者相关的总数量。进一步地,该方法还包括基于总数量和分布式集群中的多个处理线程的数量,确定处理线程能够被分配的顶点和边二者的数量的上限值。从而可以按照图数据中多个顶点各自的边的数量,将多个顶点分配至多个处理线程,分配至处理线程的顶点和对应的边二者的数量小于或者等于上限值。

    图数据的处理方法及系统
    7.
    发明公开

    公开(公告)号:CN119622297A

    公开(公告)日:2025-03-14

    申请号:CN202411758871.X

    申请日:2024-12-02

    Abstract: 本说明书提供一种图数据的处理方法及系统。该方法中,图数据的处理系统可以确定初始的特征维度集合,并基于该特征维度集合、以及图数据中与目标任务相关的关键节点集合,对图数据中的多个子图进行特征提取,进而基于特征提取结果在特征维度集合中剔除在目标任务下重要程度较低的特征维度,将特征维度集合中剩余的特征维度作为关键特征维度。这样的方式实现了对初始的特征维度集合进行自动化处理,以从初始的特征维度集合中筛选得到对于目标任务的重要程度相对较高的关键特征维度。

    基于结构图的社区发现方法和装置

    公开(公告)号:CN119474466A

    公开(公告)日:2025-02-18

    申请号:CN202411524577.2

    申请日:2024-10-29

    Abstract: 本说明书实施例提供一种基于结构图的社区发现方法。方法包括:基于结构图,初始化社区图,各个社区由实体顶点代表,并具有社区属性;各社区被添加有原子锁;采用多个线程并行执行若干轮第一图迭代,任意的第一线程执行的当前轮图迭代包括,对于第一线程负责处理的任意的第一实体顶点,确定与其满足预设关系的各个邻居实体顶点所属的各个目标社区,在取得各个目标社区的原子锁后,根据各个目标社区的社区属性,确定第一实体顶点是否需要移动,并在需要移动时,更新相关社区的社区属性,在更新后释放原子锁;根据若干轮第一图迭代后实体顶点的社区归属,将任一社区中的实体顶点聚合成新的代表该社区的实体顶点,以更新社区图。

    基于异质图的社区发现方法和装置

    公开(公告)号:CN119250175A

    公开(公告)日:2025-01-03

    申请号:CN202411296389.9

    申请日:2024-09-14

    Abstract: 本说明书实施例提供一种基于异质图的社区发现方法和装置。方法包括若干轮图迭代,其中至少一轮图迭代包括:对于每个代表当前社区的实体顶点,进行局部移动处理;所述局部移动处理包括:遍历与其满足预设关系的各个邻居实体顶点,确定将该实体顶点移动到邻居实体顶点所代表社区后的确定性指标的增益;根据所述增益,确定是否进行所述移动;所述确定性指标根据社区中各个实体顶点关联的各类辅助顶点的特征取值的分布而确定;针对局部移动处理后得到的各个社区,将任一社区中的若干实体顶点聚合成一个新的实体顶点代表该社区。能够得到稳定有效的社区发现结果。

    一种基于向量数据库进行问答推理的方法及装置

    公开(公告)号:CN118839005A

    公开(公告)日:2024-10-25

    申请号:CN202411074787.6

    申请日:2024-08-06

    Abstract: 本说明书实施例提供了一种基于向量数据库进行问答推理的方法及装置。所述向量数据库中存储有从知识图谱采样的多个子图对应的多个子图向量,各子图向量通过对子图以及对应的图描述文本进行编码得到。该方法包括:获取目标问答对,目标问答对中包含目标问题与第一候选答案。在知识图谱中,确定与目标问题相关的若干相关三元组。生成增强查询文本,其中包含目标问答对的问答文本与若干相关三元组对应的描述文本。将增强查询文本输入文本编码器进行编码,得到增强查询向量。基于增强查询向量,从向量数据库中召回若干相似子图向量。根据若干相似子图向量与增强查询向量,确定目标评分,该目标评分反映第一候选答案对于目标问题的合理度。

Patent Agency Ranking