面向分布式动态图神经网络训练的图数据划分方法

    公开(公告)号:CN119622043A

    公开(公告)日:2025-03-14

    申请号:CN202411826335.9

    申请日:2024-12-12

    Applicant: 东北大学

    Abstract: 本发明提供面向分布式动态图神经网络训练的图数据划分方法,涉及分布式动态图神经网络训练、图划分技术领域。该方法具体包括:获取若干个连续的原始快照并构建原始快照集合;采用二阶构建次数还原策略对原始快照集合进行还原,计算原始快照集合中每个原始快照的总使用次数;采用基于频率的自适应快照保留策略从原始快照集合保留部分原始快照,并构建包含被保留的原始快照中所有边的加权合并图,再采用现有的静态图划分算法对加权合并图进行图划分,得到原始快照集合的划分结果。本发明有效且高效地支持高质量的大规模离散时间动态图数据划分操作,从而减少跨节点通信开销,进一步提升大规模分布式动态图神经网络系统的训练效率。

    基于参数服务器架构的图数据与参数数据的混合划分方法

    公开(公告)号:CN113191486B

    公开(公告)日:2023-10-13

    申请号:CN202110458807.X

    申请日:2021-04-27

    Applicant: 东北大学

    Abstract: 本发明公开一种基于参数服务器架构的图数据与参数数据的混合划分方法,首先将图顶点按广度优先遍历的方式重新处理编号,将顶点编号划分为大小相等的P个区间,取区间的中间值对应的顶点作为多个初始分区,然后基于图拓扑数据与顶点特征维度计算当前分区邻域顶点的代价分数,根据代价分数对邻域顶点进行排序,选取代价分数最小的多个邻域顶点加入当前分区,同时更新当前分区顶点特征权重向量。通过对比多个分区的顶点特征权重向量,将图神经网络模型参数按行划分至在计算时需要使用该参数行顶点的数量最多的分区中。适用于支持图神经网络算法的参数服务器系统,能够减少系统运行时的网络通信开销,加速系统计算效率。

    一种基于GPU加速的确定性事务并发控制方法

    公开(公告)号:CN115080670A

    公开(公告)日:2022-09-20

    申请号:CN202210703706.9

    申请日:2022-06-21

    Applicant: 东北大学

    Abstract: 一种基于GPU加速的确定性事务并发控制方法,属于数据库事务处理领域;本发明将数据库事务迁移至GPU进行处理,将事务分解成单个读取操作或写入操作,后在GPU中按照先并行处理读取操作,后并行处理写入操作的顺序执行事务;在执行事务之后对事务进行事务内冲突检测和事务间冲突检测,并在完成两种检测后进行事务提交;本方法实现了事务内与事务间的无锁定全并发策略,并且在整体事务迁移到GPU执行前仅需确定事务的读写集,并不需要构造依赖图等计算资源消耗高的事务执行依赖数据,仅需在事务执行完成之后对其中的冲突进行检测。

    基于参数服务器架构的图数据与参数数据的混合划分方法

    公开(公告)号:CN113191486A

    公开(公告)日:2021-07-30

    申请号:CN202110458807.X

    申请日:2021-04-27

    Applicant: 东北大学

    Abstract: 本发明公开一种基于参数服务器架构的图数据与参数数据的混合划分方法,首先将图顶点按广度优先遍历的方式重新处理编号,将顶点编号划分为大小相等的P个区间,取区间的中间值对应的顶点作为多个初始分区,然后基于图拓扑数据与顶点特征维度计算当前分区邻域顶点的代价分数,根据代价分数对邻域顶点进行排序,选取代价分数最小的多个邻域顶点加入当前分区,同时更新当前分区顶点特征权重向量。通过对比多个分区的顶点特征权重向量,将图神经网络模型参数按行划分至在计算时需要使用该参数行顶点的数量最多的分区中。适用于支持图神经网络算法的参数服务器系统,能够减少系统运行时的网络通信开销,加速系统计算效率。

    一种基于时序图神经网络的节点表示方法及增量学习方法

    公开(公告)号:CN112686376A

    公开(公告)日:2021-04-20

    申请号:CN202110033737.3

    申请日:2021-01-11

    Applicant: 东北大学

    Abstract: 本发明公开一种基于时序图神经网络的节点表示方法及增量学习方法,属于图表示学习技术领域。预处理操作后用带有双重注意力机制的GCN模型分别处理不同时刻的时序图快照,进行图卷积计算,求得任一时刻任一节点的结构嵌入表示;将在每一时刻任一节点的结构嵌入表示作为一个序列输入到t‑GRU时序网络中进行串行计算,求得任一时刻任一节点的最终的嵌入表示;针对T时刻的新数据,先将T时刻之前的中间结果存储起来;只利用一个带有双重注意力机制的GCN模型处理T时刻的增量图数据;将中间结果以及T时刻结果合成一个序列输入到t‑GRU时序网络中进行串行计算得到T时刻任一节点的嵌入表示。适用多种时序图场景,节点表示信息更丰富且准确,模型迭代收敛速度快。

    一种基于GPU加速的确定性事务并发控制方法

    公开(公告)号:CN115080670B

    公开(公告)日:2025-04-04

    申请号:CN202210703706.9

    申请日:2022-06-21

    Applicant: 东北大学

    Abstract: 一种基于GPU加速的确定性事务并发控制方法,属于数据库事务处理领域;本发明将数据库事务迁移至GPU进行处理,将事务分解成单个读取操作或写入操作,后在GPU中按照先并行处理读取操作,后并行处理写入操作的顺序执行事务;在执行事务之后对事务进行事务内冲突检测和事务间冲突检测,并在完成两种检测后进行事务提交;本方法实现了事务内与事务间的无锁定全并发策略,并且在整体事务迁移到GPU执行前仅需确定事务的读写集,并不需要构造依赖图等计算资源消耗高的事务执行依赖数据,仅需在事务执行完成之后对其中的冲突进行检测。

    基于GPU并行的自适应基数树动态索引方法

    公开(公告)号:CN112000847B

    公开(公告)日:2021-07-20

    申请号:CN202010836011.9

    申请日:2020-08-19

    Applicant: 东北大学

    Abstract: 本发明提供一种基于GPU并行的自适应基数树动态索引方法。首先构建自适应基数树数据结构,前两层创建Node256类型的树节点,第三、四层的创建基于高位优先的基数排序方法,根据分支的数量创建能容下对应大小的树节点,实现动态数据结构的创建,可以保证在原批数据中最新的更新在进行排序后仍旧是在旧的更新后面,然后去重操作,去掉多余的旧更新保留最新的更新,去重之后再把每一段无重复数据的序列插入该段对应的节点内,完成对整个自适应基数树的创建,其次基于GPU并行计算能力,可以并行进行对数据的插入、查询、删除操作。

    基于GPU并行的自适应基数树动态索引方法

    公开(公告)号:CN112000847A

    公开(公告)日:2020-11-27

    申请号:CN202010836011.9

    申请日:2020-08-19

    Applicant: 东北大学

    Abstract: 本发明提供一种基于GPU并行的自适应基数树动态索引方法。首先构建自适应基数树数据结构,前两层创建Node256类型的树节点,第三、四层的创建基于高位优先的基数排序方法,根据分支的数量创建能容下对应大小的树节点,实现动态数据结构的创建,可以保证在原批数据中最新的更新在进行排序后仍旧是在旧的更新后面,然后去重操作,去掉多余的旧更新保留最新的更新,去重之后再把每一段无重复数据的序列插入该段对应的节点内,完成对整个自适应基数树的创建,其次基于GPU并行计算能力,可以并行进行对数据的插入、查询、删除操作。

Patent Agency Ranking