-
公开(公告)号:CN112000845A
公开(公告)日:2020-11-27
申请号:CN202010835717.3
申请日:2020-08-19
Applicant: 东北大学
IPC: G06F16/901 , G06F16/245
Abstract: 本发明提供一种基于GPU加速的超空间哈希索引方法。针对key-value数据库,构建超空间哈希数据结构,使超空间哈希更好地适应GPU,在超空间哈希数据结构中,使用数组结构体而不是结构体数组的数据布局,其中键、次要属性和值分别存储;该数据结构更适合于GPU的线程执行模型和内存层次结构;对于批处理查询,使用通过查询分类来减少分支分歧的warp预组合数据共享策略,而且为了进一步提高超空间哈希数据结构的性能,用原子操作代替加锁,并设计了一种暂时重复读取策略来提高GHSH的性能,实现了无锁的全并发策略;最后,基于超空间哈希数据结构,实现了批量构建、按键搜索、按次要属性搜索、修改、插入和删除的操作。
-
公开(公告)号:CN112989706B
公开(公告)日:2023-09-29
申请号:CN202110354200.7
申请日:2021-04-01
Applicant: 东北大学
IPC: G06F30/27 , G06F119/04
Abstract: 本发明公开了一种隧道灯具照度衰减预测方法,选择使用递归特征消除(Recursive feature elimination)算法;基于全部特征进行训练;特征被消除的顺序即为特征的重要性排序,由于LSTM设计的循环结构的要求,需要输入特征向量组成的序列数据,构造样本数据集,利用LSTM模型来根据过去的一段时间数据来预测未来一段时间的数据,选定时间滞后组成的样本数据集后,使用一定时间范围的数据作为训练集,所有参数训练完成后,选用相关系数最高且绝对误差最小的模型作为最优预测模型。本发明以达到预测隧道灯具亮度衰减到照明细则规定的阈值的时间,从而提醒维修人员及时更换灯具,防止车辆进入隧道时安全事故发生。
-
公开(公告)号:CN113204552A
公开(公告)日:2021-08-03
申请号:CN202110484541.6
申请日:2021-04-30
Applicant: 东北大学
IPC: G06F16/22 , G06F16/245
Abstract: 本发明提供一种基于编码树的GPU轴心子图匹配方法,对每个节点进行压缩编码,首先将节点的标签、度和邻居结构融入到多棵不同的编码树中,然后计算每个编码树的特征向量并保存,在查询图中仅需要比较查询图节点与数据图节点的特征向量编码,即可将数据图中的无效节点进行大规模的过滤,大大缩小了候选节点生成的搜索空间树的尺寸,加快了执行效率;本发明不仅在时间上对轴心子图匹配搜索进行了查询优化,而且对于计算资源和内存资源的消耗也大大减少。
-
公开(公告)号:CN112000846B
公开(公告)日:2021-07-20
申请号:CN202010836000.0
申请日:2020-08-19
Applicant: 东北大学
IPC: G06F16/901 , G06F16/903 , G06F16/245
Abstract: 本发明提供一种基于GPU分组LSM树索引的方法,涉及GPU数据库技术领域。本发明首先将数据进行预处理,当value为变长时,在GPU上进行查询时不能很好的利用缓存而且数据传输代价也会增大。本发明针对以上情况,将数据中的Key和Value进行分离,GPU中仅仅存放Value的地址,真正的Value存放在内存中。针对LSM插入速度慢的问题,本发明将原来的LSM树每一层分为多个组,每个组都是一个有序数组,合并到下一层的时候通过GPU上大量的线程并行的归并。由于将LSM树进行分组,意味着查询需要花费更高的代价。为了提高查询速度,本发明在GPU上设计了一种适应于GPU结构的布隆过滤器,通过布隆过滤器减少了大量不必要的查询开销。
-
公开(公告)号:CN112000847A
公开(公告)日:2020-11-27
申请号:CN202010836011.9
申请日:2020-08-19
Applicant: 东北大学
IPC: G06F16/901 , G06F16/245
Abstract: 本发明提供一种基于GPU并行的自适应基数树动态索引方法。首先构建自适应基数树数据结构,前两层创建Node256类型的树节点,第三、四层的创建基于高位优先的基数排序方法,根据分支的数量创建能容下对应大小的树节点,实现动态数据结构的创建,可以保证在原批数据中最新的更新在进行排序后仍旧是在旧的更新后面,然后去重操作,去掉多余的旧更新保留最新的更新,去重之后再把每一段无重复数据的序列插入该段对应的节点内,完成对整个自适应基数树的创建,其次基于GPU并行计算能力,可以并行进行对数据的插入、查询、删除操作。
-
公开(公告)号:CN106484539A
公开(公告)日:2017-03-08
申请号:CN201610894013.7
申请日:2016-10-13
Applicant: 东北大学
IPC: G06F9/50 , G06F12/0811
CPC classification number: G06F9/5011 , G06F12/0811
Abstract: 一种处理器缓存特性的获取方法,属于计算机软件技术领域,包括步骤1:使用超级页分配内存;步骤2:判断是否存在组竞争自适应替换策略;步骤3:选择需要执行的替换策略;步骤4:为不需要执行的组竞争自适应替换策略对应的专用组上生成选择序列;步骤5:执行选择序列;步骤6:为处理器缓存组生成检测序列;步骤7:为检测序列执行过程分配最高优先级;步骤8:执行检测序列,分析处理器缓存特性;本发明通过运行软件的方式获得处理器缓存上的硬件特性,无需使用额外设备;所使用的技术手段能够对现今多数主流处理器的缓存结构进行检测,且具有成本低、方便实施、使用范围广的优点。
-
公开(公告)号:CN118410830A
公开(公告)日:2024-07-30
申请号:CN202410091963.0
申请日:2024-01-23
Applicant: 东北大学
IPC: G06N3/042 , G06F16/901 , G06F17/16 , G06N3/0499 , G06N3/084
Abstract: 本发明提供一种基于图结构聚合的神经网络子图计数的方法,涉及子图同构技术领域,本发明首先对查询图和数据图进行顶点的遍历,记录每个顶点和其邻居节点所构成的图结构,然后将图结构转换为张量形式,参与到神经网络的迭代过程,最后对于不同查询图依次获得其在数据图中的子图匹配数目。本发明方法不仅丰富了节点的特征信息,且需较少的计算资源和存储空间,提升神经网络迭代阶段的执行效率,实现了减少聚合过程的计算量、减少计数误差的目的。
-
公开(公告)号:CN117911841A
公开(公告)日:2024-04-19
申请号:CN202410115782.7
申请日:2024-01-26
Applicant: 东北大学
IPC: G06V10/86 , G06T1/20 , G06F16/51 , G06F16/532 , G06F16/58
Abstract: 本发明设计一种基于核心节点的GPU连续子图匹配并行方法,属于子图同构技术领域;首先对查询图进行处理,获取其核心节点;同时对数据图进行时间标签的添加;将更新数据流进行分组,采用两步生成模式构建组内索引;使用核心节点构建候选匹配路径,非核心节点进行过滤的模式,获得每一次更新下的子图匹配结果;这种方式仅需要较少的计算资源和存储空间,就能实现基于核心节点的并行化的连续子图匹配,减少了计算量,提升了计算效率;本发明采用拥有大量计算单元的GPU完成连续子图匹配任务,由于预先找出了查询图的核心结构,能够利用有限的GPU内存空间加速连续子图匹配任务。
-
公开(公告)号:CN113191486B
公开(公告)日:2023-10-13
申请号:CN202110458807.X
申请日:2021-04-27
Applicant: 东北大学
IPC: G06N3/0442 , G06N3/098 , G06N3/084 , H04L67/10 , H04L67/1008
Abstract: 本发明公开一种基于参数服务器架构的图数据与参数数据的混合划分方法,首先将图顶点按广度优先遍历的方式重新处理编号,将顶点编号划分为大小相等的P个区间,取区间的中间值对应的顶点作为多个初始分区,然后基于图拓扑数据与顶点特征维度计算当前分区邻域顶点的代价分数,根据代价分数对邻域顶点进行排序,选取代价分数最小的多个邻域顶点加入当前分区,同时更新当前分区顶点特征权重向量。通过对比多个分区的顶点特征权重向量,将图神经网络模型参数按行划分至在计算时需要使用该参数行顶点的数量最多的分区中。适用于支持图神经网络算法的参数服务器系统,能够减少系统运行时的网络通信开销,加速系统计算效率。
-
公开(公告)号:CN113191486A
公开(公告)日:2021-07-30
申请号:CN202110458807.X
申请日:2021-04-27
Applicant: 东北大学
Abstract: 本发明公开一种基于参数服务器架构的图数据与参数数据的混合划分方法,首先将图顶点按广度优先遍历的方式重新处理编号,将顶点编号划分为大小相等的P个区间,取区间的中间值对应的顶点作为多个初始分区,然后基于图拓扑数据与顶点特征维度计算当前分区邻域顶点的代价分数,根据代价分数对邻域顶点进行排序,选取代价分数最小的多个邻域顶点加入当前分区,同时更新当前分区顶点特征权重向量。通过对比多个分区的顶点特征权重向量,将图神经网络模型参数按行划分至在计算时需要使用该参数行顶点的数量最多的分区中。适用于支持图神经网络算法的参数服务器系统,能够减少系统运行时的网络通信开销,加速系统计算效率。
-
-
-
-
-
-
-
-
-