一种基于SLURM调度的算法集成与评测平台及方法

    公开(公告)号:CN103593192A

    公开(公告)日:2014-02-19

    申请号:CN201310585227.2

    申请日:2013-11-19

    Applicant: 湖南大学

    Abstract: 本发明公开了一种基于SLURM调度的算法集成与评测平台及方法,该平台包括封装模块、调度接口模块、上传下载模块、编译模块、算法集成模块及算法性能统计模块。在SLURM中心守护进程和监控进程运行过程中,利用该平台用户可动态的进行调度方法集成。当用户使用该平台的时候,只需要了解平台封装模块下提供的公共变量、结构体以及基础函数库文件,实现平台对外的两个子函数接口网上提交至服务器即可,无需关心该软件其它部分的源码以及平台中各个模块的协作关系,使SLURM开发人员或者高性能计算用户更方便的集成各自的调度算法而忽略对该软件其它模块源码的研究,在真实的环境下检测算法的性能、灵活运用各种调度算法。

    加速卡算子适配方法、装置、计算机设备、存储介质

    公开(公告)号:CN119539036A

    公开(公告)日:2025-02-28

    申请号:CN202411445088.8

    申请日:2024-10-16

    Applicant: 湖南大学

    Abstract: 本申请涉及一种加速卡算子适配方法、装置,通过将算子源代码放入预定文件夹;将所述算子源代码转化为抽象语法树AST;根据所述抽象语法树AST,利用MLIR工具生成Looplet dialect;根据加速卡的架构,在所述Looplet dialect内对加速卡算子进行优化;通过MLIR工具将所述Looplet dialect转换为affine dialect;基于所述affine dialect,采用多面体模型对所述加速卡算子进行优化;通过MLIR工具将所述affine dialect转化为llvm dialect;通过LLVM工具将llvm dialect转化为llvm IR;利用LLVM下LLC工具将llvm IR编译为可执行二进制文件。解决了现有技术不同架构的国产加速卡需要构建不同的算子,成本高,效率低的技术问题,达到了同一套算子源码优化后部署到不同架构的国产加速卡上,适配性高,成本低,效率高的技术效果。

    数据集的中值近似值查找方法、装置和计算机设备

    公开(公告)号:CN114860811B

    公开(公告)日:2024-09-17

    申请号:CN202210572598.6

    申请日:2022-05-25

    Applicant: 湖南大学

    Abstract: 本申请涉及一种数据集的中值近似值查找方法、装置和计算机设备。所述方法包括:获取当前的待处理数组和预定义的近似中值查找事件的当前状态,根据近似中值查找事件的当前状态,确定待处理数组的均值和标准差,构建累积频率分布表,基于累积频率分布表和上述事件的当前状态,查找出中值近似值所在的数据分组,确定待处理数组的中值近似值,并将均值、标准差、中值近似值以及中值近似值所在的数据分组的位置标识传递给下一数组,若上述事件的当前状态为第一状态,则将第一状态切换为第二状态,返回获取待处理数组和预定义的近似中值查找事件的当前状态的步骤,直至查找出数据集中所有数组的中值近似值。采用本方法能提高近似中值查找效率。

    调度任务的生成方法、装置、计算机设备和存储介质

    公开(公告)号:CN118093112A

    公开(公告)日:2024-05-28

    申请号:CN202311549618.9

    申请日:2023-11-20

    Applicant: 湖南大学

    Abstract: 本申请涉及一种调度任务的生成方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括:获取神经网络模型中各网络层的模型参数,以及用于运行神经网络模型的运算核心对应的核心参数,根据神经网络模型中各网络层的连接方向,生成调度任务,根据各网络层的模型参数、核心参数以及初始调度关系,对调度任务的执行时长进行预测,得到调度任务的预测时长;调整调度任务中的初始调度关系,直到满足调整停止条件,将调整得到的预测时长最短的调度任务,确定为待执行的目标调度任务,该方法,调整调度任务中初始调度关系,通过选择预测时长的调度任务作为待执行的目标调度任务,快速得到待执行的目标调度任务,提高了调度任务生成效率。

    图神经网络生成方法、装置、计算机设备、介质和产品

    公开(公告)号:CN117892764A

    公开(公告)日:2024-04-16

    申请号:CN202311817973.X

    申请日:2023-12-26

    Abstract: 本申请涉及一种图神经网络生成方法、装置、计算机设备、存储介质和计算机程序产品。包括:在图神经网络的训练过程中,通过图神经网络获取图拓扑数据的平均度数,并确定图拓扑数据的邻接矩阵;在平均度数满足度数条件的情况下,基于平均度数确定图拓扑数据的图划分力度;基于按图划分力度对邻接矩阵进行划分确定的各顶点的邻接点数量,对各顶点进行排序,得到各顶点的排序结果;基于通过排序结果确定的动态邻居划分表,将图拓扑数据的多个子特征分别与邻接矩阵依次进行聚合,得到各子特征的子聚合结果;将各子聚合结果进行整合处理,输出图拓扑数据对应的聚合结果,基于聚合结果,生成训练后的图神经网络。采用本方法可加速图神经网络的训练速度。

    超声图像的处理方法、装置、计算机设备和存储介质

    公开(公告)号:CN117710432A

    公开(公告)日:2024-03-15

    申请号:CN202311650043.X

    申请日:2023-12-05

    Applicant: 湖南大学

    Abstract: 本申请涉及一种超声图像的处理方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括:获取多个超声切面图像,自动对各超声切面图像进行抓取,并按照超声切面图像中每一解剖结构各自的评分结果,从各超声切面图像中筛选出标准切面图像,无需医生手动对超声切面图像进行保存,提高了目标结构的厚度测量效率的同时,得到准确的标准切面图像。按照标准切面图像中目标解剖结构的轮廓特征,对目标解剖结构的轮廓进行腐蚀处理,得到目标解剖结构的骨架线,遍历骨架线上的各目标点,并根据通过目标点的法线和目标解剖结构的轮廓之间的相交点,确定目标解剖结构的厚度值,无需手动对厚度值进行标注,节省人工处理时间。

    知识图谱嵌入模型的训练方法、装置、计算机设备

    公开(公告)号:CN113568987B

    公开(公告)日:2024-01-26

    申请号:CN202110862705.4

    申请日:2021-07-29

    Applicant: 湖南大学

    Abstract: 本申请涉及一种知识图谱嵌入模型的训练方法、装置、计算机设备和存储介质。方法包括:获取作为训练样本的知识图谱输入图,对知识图谱输入图进行初步分区,得到两个分区,根据分区结果确定切边顶点;根据关键边和一般边,计算各切边顶点的增益值;当切边顶点的增益值大于预设值时,确定切边顶点位于关键路径上且切边顶点与关键路径不在同一分区,将切边顶点从原分区移动至另一分区,得到最终分区结果;对最终分区结果进行参数化处理,得到知识图谱的实体嵌入参数和关系嵌入参数的训练样本集;使工作节点根据训练样本集对知识图谱嵌入模型进行模型训练,得到训练后的知识图谱嵌入模型。采用本方法能够完善知识图谱嵌入模型推理组合关系能力。

    索引构建方法、装置、计算机设备和存储介质

    公开(公告)号:CN113449153B

    公开(公告)日:2023-09-26

    申请号:CN202110720858.5

    申请日:2021-06-28

    Applicant: 湖南大学

    Abstract: 本申请涉及一种索引构建方法、装置、计算机设备和存储介质。所述方法包括:获取DAG图和DAG图的分区结果,将DAG图按照分区结果存储至预设分布式图计算系统,得到各DAG分区的图数据结构,对各DAG分区中的顶点进行排序,并行构建各DAG分区的内部点的2‑hop索引和边界点的2‑hop索引,重构各DAG分区的边界点的之间路径,根据各DAG分区的图数据结构和各DAG分区的边界点之间的路径,构建边界图,再基于边界图重构边界点的2‑hop索引,并将重构后的边界点的2‑hop索引划分至各边界点所在的DAG分区。采用本方法构建的索引进行分布式批量可达性查询,能够提高查询效率。

    一种用于图划分的边划分方法
    39.
    发明公开

    公开(公告)号:CN116340576A

    公开(公告)日:2023-06-27

    申请号:CN202310191932.8

    申请日:2023-03-02

    Applicant: 湖南大学

    Abstract: 本发明提供了一种用于图划分的边划分方法,首先加载待划分的图后计算出划分边界值;然后对图进行展开获得转换图,同时对转换图创建并查集和优先队列;接着依照贪心策略对边进行折叠,并对满足划分边界值的子图进行划分;最后当优先队列为空时,将剩下子图组合形成规模并划分。本发明通过实际采用点划分,本质使用边划分方法对图进行划分可以同时达到划分简单和负载均衡的优点;除此之外,本发明采用的是在贪心策略下对边进行折叠,因此空间上相邻的边倾向于折叠在同一子图中,因此能够尽可能减少结点的复制次数,进而减少通信开销。

    基于YOLOv5改进的目标检测方法及装置、训练方法

    公开(公告)号:CN116310899A

    公开(公告)日:2023-06-23

    申请号:CN202310180011.1

    申请日:2023-02-14

    Applicant: 湖南大学

    Abstract: 本申请涉及一种基于YOLOv5改进的目标检测方法及装置、训练方法。目标检测方法包括:将各关键特征提取层输出的加权主干特征输入到特征融合模块指定的关键特征融合节点,将加权主干特征与原始FPN融合特征进行再次融合,得到目标融合特征;并增加一个子检测网络,将最浅层次关键特征提取层获得的高分辨率特征进行加权和再融合,得到高细节特征,并将高细节特征输入到新的小检测头和特征融合模块中;通过各检测头输出各待检测图像的预测框,得到待检测图像的目标检测结果;在网络训练过程中,引入了考虑角度损失等多种损失的SIOU损失函数;采用本方法能够提高小目标检测的准确性。

Patent Agency Ranking