基于元学习和强化学习结合的异构GPU资源调度方法和系统

    公开(公告)号:CN119599857A

    公开(公告)日:2025-03-11

    申请号:CN202411641402.X

    申请日:2024-11-18

    Abstract: 本发明涉及一种基于元学习和强化学习结合的异构GPU资源调度方法与系统,旨在提高大模型训练与推理中的计算资源利用效率,提升任务的适应能力和系统的响应速度。本发明通过任务特征提取、元学习策略初始化、强化学习调度优化、任务调度执行、动态策略调整五个步骤来实现GPU资源的高效调度。其中,元学习模块利用历史任务积累的知识,生成初始调度策略,减少了探索时间;强化学习模块通过环境反馈不断优化调度策略,实现任务的高效分配。系统能够根据不同任务需求和GPU硬件资源的动态变化自适应调整策略,从而实现更高的资源利用率和整体性能优化。

    卷积神经网络的并行优化方法

    公开(公告)号:CN110163333A

    公开(公告)日:2019-08-23

    申请号:CN201810021291.0

    申请日:2018-01-10

    Abstract: 本发明涉及一种卷积神经网络的并行优化方法,其包括:用winograd算法f(2x2,3x3)进行卷积神经网络的卷积核运算,以降低时间复杂度并减少乘法运算次数;对不存在循环数据依赖的for循环结构部分,使用OpenMP开辟多个线程进行运算;对模式相同的数据运算部分进行向量化处理,使其能够实现一次指令多次运算。采用本发明的方法改进的卷积神经网络程序能够大幅度提高并行的效率、减少运算的复杂度,从根本上降低运算开销,降低程序的运行时间。

    基于CPU加速的波场正演模拟优化方法

    公开(公告)号:CN110162804A

    公开(公告)日:2019-08-23

    申请号:CN201810021270.9

    申请日:2018-01-10

    Abstract: 本发明公开了一种基于CPU加速的波场正演模拟优化方法,其包括以下步骤:S1)提出波场正演具体物理模型;S2)进行数值建模;在空间维度上使用高阶差分来模拟二阶微分,从而减小内存的使用;在时间维度上减少延拓步长;S3)进行静态分块及分配:根据线程数量k,将图像沿长边方向平均分成k个子图,然后将其按顺序标记后作为基础子图;S4)并行化及通信时间隐藏;S5)模型拆分和任务分解。本发明能够有效提高波场正演模拟的计算速度,并且能动态分块调配节点,从模型分块和通信时间隐藏两个方面优化,进行并行加速,充分利用多核计算资源,并有效的同步模拟实际物理传播过程。

    基于并行超算网格云平台的GRAPES系统优化方法

    公开(公告)号:CN108132872A

    公开(公告)日:2018-06-08

    申请号:CN201810021292.5

    申请日:2018-01-10

    Abstract: 本发明涉及一种基于并行超算网格云平台的GRAPES系统优化方法,其包括:S1)载入测试数据集并运行系统,分别进行系统级测试、通信级测试和函数级测试,其包括:S1.1)系统级测试;S1.2)通信级测试;S1.3)函数级测试:对调用的函数进行监控,获取函数的运行特征。S2)根据导出的系统特征文件进行测试结果分析,其包括:S2.1)系统测试结果分析;S2.2)MPI通信级测试结果分析;S2.3)函数级测试结果分析。S3)根据分析结果进行优化处理,优化处理包括:向量化、负载均衡、使用库函数替代GRAPES_GFS中的函数。本发明解决了Grapes在并行超算网格平台上的优化问题,提高了系统运行效率。

    一种用于工业软件的Python代码远程调试方法及系统

    公开(公告)号:CN117667672A

    公开(公告)日:2024-03-08

    申请号:CN202311504111.1

    申请日:2023-11-13

    Abstract: 本发明公开了一种用于工业软件的Python代码远程调试方法及系统,用来满足工业软件在不同运行环境下对内嵌的Python程序进行图形化调试的需求。所述系统包括调试器与脚本解释器,脚本解释器包括本地解释器和远程解释器,其中,本地解释器设置于调试器端,远程解释器设置于工业软件端,调试器与工业软件之间具有通信连接。本发明提供的技术方案可在运行时对Python脚本解释器进行本地或远程调试。并且,调试器以实时的方式,允许开发者逐行查看程序的执行流程和状态,降低了人为开发的错误几率。此外,程序可以在运行时调试,能够更快地定位和解决问题,减少故障排除的时间。

    作业管理及评分信息处理方法、系统、互评抽阅仲裁方法

    公开(公告)号:CN112581332B

    公开(公告)日:2021-12-28

    申请号:CN202011621540.3

    申请日:2020-12-30

    Abstract: 本发明属于教育信息处理技术领域,公开了一种作业管理及评分信息处理方法、系统、互评抽阅仲裁方法,完成客观题的机器评阅并生成综合题互评任务队列和互评执行人队列、基于评阅者总人数计算评阅小组的数量;计算评阅小组中每位真实评阅者的实际工作量;根据实际工作量给各个评阅小组中的成员分配评阅任务;各评阅者完成分配的评阅任务后自愿进行奖励任务的领取,系统将记录奖励任务完成情况;将在互评截止后,通过二元语义计算模型整合各道题目的打分情况,生成互评得分,同时开放仲裁申诉平台;提供给学生对互评题目提起申诉的通道,同时整合教师仲裁结果,重新生成最终得分。本发明能合理有效进行任务分配,保证了最终评分的客观合理。

    数据中心内流量带宽可约束的虚拟机动态聚合方法

    公开(公告)号:CN107124377A

    公开(公告)日:2017-09-01

    申请号:CN201710279067.7

    申请日:2017-04-25

    Abstract: 本发明涉及一种数据中心内流量带宽可约束的虚拟机动态聚合方法,其包括以下步骤:对初始状态虚拟机针对计算资源进行多级聚合;建立流量代价模型;定义聚团内交互流量ICIT以及聚团外交互流量ECIT;定义数据中心虚拟机聚合过程中总的流量交互代价;使用全局流量模型来描述任意初始虚拟机i和j之间的交互流量Tij;统计系统内当前所有等效虚拟机连通度;统计系统内当前所有等效虚拟机的经过转换系数转换的ICIT和ECIT;使用DWMTR进行虚拟机三级聚团操作;选出ECIT/ICIT值最大的等效虚拟机,测试是否能通过将其与其余核心交换机控制域内的ICIT/ECIT值升序排列的等效虚拟机对调;选用首次满足对调条件的等效虚拟机进行对调;重复前述过程,直至系统内所有虚拟机完成位置调整。

    基于CPU加速的波场正演模拟优化方法

    公开(公告)号:CN110162804B

    公开(公告)日:2020-01-21

    申请号:CN201810021270.9

    申请日:2018-01-10

    Abstract: 本发明公开了一种基于CPU加速的波场正演模拟优化方法,其包括以下步骤:S1)提出波场正演具体物理模型;S2)进行数值建模;在空间维度上使用高阶差分来模拟二阶微分,从而减小内存的使用;在时间维度上减少延拓步长;S3)进行静态分块及分配:根据线程数量k,将图像沿长边方向平均分成k个子图,然后将其按顺序标记后作为基础子图;S4)并行化及通信时间隐藏;S5)模型拆分和任务分解。本发明能够有效提高波场正演模拟的计算速度,并且能动态分块调配节点,从模型分块和通信时间隐藏两个方面优化,进行并行加速,充分利用多核计算资源,并有效的同步模拟实际物理传播过程。

    基于方势阱模型的量子行为粒子群优化方法

    公开(公告)号:CN107146411A

    公开(公告)日:2017-09-08

    申请号:CN201710416981.1

    申请日:2017-06-06

    CPC classification number: G08G1/0125 G06N3/006 G08G1/0145

    Abstract: 本发明涉及入口匝道交通流PI控制器参数取值的优化问题,尤其是基于方势阱模型的量子行为粒子群优化方法,建立了原QPSO算法中r1与r2的相关性描述,具体描述方法为二元正态Copula函数联合三种特殊的Copula,根据Copula函数的定义和Sklar定理,可以得到二元因子r1,r2的相关性描述公式。本发明有益效果:本发明使用BC‑QSPSO算法优化入口匝道IP控制器参数后,实际车流密度可以很好的跟踪期望车流密度,σi(k)与σdi(k)之间的误差很小,通过对入口匝道调节率的控制可以在保证主路交通通畅的情况下最大限度的提高主路使用率。在时效性方面,BC‑QSPSO算法具有较快的收敛速度。

    一种基于Python的绘图领域语言设计方法及系统

    公开(公告)号:CN119829029A

    公开(公告)日:2025-04-15

    申请号:CN202411615771.1

    申请日:2024-11-13

    Abstract: 本发明属于绘图领域特定语言领域,公开了一种基于Python的绘图领域语言设计方法及系统,该方法利用在Python已发布的textx定义领域特定语言(DSL)并生成相应的抽象语法树(AST),通过解释器将语法和元模型实例化,得到整个绘图场景对象,解释器按照元模型为规则解析绘图语言语法中的指令,调用Python的Turtle图形库来绘制图像。本发明基于Python的绘图领域语言,从零开始构建一个用于绘制形状的DSL,为用户提供更加个性化的绘图体验,丰富用户绘图的途径。

Patent Agency Ranking