子图匹配方法、系统、电子设备及存储介质

    公开(公告)号:CN118898287A

    公开(公告)日:2024-11-05

    申请号:CN202410921060.0

    申请日:2024-07-09

    Abstract: 本说明书的一个或多个实施例涉及信息技术领域,具体涉及一种子图匹配方法、系统、电子设备及存储介质。方法包括:读入预先制作的数据图的边表及模式图;制作模式图的节点聚合边表,提取节点聚合边表中的全部聚合节点及其对应的边;遍历节点聚合边表中的每个聚合节点,从边表中找到聚合节点对应的边的嵌入集合,全部嵌入集合记为节点嵌入集;以节点嵌入集涉及的节点为列,将节点嵌入集展开为节点表;获得全部节点表的自然连接结果,基于所述自然连接结果获得子图的匹配结果。

    混合专家模型训练的性能优化方法和装置

    公开(公告)号:CN114429195B

    公开(公告)日:2024-07-19

    申请号:CN202210071043.3

    申请日:2022-01-21

    Applicant: 清华大学

    Inventor: 翟季冬 何家傲

    Abstract: 本发明提供了一种混合专家模型训练的性能优化方法和装置,涉及神经网络技术领域,所述方法包括:在一次迭代计算前,对于所述混合专家模型中所有专家中的每一个,判定当前专家是否被设置为影子专家,若是,将当前专家添加至影子专家集合,继续判定下一个专家是否被设置为影子专家直至所有专家被判定完成。本发明能够提高混合专家模型的训练速度和效率,减少混合专家模型在训练时所耗费的资源。

    面向利用Python语言编写的不规则张量程序的优化方法及装置

    公开(公告)号:CN115220727B

    公开(公告)日:2024-05-28

    申请号:CN202210641142.0

    申请日:2022-06-07

    Applicant: 清华大学

    Inventor: 翟季冬 唐适之

    Abstract: 本发明提供一种面向利用Python语言编写的不规则张量程序的优化方法及装置,涉及数据处理技术领域。所述方法包括:通过前端转换将用户输入的由Python语言编写的不规则张量程序表示为抽象语法树;通过内联各抽象语法树,使所述不规则张量程序的各个张量计算函数中的循环和分支被一并优化;对内联得到的总抽象语法树进行程序变换,得到程序变换后的抽象语法树;对所述程序变换后的抽象语法树转换为硬件相关代码,并编译为包含有硬件指令的程序。所述装置执行上述方法。本发明实施例提供的面向利用Python语言编写的不规则张量程序的优化方法及装置,通过本发明提供的优化方法及装置,能改善计算机运行所述不规则张量程序时的内部性能。

    并行程序可扩展性瓶颈检测方法和计算装置

    公开(公告)号:CN114503084B

    公开(公告)日:2023-07-25

    申请号:CN202080035153.3

    申请日:2020-08-27

    Applicant: 清华大学

    Abstract: 提供了一种计算机执行的并行程序可扩展性瓶颈检测方法,包括:针对所述程序源码,构建程序结构图;基于采样技术在并行程序运行时收集性能数据,所述性能数据包括:程序结构图每个顶点的硬件计数器性能数据和通信顶点的进程间通信依赖性能数据;基于构建的程序结构图和采样收集的性能数据,以采集的性能数据填充程序结构图来构建程序性能图,程序性能图记录了每个进程的数据和控制依赖性以及进程间的通信依赖性;从程序性能图检测有问题的顶点,以及从有问题的顶点中的部分或者全部开始,通过进程中的数据/控制相关性边以及不同进程之间的通信相关性边进行反向跟踪,来检测自动扩展性瓶颈所处的顶点。

    子图匹配策略确定方法、子图匹配方法、子图计数方法和计算装置

    公开(公告)号:CN114600097A

    公开(公告)日:2022-06-07

    申请号:CN202080035169.4

    申请日:2020-08-27

    Applicant: 清华大学

    Abstract: 子图匹配策略确定方法(100)、子图匹配方法、计数方法和装置,匹配策略确定方法(100)包括:获得模式图(S110);对于模式图,生成多个限制集合,每个限制集合都能消除模式图的自同构中不同于模式图自身的所有其他自同构(S120);对于模式图,获得多个搜索顺序方案;将所述多个限制集合和所述多个搜索顺序方案组合,每一种组合称为一个配置(S140);使用性能预测模型对每个配置对应的子图匹配算法的计算量进行预测(S150);基于预测得到的计算量,确定一个或多个配置作为子图匹配策略(S160)。所述方法能够确定优化的子图匹配策略,减少冗余计算,高效准确地找到匹配的子图。提出使用容斥原理直接计数以减少冗余计算的匹配子图计数方案,极大提高了计算效率。

    张量程序优化方法及装置
    26.
    发明公开

    公开(公告)号:CN113703768A

    公开(公告)日:2021-11-26

    申请号:CN202110788296.8

    申请日:2021-07-13

    Applicant: 清华大学

    Abstract: 本发明提供了一种张量程序优化方法及装置,方法包括:对待优化的张量程序进行划分生成线性的张量子程序;按预设的算子集合生成所述的子程序的突变程序;对子程序的突变程序中不等价的突变程序进行纠错处理以使各突变程序均与对应的子程序等价;从纠错处理后的突变程序中选取最优子程序进行拼接生成优化后的张量程序。本发明对待优化的张量程序进行划分生成线性的张量子程序,减少需要探索的搜索空间,将各子程序的突变以最优的方式组合成一个完整的张量程序,可以使张量程序的执行更加高效。

    存储系统基准评测程序生成方法及装置

    公开(公告)号:CN104850411B

    公开(公告)日:2018-06-22

    申请号:CN201510315936.8

    申请日:2015-06-10

    Applicant: 清华大学

    Abstract: 提供了存储系统基准评测程序生成方法和装置,属于高性能计算性能评测领域。存储系统基准评测程序生成方法包括:从规范化后的源程序获得中间代码;识别中间代码中的切片起点;基于识别得到的切片起点进行静态程序切片;以及基于得到的各个静态程序切片生成精简代码。该方法基于程序切片技术,通过在编译器中分析数据依赖、控制依赖和通信依赖,自动抽取所有和输入输出相关的语句操作,组成一个可编译、可运行、人工可读、可移植的精简程序代码。该精简程序可忠实地反映原始应用程序的输入输出负载特征,且执行该精简程序需要更少的时间和资源,方便快速评测。对于快速评测高性能存储系统的性能、辅助存储系统设计,本精简程序生成方法十分有效。

    混合网络系统、通信方法和网络节点

    公开(公告)号:CN104184828B

    公开(公告)日:2018-05-11

    申请号:CN201410455171.3

    申请日:2014-09-09

    Applicant: 清华大学

    Abstract: 提供了混合网络系统、通信方法和网络节点。混合网络系统包括点对点网络和广播网络的组合网络体系架构,点对点网络具有多个点对点信道,每个网络节点能够经由点对点信道将消息发送到对应的网络节点或者从对应的网络节点接收消息;广播网络具有多个广播信道,每个广播信道同时最多只能有一个发送者,但能够有多个接收者;至少部分网络节点具有发送要广播的消息的能力,至少部分网络节点具有接收广播的消息的能力,至少一些网络节点被配置为至少根据自身要执行的通信任务,选择广播网络或点对点网络来完成要执行的通信任务。优选每个网络节点均具有发送和接收广播的消息的能力。本发明实施例的混合网络系统具有高灵活性和高通信性能。

    一种作业调度方法和计算装置

    公开(公告)号:CN103810037B

    公开(公告)日:2017-02-15

    申请号:CN201410012660.1

    申请日:2014-01-10

    Applicant: 清华大学

    Abstract: 本发明提供了一种作业调度方法和计算装置,该方法包括:在检测到计算资源不足以运行当前的队首作业时,计算相应的回填窗口;缩短非队首作业对应的运行时间估计,并根据缩短后的运行时间估计判断所述非队首作业是否能够回填,并在判断为是时,将相应的非队首作业回填;在回填窗口结束且剩余计算资源不足以运行当前的队首作业时,停止当前运行的回填作业,并针对-被终止的回填作业设置检查点;并在再次重启所述回填作业时,根据所述回填作业中的检查点执行未完成部分的计算任务。采用本发明提供的作业调度方法,能够提高系统资源的利用率,减少作业的等待时间。

    基于高性能平台的并行程序性能数据采集方法及装置

    公开(公告)号:CN103077080B

    公开(公告)日:2015-08-12

    申请号:CN201310005536.8

    申请日:2013-01-07

    Applicant: 清华大学

    Abstract: 本发明提出一种基于高性能平台的并行程序性能数据采集方法及装置。其中,方法包括:S101:设置控制参数;S102:运行待采集的程序;S103:获取当前运行的程序的函数调用上下文;S104:通信插装模块对程序进行插装,采集程序的通信性能数据,并对应到触发插装的程序函数调用上下文;S105:中断程序的运行;S106:通过计算采样模块对程序进行采样,采集程序的计算性能数据,并对应到采样捕获的程序函数调用上下文;S107:恢复程序的运行;S108:步骤S104到S107直到采集全部通信性能数据和计算性能数据;S109:对通信性能数据和计算性能数据进行整理并输出。根据本发明实施例的方法,通过合理的采样和插装混合的方式,避免采集开销与通信性能数据和计算性能数据量过大。

Patent Agency Ranking