-
公开(公告)号:CN119476419A
公开(公告)日:2025-02-18
申请号:CN202411615432.3
申请日:2024-11-13
Applicant: 哈尔滨工业大学
Abstract: 本发明公开了一种多加速器异构SoC平台上深度学习负载映射优化方法及系统,涉及计算机性能能耗协同优化技术领域,用以提高深度学习推理应用的性能同时降低能耗。本发明的技术要点包括:首先提取有性能或能耗优化潜力的子网络;接着测量融合节点和子网络的性能和能耗数据;再建立解析的性能和能耗预测模型,以预测不同映射配置下推理引擎的运行时间和能耗;之后使用基于变长滑动窗口的映射优化算法搜索性能‑能耗更优的映射配置;最后生成推理引擎并遍历搜索最优的CUDA stream数量。本发明无需用户干预,可以全自动地找到性能‑能耗更优的映射配置并生成推理引擎。与现有的JEDI等方法相比,本发明性能提升更多,能耗节省也更多,同时优化过程所需时间也更短。
-
公开(公告)号:CN112083929B
公开(公告)日:2024-04-19
申请号:CN202010918175.6
申请日:2020-09-03
Applicant: 哈尔滨工业大学
IPC: G06F8/41 , G06F8/71 , G06F1/3234
Abstract: 一种面向功率约束系统的性能‑能耗协同优化方法及装置,属于高性能计算技术领域,用以解决高性能计算中系统总体运行过程中能耗过大的问题。本发明主要通过机器学习模型预测并在OpenMP并行域级别进行功率上限设置来优化程序运行的能耗和性能,本发明包括数据采集、模型训练和代码优化三个部分,其中,数据采集包括从OpenMP并行程序中提取模型训练所需要的特征数据;模型训练包括根据功率配置和提取的特征数据对性能和能耗进行建模训练;代码优化包括根据训练得到的模型获取最优功率配置,并根据最优功率配置进行代码优化。本发明有助于通用的并行应用程序进行资源的合理利用,提高效率,同时也有助于云计算、物联网等功率约束场景下提高能量的利用率。
-
公开(公告)号:CN112083956B
公开(公告)日:2022-12-09
申请号:CN202010971038.9
申请日:2020-09-15
Applicant: 哈尔滨工业大学
Abstract: 一种面向异构平台的复杂指针数据结构自动管理系统,涉及异构编程技术领域。本发明为了实现OpenMP Offloading程序中复杂指针数据结构在异构计算平台上的自动管理并保证数据一致性。本发明包括:信息收集模块,用于对源程序的静态分析及程序信息收集;自动转换模块,主要负责根据变量类型的不同,在适当位置修改源码并插入合适的运行时API;运行时模块,主要负责使用cudaMallocManaged( )和cudaFree( )重新实现C++标准的内存管理操作并向外提供接口。本发明可以自动管理OpenMP Offloading程序中复杂指针数据结构在CPU和GPU内存之间的内存分配、释放以及数据传输,并保证数据一致性;从而为OpenMP Offloading程序开发提供便利。
-
公开(公告)号:CN113448425B
公开(公告)日:2022-09-09
申请号:CN202110810963.8
申请日:2021-07-19
Applicant: 哈尔滨工业大学
IPC: G06F1/3234 , G06F9/50 , G06N20/00
Abstract: 一种基于强化学习的动态并行应用程序能耗运行时优化方法及系统,属于并行程序能耗优化技术领域,目的是自动地优化并行应用程序的能耗,并且不需要领域专家知识,对程序是透明的。本发明的技术要点包括:程序的阶段根据工作负载的特征,分为计算密集阶段和内存密集阶段,根据应用程序不同的实时工作负载特征,动态调整处理器功率配置,使硬件功率配置文件与运行时动态变化的程序阶段匹配;通过强化学习算法自动探索功率配置空间,根据环境反馈的奖惩信息,不断优化配置空间;最后,根据自动学习到的策略动态调整功率配置以匹配不断变化的程序阶段。本发明实现了自动且动态的并行程序
-
公开(公告)号:CN107463430A
公开(公告)日:2017-12-12
申请号:CN201710656895.8
申请日:2017-08-03
Applicant: 哈尔滨工业大学
IPC: G06F9/455
Abstract: 本发明涉及虚拟机内存管理领域,具体涉及一种基于内存和Swap空间的虚拟机内存动态管理系统及方法,本发明为了解决现有的虚拟机内存调度算法在使用Swap空间时会造成系统性能损耗,并且在虚拟机内存监控中仅使用带内监控,使得虚拟机运行性能降低、安全隐患高的缺点,而提出一种基于内存和Swap空间的虚拟机内存动态管理系统及方法。本发明的系统包括设置在特权域中的监控模块、计算模块以及执行模块,其中监控模块用于向虚拟机发出待读取数据的地址,并接收虚拟机返回的待读取数据;还用于将待读取数据发送至计算模块。计算模块用于计算应当为虚拟机分配的目标内存大小。执行模块用于根据目标内存大小,调节虚拟机的内存。本发明适用于内存动态管理工具。
-
公开(公告)号:CN117240560A
公开(公告)日:2023-12-15
申请号:CN202311240301.7
申请日:2023-09-25
Applicant: 哈尔滨工业大学
IPC: H04L9/40 , H04L41/14 , H04L41/16 , G06N3/0475 , G06N3/094
Abstract: 本发明公开了一种基于GAN的高仿真蜜罐实现方法及系统,涉及网络安全技术领域。本发明的技术要点包括:获取攻击者请求报文;利用基于GAN的高仿真蜜罐对攻击者请求产生正确应答,进而生成响应报文;其中,基于GAN的高仿真蜜罐依靠响应生成模型生成响应报文,所述响应生成模型的构建包括数据预处理与模型训练;数据预处理的步骤包括:特定协议流量的提取;提取数据包的六元组;以流划分数据包集合;特定协议数据载荷提取;请求载荷分类;响应载荷编码。本发明提高了平均交互次数且缓解了因服务模拟不到位造成无法深入交互的问题,具有较高仿真度。
-
公开(公告)号:CN117217295A
公开(公告)日:2023-12-12
申请号:CN202311176924.2
申请日:2023-09-13
Applicant: 哈尔滨工业大学
Abstract: 本发明公开了一种基于节点选择的异构图迁移学习方法,涉及迁移学习技术领域,用以对源网络中的节点进行数值量化评估并选择与目标网络更相关且具有高质量的节点,进而提高模型在目标网络上的性能。本发明的技术要点包括:利用特定语义的特征提取器聚合基于元路径的邻居信息,用特定语义的分类器对不同语义的特征表示进行分类,同时使用最大均值差异距离和L2正则化来对齐源网络和目标网络的分布,将得到的选择向量加入到各损失函数中,来学习具有标签可分辨性和跨网络一致性的节点嵌入表示,用于对目标网络中的节点进行标签分类预测,所述方法包括三部分,即特征提取、节点标签分类和分层域对齐。实验结果显示本发明相对于基线方法表现更显著。
-
公开(公告)号:CN112083956A
公开(公告)日:2020-12-15
申请号:CN202010971038.9
申请日:2020-09-15
Applicant: 哈尔滨工业大学
Abstract: 一种面向异构平台的复杂指针数据结构自动管理系统,涉及异构编程技术领域。本发明为了实现OpenMP Offloading程序中复杂指针数据结构在异构计算平台上的自动管理并保证数据一致性。本发明包括:信息收集模块,用于对源程序的静态分析及程序信息收集;自动转换模块,主要负责根据变量类型的不同,在适当位置修改源码并插入合适的运行时API;运行时模块,主要负责使用cudaMallocManaged( )和cudaFree( )重新实现C++标准的内存管理操作并向外提供接口。本发明可以自动管理OpenMP Offloading程序中复杂指针数据结构在CPU和GPU内存之间的内存分配、释放以及数据传输,并保证数据一致性;从而为OpenMP Offloading程序开发提供便利。
-
公开(公告)号:CN110377525A
公开(公告)日:2019-10-25
申请号:CN201910680598.6
申请日:2019-07-25
Applicant: 哈尔滨工业大学
IPC: G06F11/36
Abstract: 一种基于运行时特征和机器学习的并行程序性能预测系统,属于并行程序性能预测的技术领域。本发明为了解决基于机器学习的并行程序性能预测系统存在开销比较大、预测时间长,而且准确率较低的问题。对原始程序进行混合插桩,减少基本块计数器,然后将程序删减成没有输入结果的串行程序,减少程序的运行时间的同时保留程序执行的流程,准确快速地获取到基本块频率,预处理这些数据,输入预测模型中,最后输出大规模并行程序的执行时间。本发明生成的模型具有很强的泛化能力,能够准确地预测大规模并行程序的执行时间,并且预测开销很小。
-
公开(公告)号:CN105224452B
公开(公告)日:2018-03-16
申请号:CN201510578802.5
申请日:2015-09-11
Applicant: 哈尔滨工业大学
IPC: G06F11/36
Abstract: 一种针对科学计算程序静态分析性能的预测代价优化方法,本发明涉及针对科学计算程序静态分析性能的预测代价优化方法。本发明是要解决静态分析方法的预测代价大,引入误差的问题而提出的一种针对科学计算程序静态分析性能的预测代价优化方法。该方法是通过一、得到中间代码IR;步骤二、利用删减方法对中间代码IR进行依赖分析计算,得到依赖图;步骤三、利用剪枝方法的过滤函数将依赖图进行过滤,得到剪枝后的依赖图;步骤四、得到删除后的中间代码等步骤实现的。本发明应用于针对科学计算程序静态分析性能的预测代价优化方法领域。
-
-
-
-
-
-
-
-
-