一种基于块级别云存储负载均衡优化的方法

    公开(公告)号:CN103118136A

    公开(公告)日:2013-05-22

    申请号:CN201310063508.1

    申请日:2013-02-28

    Abstract: 本发明公开了一种基于块级别云存储负载均衡优化的方法,本发明将遗传算法中的变异部分加入到负载均衡策略中,尽可能地提高该策略搜索全局最优解的准确性;同时设计了一种面向iSCSI的断点续传功能,在重新选择卷服务器进行iSCSI重连时,正在上传数据的用户无需将数据重新上传,系统自动会从断点处继续上传,提高了系统的可靠性;通过利用现有的异构存储环境,提出了一种基于卷生命周期的分级存储管理机制,充分利用不同存储设备的优势和特点,进一步提高系统访问效率。本发明可用于计算机存储技术领域中来解决云存储系统的负载均衡问题。

    一种虚拟化系统竞争资源差异化服务方法

    公开(公告)号:CN102156665B

    公开(公告)日:2012-12-05

    申请号:CN201110092580.8

    申请日:2011-04-13

    Abstract: 本发明涉及一种虚拟化系统竞争资源差异化服务方法。目前的虚拟机监控器软件和操作系统不区分具体虚拟机应用程序的资源使用特点,无法确保重要应用程序和客户机操作系统的服务质量。本发明方法包含三部分的内容:虚拟化系统资源使用的马尔科夫模型、基于响应时间的多虚拟机系统的服务质量评价模型和基于上述两个模型的竞争资源差异化服务方法。通过本发明提供的虚拟化系统竞争资源差异化服务方法,可以在系统高度竞争的情况下有效缓解系统资源的竞争程度,显著提高整个虚拟化系统的性能和服务质量。

    一种优化Cache行为提升油藏数值模拟效率的方法

    公开(公告)号:CN102521463A

    公开(公告)日:2012-06-27

    申请号:CN201110441366.9

    申请日:2011-12-26

    Abstract: 本发明涉及一种优化Cache行为提升油藏数值模拟效率的方法。传统的方法Cache命中率较低,导致整体性能表现平平。本发明引入了一种基于四叉树的稀疏矩阵向量乘方法,该方法的优化工作包括:读入稀疏矩阵,并将之转化为四叉树存储格式;采用预调优算法确定子矩阵块的最优大小;运算中集成向量化、软件流水线与多线程优化技术以提升共轭梯度解法器的性能,从而提高油藏数值模拟演算的整体运算效率。

    一种三维不可压缩管流的并行化方法

    公开(公告)号:CN102520917A

    公开(公告)日:2012-06-27

    申请号:CN201110420229.7

    申请日:2011-12-15

    Abstract: 本发明了公开了一种三维不可压缩管流的并行化方法,它是一种面向分布式集群的并行化方法。本发明对传统的线性系统进行替换,通过引入网格条块的执行顺序,在不改变传统迭代方法性质的同时,提高了执行过程的数据局部性;通过对迭代空间进行区域分解和网格条块的重新排序,实现了方法的并行化;通过循环交错条块技术和增加时间维对迭代空间进行时滞划分,减小了执行过程的通信和同步开销;在迭代的实际执行过程中,构造了并行方法的性能自动调优器,通过探测找到效率最优情况下的参数数值组合,并固定参数值,实现并行方法的运行效率最优。

    一种非规则迭代并行化方法

    公开(公告)号:CN102096744A

    公开(公告)日:2011-06-15

    申请号:CN201110053795.9

    申请日:2011-03-07

    Abstract: 本发明涉及一种非规则迭代并行化方法。本发明在初始阶段通过分析数据的存取模式,根据数据块和子数据块的生成策略提高非规则迭代计算的数据局部性和并行性;在执行阶段通过执行新生成的调度策略,执行转换后的代码,提高非规则迭代技术的数据局部性和并行性;在实际执行过程中构造非规则迭代计算方法的性能自动调优器,通过穷举探测方法找到效率最优情况下的参数数值组合,并固定其参数值,实现技术在该体系结构下的运行效率最优。本发明具有良好的并行效率和可扩展性。

    一种基于指令拓扑关系感知的GEMM调优方法

    公开(公告)号:CN118708864A

    公开(公告)日:2024-09-27

    申请号:CN202410751801.5

    申请日:2024-06-12

    Abstract: 本发明公开了一种基于指令拓扑关系感知的GEMM调优方法,该方法构建芯片参数模块,获取待优化算子,依据所有指令构建指令序列,并分为数据预取、矩阵乘运算、结果存回三部分。其次确定算子的搜索空间、起始解状态和矩阵乘运算中一个循环的期望执行时间的范围,对当前解状态及其相邻解状态分别构建指令拓扑关系图,将当前解状态作为候选解。然后基于贪心算法分别对当前解状态及其相邻解状态调整指令顺序。最后获取芯片的平均算力,并迭代循环,从候选解中选取平均算力最高的解状态作为该算子的最优解。本发明实现程序执行时间趋近于指令拓扑图中的关键路径长度,提高指令执行的效率,减少人工优化的时间。

    一种基于用户历史行为序列的广告点击率预测方法

    公开(公告)号:CN112288471B

    公开(公告)日:2024-07-02

    申请号:CN202011154969.6

    申请日:2020-10-26

    Abstract: 本发明公开了一种基于用户历史行为序列的广告点击率预测方法,该方法包括:采集目标用户特征信息、广告信息以及用户历史行为信息,构建广告相关图,并运用图嵌入方法对用户历史行为信息数据进行增强表示,学习得到能充分表达广告特征的表示向量;在点击率预估模型中加入自注意力机制层,能够更直接地学习到用户历史行为之间的内部相关性,减少了对外部信息的依赖。在多个公开的亚马逊商品点击数据集以及盘石公司广告点击数据集上的实验显示,本发明提供的技术方案提高了点击率预测的准确性,从而可以更准确地向用户展示其感兴趣的广告。

    一种面向智能科学的分布式自动并行计算方法

    公开(公告)号:CN118228761A

    公开(公告)日:2024-06-21

    申请号:CN202410324127.2

    申请日:2024-03-21

    Abstract: 本发明公开了一种面向智能科学的分布式自动并行计算方法,包括如下步骤:步骤1、将待并行的网络模型通过Jax的自带make_jaxpr方法将网络中的python函数转换成Jaxpr的形式的Jaxpr信息;步骤2、将生成的Jaxpr信息通过Jax适配器转换成混合分布式IR得到自定义计算图;步骤3、将混合分布式IR中的定义根据制定的搜索空间进行自动并行策略,经过多轮迭代后给出节点的最佳设备放置信息;步骤4原先的自定义计算图被拆分为若干数据结构相同的小的子图Block;通过一个分发器将子图Block分发到不同设备上执行;拆分后的子图Block通过Jax适配器中的block2jaxpr方法转换成Jaxpr。最后收集各子图Block的计算结果。该方法为JAX提供分布式自动并行功能,以提高科学计算、大模型的开发效率、执行性能。

    基于模型结构自动化分析的深度神经网络分布式训练方法

    公开(公告)号:CN117808081A

    公开(公告)日:2024-04-02

    申请号:CN202410175350.5

    申请日:2024-02-07

    Abstract: 本发明公开了基于模型结构自动化分析的深度神经网络分布式训练方法,该方法首先分析深度神经网络模型结构算子,对不同类型算子进行计算、存储评估建模,将神经网络中的算子归纳为访存密集型算子、计算密集型算子;通过计算、存储评估模型,推导算子计算代价。其次分析算子数据流特征,构建算子间数据流、通信评估模型,实现算子通信性能自动推导。最后基于计算、存储评估模型和数据流、通信评估模型,自动分析模型结构中算子进行参数密集和计算密集识别,并寻找最耗时或通信量最大的网络层或算子进行分布式训练。本发明帮助AI工程师设计并行策略,进行分布式训练,提升训练效率和降低训练成本。

Patent Agency Ranking