-
公开(公告)号:CN106443833A
公开(公告)日:2017-02-22
申请号:CN201510478584.8
申请日:2015-08-06
Applicant: 中国电力科学研究院 , 国家电网公司中国科学院计算机网络信息中心国网北京市电力公司
Inventor: 靳双龙 , 冯双磊 , 姜金荣 , 王勃 , 李群 , 刘纯 , 邓笋根 , 王伟胜 , 胡菊 , 王珏 , 马振强 , 宋宗朋 , 姜文玲 , 赵艳青 , 王超 , 王铮 , 杨红英 , 任天宇 , 车建峰 , 卢静 , 师恩洁 , 张菲
IPC: G01W1/10
Abstract: 本发明提供一种基于云计算的数值天气预报方法,该方法在WRF模式系统中采用远程交互并行网格嵌套计算方案,通过在数值天气预报中心和用户端之间合理地分配计算任务,实现了计算节点间文件的高效传输和管理,得到了一种基于云计算的数值天气预报架构方法。该方案适用于主节点和子节点计算任务重,计算时间相差不多,且计算时间之和超过了要求的情况。本发明提出的方法能够将主节点和子节点计算时间进行重叠,使总计算时间有效缩短。将数值天气预报作为云计算服务提供给开发人员使用,使得科研、商业领域可以充分利用云计算平台的计算资源,开展数值天气预报工作,不但提高了高性能计算机的利用率,而且有效提高了数值天气预报的计算效率。
-
公开(公告)号:CN103384205B
公开(公告)日:2016-05-25
申请号:CN201210134225.7
申请日:2012-05-02
Applicant: 中国科学院计算机网络信息中心
Abstract: 本发明涉及一种海量告警数据并行采集系统、装置及方法。所述系统包括主控机、至少一台采集机、至少一台告警采集代理服务器和至少一台待采集设备。主控机通过网线与采集机相连,采集机通过卫星网络或网线与告警采集代理服务器相连,告警采集代理服务器与至少一台待采集设备相连。主控机采用带宽资源目标和/或计算资源目标计算的双目标任务调度模式,确定一个采集任务触发周期内可以并行执行的采集子任务数,将采集子任务映射到采集机的物理处理单元,采集机通过告警采集代理服务器对待采集设备采集数据。本发明充分利用采集机的带宽资源和计算资源,提高了海量告警数据的采集效率。本发明的系统、装置及方法广泛适用于网络数据采集领域。
-
公开(公告)号:CN102999477B
公开(公告)日:2016-05-25
申请号:CN201210563427.3
申请日:2012-12-21
Applicant: 中国科学院计算机网络信息中心
IPC: G06F17/18
Abstract: 本发明公开了一种基于MCMC的并行分类方法,包括:根据初始状态计算似然估计;根据似然估计计算出参数的后验概率;根据后验概率进行MCMC模拟运算,以当前状态为基础,产生新状态;根据新状态计算接受概率,并产生第一随机数,当第一随机数小于接受概率时,则下一时刻的状态为新状态,否则保持当前状态不变;产生同一列处理器中准备进行交换的马尔科夫链的标号;当处理器中的马尔科夫链参与了交换,则计算出交换概率,并产生第二随机数,判断交换概率和第二随机数的比较结果,当第二随机数小于交换概率时,则交换处理中的马尔科夫链的加热参数,否则交换不发生。本发明缩短了MC3算法和MCMC算法的执行时间,并减小了通讯开销。
-
公开(公告)号:CN103514042A
公开(公告)日:2014-01-15
申请号:CN201210204459.4
申请日:2012-06-18
Applicant: 中国科学院计算机网络信息中心
IPC: G06F9/50
Abstract: 本发明涉及一种双调归并排序调优方法及装置。根据GPU和CPU的运算能力,分配待排序数据集;GPU和CPU对各自分配的待排序数据集进行排序;其中,排序过程中,当GPU和CPU中的数据有无关性时,同时使用CPU和GPU分别排序,在两部分数据有相关性时,将数据汇集到GPU和CPU中的一个设备上排序。由此,可以更好的重叠计算、缩短双调归并排序的执行时间,提高执行效率。
-
公开(公告)号:CN103384205A
公开(公告)日:2013-11-06
申请号:CN201210134225.7
申请日:2012-05-02
Applicant: 中国科学院计算机网络信息中心
Abstract: 本发明涉及一种海量告警数据并行采集系统、装置及方法。所述系统包括主控机、至少一台采集机、至少一台告警采集代理服务器和至少一台待采集设备。主控机通过网线与采集机相连,采集机通过卫星网络或网线与告警采集代理服务器相连,告警采集代理服务器与至少一台待采集设备相连。主控机采用带宽资源目标和/或计算资源目标计算的双目标任务调度模式,确定一个采集任务触发周期内可以并行执行的采集子任务数,将采集子任务映射到采集机的物理处理单元,采集机通过告警采集代理服务器对待采集设备采集数据。本发明充分利用采集机的带宽资源和计算资源,提高了海量告警数据的采集效率。本发明的系统、装置及方法广泛适用于网络数据采集领域。
-
公开(公告)号:CN119441698A
公开(公告)日:2025-02-14
申请号:CN202411531342.6
申请日:2024-10-30
Applicant: 中国科学院计算机网络信息中心
IPC: G06F17/16 , G06N3/042 , G06N3/0495 , G06N3/08
Abstract: 本申请公开了一种张量处理单元上加速稀疏矩阵计算的方法及存储介质,所述方法包括:获取第一矩阵,其中第一矩阵包括行索引值或列索引值,第一矩阵为基于输入序列得到的稀疏矩阵;基于行索引值或列索引值,对所述第一矩阵的行和列进行重新排序,得到第二矩阵,以使所述第二矩阵相对于第一矩阵的缓存命中率更高;从GPU的内存中读取第三矩阵,并对所述第二矩阵和第三矩阵进行运算,其中所述第三矩阵是指与所述第二矩阵进行运算的矩阵,所述第三矩阵基于所述输入序列得到。通过本技术,并在tensor core上执行矩阵运算,减少了冗余计算操作,提升了运行过程中的缓存命中率实现了对稀疏矩阵的高效计算与运算资源的优化利用,极大地提升了矩阵计算的整体性能。
-
公开(公告)号:CN118484135A
公开(公告)日:2024-08-13
申请号:CN202410377055.8
申请日:2024-03-29
Applicant: 中国科学院计算机网络信息中心
Abstract: 本申请公开了一种稀疏矩阵存储方法及向量乘方法。该方法包括:根据预先确定的长度与宽度,从稀疏矩阵中获得多个矩阵块;根据每个矩阵块中非零元素的数量,从多个矩阵块中获得多个储存类;对多个储存类中具有三个以下非零元素的第i个储存类,根据非零元素于稀疏矩阵中的行坐标及列坐标,获得第i个非零元素数组;根据非零元素于稀疏矩阵中的列坐标、行坐标,获得第i个储存类的行索引数组、第一列索引数组;根据非零元素于第i个非零元素数组中的坐标,获得第i个储存类的量索引数组;根据以上索引数组及非零元素数组,储存第i个储存类;对于多个储存类中具有三个或三个以上非零元素的第t个储存类,采用压缩稀疏行CSR格式,储存第t个储存类。
-
公开(公告)号:CN117955501A
公开(公告)日:2024-04-30
申请号:CN202410127034.0
申请日:2024-01-30
Applicant: 中国科学院计算机网络信息中心
IPC: H03M7/30
Abstract: 本发明涉及无损数据压缩框架,所述无损数据压缩框架具体包括:输入模块,将待压缩字节流以输入长度为S输入;语义增强模块,对长度为S的字节流进行嵌入处理,得到矩阵Xe;将Xe分割为N个Patch,N个Patch的集合记为Xs;进行维度融合,将Xs各Patch的维度降为F,得到矩阵Xd;将Xd输入预测模型,或对Xd进行自适应步长处理后输入预测模型;预测模型,输出正向传播预测的概率,并进行反向传播,更新框架的参数;算术编码模块,依据预测的概率进行算术编码。本发明的框架,提高了字节概率预测的准确性,进而提高了多模式数据的压缩率。
-
公开(公告)号:CN111914213B
公开(公告)日:2023-11-10
申请号:CN202010759916.0
申请日:2020-07-31
Applicant: 中国原子能科学研究院 , 中国科学院计算机网络信息中心
IPC: G06F17/16 , G06F7/523 , G06N3/0464 , G06N3/08
Abstract: 本发明涉及一种稀疏矩阵向量乘运算时间预测方法及系统,其中,方法包括以下步骤:构建卷积神经网络,卷积神经网络包括输入层、特征处理层、数据拼接层以及输出层,其中,输入层用于输入稀疏矩阵中的行特征矩阵的特征、列特征矩阵的特征、体系结构参数扩展矩阵的特征;特征处理层用于提取上一层中的特征;数据拼接层,用于对提取的行特征矩阵的特征、列特征矩阵的特征、体系结构参数扩展矩阵的特征进行拼接;输出层用于输出预测结果;获取多组已知稀疏矩阵向量乘运算时间的稀疏矩阵作为样本数据,将样本数据输入至卷积神经网络以实现对卷积神经网络的训练;将待分类的稀疏矩阵输入至训练完成的卷积神经网络,实现稀疏矩阵向量乘运算时间的预测。
-
公开(公告)号:CN110660453B
公开(公告)日:2023-03-07
申请号:CN201910953927.X
申请日:2019-10-09
Applicant: 中国原子能科学研究院 , 中国科学院计算机网络信息中心
Abstract: 本说明书实施例提供了一种基于指数时间差分格式求解速率理论方程的并行计算方法,基于速率理论建立物理微观缺陷模拟模型,速率理论没有时空尺度限制,因此在模拟高的损伤剂量条件下的微观结构演化时,能够明显体现出速率理论的优势,然后使用指数时间差分格式对于主方程进行求解,求解的结果精确性更好,精度更高。
-
-
-
-
-
-
-
-
-