-
公开(公告)号:CN119066309A
公开(公告)日:2024-12-03
申请号:CN202411073502.7
申请日:2024-08-06
Applicant: 北京大学 , 北京大学长沙计算与数字经济研究院
Abstract: 本申请公开了一种多维快速傅里叶变换数据处理方法、装置及电子设备。其中,该方法包括:依据待处理序列在各个维度上的第一序列长度和预设批处理大小,确定待处理序列在各个维度上对应的转置参数和批处理大小;依据各个维度对应的第一序列长度以及待处理序列在各个维度的分量,确定待处理序列在各个维度的分量对应的至少一个子序列,其中,转置参数用于确定是否对子序列执行转置操作;依据子序列的第二序列长度和子序列在图形处理器内存中的存储形式将子序列分解为多个分解因子。本申请解决了由于相关技术中在对多维快速傅里叶变换数据进行处理时采用固定的分解策略导致的计算效率低且耗时过长的技术问题。
-
公开(公告)号:CN117407419B
公开(公告)日:2024-11-01
申请号:CN202311160042.7
申请日:2023-09-08
Applicant: 北京大学 , 北京大学长沙计算与数字经济研究院
IPC: G06F16/2455 , G06F16/28
Abstract: 本发明公开了一种高维数据的查找方法及装置、存储介质、电子设备。其中,该方法包括:确定搜索空间中的初始值,其中,初始值包括初始位置值和初始元素值,初始位置值由N个向量构成,每个向量长度为高维数组对应阶的维度大小,N为大于2的正整数;基于初始值查找搜索空间在单一维度的单维最大值,以及单维最大值的数组位置;将单维最大值和数组位置输出为搜索空间在当前迭代周期的当前最大元素。通过本发明,解决了相关技术中在搜索空间中查找高维最大元素的准确率低的技术问题,可适配于各种低秩表示形式的数据,通用性高,通过交替迭代的策略保证了收敛性,且减少了对超参数的依赖,无论是人造数据还是真实数据,提高了准确率和稳定性。
-
公开(公告)号:CN118170687A
公开(公告)日:2024-06-11
申请号:CN202410588847.X
申请日:2024-05-13
Applicant: 北京大学 , 北京大学长沙计算与数字经济研究院
Abstract: 本申请公开了一种BLAS库的测试方法及装置、非易失性存储介质、电子设备。其中,该方法包括:获取参数列表,其中,参数列表中记录有多个标识信息和多个操作名称;解析参数列表,得到多个标识信息和多个操作名称;确定与每个目标平台对应的测试项目,并在每个目标平台中创建与每个测试项目对应的测试环境,其中,测试项目包括:计算类操作测试和辅助类操作测试;调用与每个操作名称对应的测试程序在每个测试环境对BLAS库进行测试,得到BLAS库在每个目标平台的测试结果。本申请解决了由于相关技术中用于测试BLAS库的方法无法兼容多个异构平台造成的无法在跨平台场景下进行任意两个BLAS库的正确性对齐测试和性能对齐测试的技术问题。
-
公开(公告)号:CN116680763B
公开(公告)日:2024-05-17
申请号:CN202310700966.5
申请日:2023-06-13
Applicant: 北京大学长沙计算与数字经济研究院 , 北京大学
IPC: G06F30/10 , G06N3/04 , G06F17/13 , G06F111/06
Abstract: 本发明涉及形状优化方法及计算机存储介质和终端设备,包括:根据偏微分方程约束的形状待优化问题,确定状态、伴随、正则方程;构建状态、伴随、正则方程神经网络代理模型;设定优化目标初始形状,将初始形状边界离散为若干形状表征点;在当前形状内部与边界分别采样若干配置点;优化状态损失函数,更新状态方程代理模型;优化伴随损失函数,更新伴随方程代理模型;优化正则损失函数,更新正则方程代理模型;计算形状表征点对应的形状优化方向,更新当前形状;判断是否结束形状更新。本发明利用神经网络求解方程的无网格特性,突破了传统网格依赖形状优化方法的瓶颈,可用于求解不同领域的形状待优化问题。
-
公开(公告)号:CN117217062B
公开(公告)日:2024-02-02
申请号:CN202311487007.6
申请日:2023-11-09
Applicant: 北京大学 , 北京大学长沙计算与数字经济研究院
IPC: G06F30/23 , G06F113/08
Abstract: 本发明公开了一种基于刚度矩阵的流体仿真方法及装置。其中,该方法包括:确定目标流体在问题域上的有限元方程,其中,问题域包括多个有限元,每个有限元对应问题域的一个离散化子域,每个离散化子域对应一个单位刚度矩阵;配置静态化的坐标COO格式的稀疏张量类模板,其中,稀疏张量类模板的模板参数包括张量维数和非零元的位置;根据有限元方程和稀疏张量类模板计算单位刚度矩阵;采用单位刚度矩阵在处理器中装填生成问题域的总刚度矩阵;采用总刚度矩阵模拟计算目标流体在几何形状中的流动特征参数。通过本发明,通过提高张量解析算力,加快单元刚度矩阵和总刚度矩阵的计算速度,从而提升了仿真速度和仿真效率。
-
公开(公告)号:CN117217062A
公开(公告)日:2023-12-12
申请号:CN202311487007.6
申请日:2023-11-09
Applicant: 北京大学 , 北京大学长沙计算与数字经济研究院
IPC: G06F30/23 , G06F113/08
Abstract: 本发明公开了一种基于刚度矩阵的流体仿真方法及装置。其中,该方法包括:确定目标流体在问题域上的有限元方程,其中,问题域包括多个有限元,每个有限元对应问题域的一个离散化子域,每个离散化子域对应一个单位刚度矩阵;配置静态化的坐标COO格式的稀疏张量类模板,其中,稀疏张量类模板的模板参数包括张量维数和非零元的位置;根据有限元方程和稀疏张量类模板计算单位刚度矩阵;采用单位刚度矩阵在处理器中装填生成问题域的总刚度矩阵;采用总刚度矩阵模拟计算目标流体在几何形状中的流动特征参数。通过本发明,通过提高张量解析算力,加快单元刚度矩阵和总刚度矩阵的计算速度,从而提升了仿真速度和仿真效率。
-
公开(公告)号:CN117172159A
公开(公告)日:2023-12-05
申请号:CN202311437016.4
申请日:2023-11-01
Applicant: 北京大学 , 北京大学长沙计算与数字经济研究院
IPC: G06F30/28 , G06F17/11 , G06F111/10
Abstract: 本发明涉及计算流体动力学技术领域,公开了确定空化区域的方法、装置、计算机设备及存储介质。本发明获取预处理矩阵、初始空化评估指标、目标物体在静止参考系的各个预设方向的角速度和流体的流体动力学参数。根据预处理矩阵、各个预设方向的角速度和流体动力学参数,创建第一控制方程。对目标物体对应的三维空间进行网格化,得到多个网格。根据有限体积法,对第一控制方程进行离散处理,得到第二控制方程。根据第二控制方程和初始空化评估指标,对每个网格进行龙格库塔迭代计算,得到每个网格的目标空化评估指标。根据目标空化评估指标,确定目标物体上存在空化现象的区域。本发明可以更准确地确定目标物体上存在空化现象的区域。
-
公开(公告)号:CN118170687B
公开(公告)日:2024-09-06
申请号:CN202410588847.X
申请日:2024-05-13
Applicant: 北京大学 , 北京大学长沙计算与数字经济研究院
Abstract: 本申请公开了一种BLAS库的测试方法及装置、非易失性存储介质、电子设备。其中,该方法包括:获取参数列表,其中,参数列表中记录有多个标识信息和多个操作名称;解析参数列表,得到多个标识信息和多个操作名称;确定与每个目标平台对应的测试项目,并在每个目标平台中创建与每个测试项目对应的测试环境,其中,测试项目包括:计算类操作测试和辅助类操作测试;调用与每个操作名称对应的测试程序在每个测试环境对BLAS库进行测试,得到BLAS库在每个目标平台的测试结果。本申请解决了由于相关技术中用于测试BLAS库的方法无法兼容多个异构平台造成的无法在跨平台场景下进行任意两个BLAS库的正确性对齐测试和性能对齐测试的技术问题。
-
公开(公告)号:CN117217133B
公开(公告)日:2024-02-23
申请号:CN202311487011.2
申请日:2023-11-09
Applicant: 北京大学 , 北京大学长沙计算与数字经济研究院
IPC: G06F30/28 , G06F111/10 , G06F113/08 , G06F119/14
Abstract: 本发明公开了一种改善激波稳定性的数值模拟方法、装置、设备和存储介质。其中,方法包括将基于欧拉坐标的磁流体方程模型转换为拉格朗日坐标的目标磁流体方程模型;在拉格朗日坐标中,建立物理量穿过激波时需要满足的激波跳跃条件,获得目标磁流体方程模型在接触界面处的速度和磁张力,其中,物理量包括速度和磁张力;将速度和磁张力逆变换为欧拉坐标,在欧拉坐标中,针对激波前后不同的磁场,建立只有对流项磁场的激波跳跃关系,获得相等的对流磁场表达式;采用对流磁场表达式模拟多维磁流体数值。本发明提供的方案避免了数值模拟时在激波波头附近出现非物理凸起的缺陷,提高了数值模拟的可靠性。
-
公开(公告)号:CN117240717B
公开(公告)日:2024-02-13
申请号:CN202311500928.1
申请日:2023-11-13
Applicant: 北京大学 , 北京大学长沙计算与数字经济研究院
IPC: H04L41/0893 , G06F30/15 , G06F30/20 , H04L47/125 , H04L67/12
Abstract: 本发明涉及分片结构网格处理方法及优化方法和存储介质、设备,基于图划分算法,在简单划分、粗划分、细划分步骤下,给出负载更加均衡的网格划分结果,同时尽可能保持较小的通信量,提高了后续并行计算的效率。本申请的关键技术点为,提出了一个自动划分分片网格的处理方法,在给定分片网格和计算核心数后,根据网格大小和其拓扑结构,遍历可行空间,自动生成网格划分,在划分片数最小的前提下,使得每个计算核心对应的子网格大小尽可能一致。
-
-
-
-
-
-
-
-
-