-
公开(公告)号:CN117350171A
公开(公告)日:2024-01-05
申请号:CN202311638586.X
申请日:2023-12-04
Applicant: 山东省计算中心(国家超级计算济南中心)
IPC: G06F30/27 , G06N3/0464 , G06N3/0455 , G06F119/08
Abstract: 本发明提出了基于双流模型的中尺度涡三维次表层结构反演方法及系统,涉及深度学习与海洋反演交叉领域,通过卫星采集待反演的中尺度涡海表面信息;将中尺度涡海表面信息输入到训练好的双流模型中,反演出中尺度涡不同深度下的温度结果,得到中尺度涡次表层温度剖图;其中,所述双流模型引入Triplet attention注意力机制,采用三分支结构融合通道注意力和空间注意力进行跨维度交互;本发明采用双流模型实现中尺度涡次表层结构反演,发掘海表面参数间的数据关联,分别建立不同参数与次表层温度的关系模型,融合多源信息特征关系,实现特征融合,有效融合了多源数据,提升了反演效果。
-
公开(公告)号:CN116452404A
公开(公告)日:2023-07-18
申请号:CN202310437009.8
申请日:2023-04-18
Applicant: 山东省计算中心(国家超级计算济南中心) , 齐鲁工业大学(山东省科学院)
Abstract: 本发明提出了一种深度学习模型分布式训练的内存优化方法及系统,包括:将目标深度学习模型的多个网络层基于图形处理器数量划分为多个区;每个区的网络层在进行训练时,下一训练批次的反向传播基于上一训练批次的反向传播的参数,进行交叉训练;若同一训练批次前向传播和后向传播所运行时的张量大于所在图形处理器上权重缓冲区的内存,则将所述张量分配至中央处理器上执行后并返回至所在的图形处理器。通过建立下一训练批次的反向传播和上一训练批次的反向传播的依赖关系,保证了稳定的交叉训练;通过将图形处理器上权值交换到中央处理器上处理,从而减轻图形处理器上内存的压力。
-
公开(公告)号:CN115908772A
公开(公告)日:2023-04-04
申请号:CN202211475396.6
申请日:2022-11-23
Applicant: 山东省计算中心(国家超级计算济南中心)
IPC: G06V10/20 , G06V10/42 , G06V10/44 , G06V10/774 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/048 , G06N3/08
Abstract: 本发明提出了一种基于Transformer和融合注意力机制的目标检测方法,包括:获取待检测图像进行预处理;将预处理后的待检测图像输入至训练好的目标检测模型中,输出检测结果;其中,所述目标检测模型包括Swin Transformer模块、注意力融合模块和检测模块,所述Swin Transformer模块用于提取待检测图像的全局特征,所述注意力融合模块用于局部特征提取,并将全局特征和局部特征采用跨层级联的方式进行融合,所述检测模块用于根据融合后的特征输出检测结果。融合局部感受野与Transformer的全局信息,以进一步提升局部特征与全局信息融合的能力,增强低信噪比目标的检测效果。
-
公开(公告)号:CN114385126A
公开(公告)日:2022-04-22
申请号:CN202210291793.1
申请日:2022-03-24
Applicant: 山东省计算中心(国家超级计算济南中心)
Abstract: 本发明属于资源调度技术领域,提供了一种基于K8s的多租户深度学习模型研发系统及方法,基于Docker、K8s等主流技术,针对不同租户的深度学习模型研发需求,通过微服务总线、微服务控制器和资源服务组件等统一数据、接口、资源标准,建立基于K8s的隔离空间,实现数据存储、模型设计、模型训练、模型评估、模型发布的自动化容器集群环境搭建和参数配置,支持资源管理、用户管理、权限管理、项目管理、数据管理、模型管理等操作,帮助用户快速高效地进行深度学习模型研发,解决了资源监控、自定义模型构建等方面不完善的问题,极大地提高AI应用开发的效率和资源利用率,满足多种业务场景的需求。
-
公开(公告)号:CN118779117B
公开(公告)日:2025-02-11
申请号:CN202411258880.2
申请日:2024-09-10
Applicant: 山东省计算中心(国家超级计算济南中心) , 齐鲁工业大学(山东省科学院)
IPC: G06F9/50 , G06F9/38 , G06F18/214 , G06N3/126
Abstract: 本发明属于大模型训练技术领域,具体涉及一种基于双重优化的大模型广域异构分布式训练方法与系统;基于双重优化的大模型广域异构分布式训练方法包括:获取基座模型的配置信息,进行异构数据中心的拆分,将异构数据中心转换成最多能完成一个stage任务的数据中心;采用蚁群算法对拆分后数据中心进行初始化组合的优化,得到基座模型初步并行组方案;基于遗传算法的优化得到基座模型并行组方案,生成模型训练架构,以完成基于双重优化的大模型广域异构分布式训练。针对真实异构环境下的基座模型训练所面临的架构设计、通信成本计算和难以找到最佳并行组策略的难题,减少了模型训练时间的同时,有效降低了大模型训练的成本和门槛。
-
公开(公告)号:CN118395204A
公开(公告)日:2024-07-26
申请号:CN202410597097.2
申请日:2024-05-14
Applicant: 山东省计算中心(国家超级计算济南中心) , 齐鲁工业大学(山东省科学院)
IPC: G06F18/22 , G06N3/0464 , G06F18/214 , G06F18/20
Abstract: 本发明公开了基于时间卷积网络的海洋数据在线预测与检测方法及系统,其中方法包括:构建自适应时间卷积网络;构建训练集,所述训练集为海洋监测历史时序数据;所述自适应时间卷积网络,是对原始时间卷积网络,加入多头自注意力机制,并在残差单元中引入自适应层;将训练集输入到自适应时间卷积网络中对其进行训练,得到训练后的自适应时间卷积网络;训练过程中,将前K‑1个时刻的海洋监测数据作为网络的输入值,将第K时刻的海洋监测数据作为网络的输出值;获取待预测的海洋时序数据,将待预测的海洋时序数据输入到训练后的自适应时间卷积网络中,输出预测的海洋数据;将预测的海洋数据与设定阈值进行比较,确定预测的海洋数据是否发生异常。
-
公开(公告)号:CN118297849A
公开(公告)日:2024-07-05
申请号:CN202410343675.X
申请日:2024-03-25
Applicant: 山东省计算中心(国家超级计算济南中心) , 齐鲁工业大学(山东省科学院)
Abstract: 本发明公开的一种多特征融合的水下图像增强方法及系统,包括:获取无标签水下图像;通过无标签水下图像对水下图像增强模型进行训练,训练过程中,水下图像增强模型从无标签水下图像中提取亮度特征、语义特征、梯度特征、全局特征和局部特征,将亮度特征、语义特征、梯度特征、全局特征和局部特征合并,获得水下图像增强结果,训练完成,获得训练好的水下图像增强模型;利用训练好的水下图像增强模型对待增强的水下图像进行增强。实现了对水下图像的有效增强。
-
公开(公告)号:CN118245457A
公开(公告)日:2024-06-25
申请号:CN202410441447.6
申请日:2024-04-12
Applicant: 山东省计算中心(国家超级计算济南中心) , 齐鲁工业大学(山东省科学院)
IPC: G06F16/174 , G06F40/194 , G06F40/205 , G06F16/182 , G06N5/04 , G06F16/958
Abstract: 本公开提供了基于句群的海量网页并行去重处理方法及系统,涉及网页去重技术领域,获取输入原始文件中的所有网页数据,并提取高评分网页数据;将每个高评分网页数据保存为Json对象,对Json对象的正文内容进行句子组合,对每个句子组合创建HashSig对象,将所有HashSig对象构成签名文件;针对所有签名文件,采用先局部后整体的方式进行重复性检查,将重复的Json对象索引和句子索引保存到重复文件中;利用生成的重复文件查找重复的句子,删除重复项;其中,对原始文件、签名文件以及重复文件的处理为多个处理节点上对同一块磁盘进行并发访问,实现数据的并行处理。
-
公开(公告)号:CN118037599A
公开(公告)日:2024-05-14
申请号:CN202410343235.4
申请日:2024-03-25
Applicant: 山东省计算中心(国家超级计算济南中心) , 齐鲁工业大学(山东省科学院)
Abstract: 本发明公开的一种真实水下图像复原方法及系统,包括:获取场景透射图、空气环境中场景图像及水下环境图像;根据场景透射图和空气环境中场景图像,获得场景的雾霾特征和光衰减特征;通过训练后水下图像生成模型对场景的光衰减特征、雾霾特征和水下环境图像进行处理,获得水下场景图像;利用水下场景图像对水下图像复原模型进行训练,训练完成,获得训练好的水下图像复原模型;通过训练好的水下图像复原模型对真实水下图像进行处理,获得修复后水下图像。实现了对水下图像的有效复原。
-
公开(公告)号:CN115861646A
公开(公告)日:2023-03-28
申请号:CN202211466939.8
申请日:2022-11-22
Applicant: 山东省计算中心(国家超级计算济南中心)
IPC: G06V10/44 , G06V10/80 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/048 , G06N3/08
Abstract: 本发明提出了一种基于结构重参数化的轻量级目标检测方法及系统,包括:获取待目标检测的数据样本并进行预处理;将预处理后的数据样本输入至网络推理模型中输出目标检测结果,所述网络推理模型为是由训练好的多分支网络训练模块采用结构重参数转换成的单路结构的网络模型,其中,结构重参数转换的方式为分支合并和卷积序列合并。通过结构重参数化方式解耦训练和推理阶段,在训练阶段采用多分支结构获取更多语义信息和特征表示,迭代更新权重参数,同时在推理阶段采用带有训练权重信息的单路结构,在加快模型的推理速度的同时保证模型精度。
-
-
-
-
-
-
-
-
-