-
公开(公告)号:CN119862064A
公开(公告)日:2025-04-22
申请号:CN202510344835.7
申请日:2025-03-24
Applicant: 浪潮电子信息产业股份有限公司
IPC: G06F11/07 , G06F11/3604
Abstract: 本申请公开了一种异常算子的定位方法、设备、存储介质及程序产品,涉及计算机技术领域,包括通过比对目标模型在不同计算设备的运行结果差异,快速锁定异常算子的候选范围,避免全量算子排查的资源浪费;根据目标模型调用的算子,动态生成待验证算子集合,将排查范围从整个算子集合压缩至目标模型调用的算子对应的集合;通过逐个回退至验证计算设备,结合自动化结果比对,精准定位异常算子,解决了人工逐层校验方法中存在的效率低的技术问题,达到了提高排查效率以及规避了人工操作失误风险的技术效果。
-
公开(公告)号:CN119166467A
公开(公告)日:2024-12-20
申请号:CN202411658829.0
申请日:2024-11-20
Applicant: 浪潮电子信息产业股份有限公司
IPC: G06F11/30 , G06F16/901
Abstract: 本发明公开了一种数据处理方法、计算机程序产品、设备及计算机介质,涉及计算机技术领域,确定待处理数据在输入内存中的布局结构;确定结果数据在输出内存中的布局结构,结果数据包括对待处理数据进行处理后得到的数据;响应于待处理数据的布局结构和结果数据的布局结构一致,则根据内存的稠密与否检测结果,在内存中批量对目标数据进行操作;响应于待处理数据的布局结构和结果数据的布局结构不一致,则根据内存的存储连续与否检测结果,在内存中批量对目标数据进行操作;其中,目标数据包括从输入内存中待读取的待处理数据,或待写入输出内存中的结果数据。本发明扩充了在内存中批量对数据进行操作的情况类型,提高了内存存取性能。
-
公开(公告)号:CN118536605B
公开(公告)日:2024-09-27
申请号:CN202410993683.9
申请日:2024-07-24
Applicant: 浪潮电子信息产业股份有限公司
IPC: G06N5/04 , G06N3/0499 , G06N3/045 , G06N3/096 , G06N3/0442 , G06F40/16 , G06F40/232
Abstract: 本发明公开了一种自然语言处理任务执行及其模型训练方法、设备、介质,应用于人工智能领域。其中,方法包括获取大规模的第一自然语言模型、小规模的第二自然语言模型及文本数据集。利用第一自然语言模型对文本数据集各文本数据进行处理,生成基于问题文本得到正确答案文本的逻辑推理步骤文本数据及解释错误答案文本的纠错步骤文本数据。基于文本数据集、逻辑推理步骤文本数据及纠错步骤文本数据,生成逻辑推理文本数据集;利用逻辑推理文本数据集训练第二自然语言模型,利用训练好的第二自然语言模型执行自然语言处理任务。本发明可以解决相关技术学生模型无法达到教师模型相匹配的性能的问题,能够有效提升自然语言处理任务的执行精度。
-
公开(公告)号:CN118552633A
公开(公告)日:2024-08-27
申请号:CN202410444192.9
申请日:2024-04-12
Applicant: 浪潮电子信息产业股份有限公司
IPC: G06T11/00
Abstract: 本发明提供一种图像生成模型训练方法、图像生成方法、装置及设备,涉及机器学习领域,方法包括:利用训练集对预训练扩散模型进行微调训练,得到第一扩散模型;其中,训练集包含多种类别的训练数据,训练数据包含类别信息和训练图像,扩散模型用于根据输入信息生成图像;将各类别的类别信息输入第一扩散模型,得到第一扩散模型输出的各类别的生成式图像;确定各生成式图像与同一类别的训练图像间的差异度,得到各类别对应的差异度;根据各类别的差异度对训练集中各类别的训练图像数量进行调整,并利用调整后的训练集对第一扩散模型进行微调训练,得到完成训练的第二扩散模型;可提升训练数据稀少的稀有类别在扩散模型中的训练效果。
-
公开(公告)号:CN118502932A
公开(公告)日:2024-08-16
申请号:CN202410444132.7
申请日:2024-04-12
Applicant: 浪潮电子信息产业股份有限公司
IPC: G06F9/50
Abstract: 本发明公开了一种内存分配系统、内存分配方法、电子设备及存储介质,涉及计算机技术领域,可将不同异构计算单元在使用内存空间时所需的内存块存储结构和内存页存储结构设置在预设内存池类,以及将对接不同异构计算单元的内存单元所需的函数设置在预设内存单元对接类,进而仅需获取包含异构计算单元使用内存空间所必需的内存配置参数,并利用内存配置参数和上述预设内存池类创建内存池、利用内存配置参数和上述预设内存单元对接类创建内存单元对接模块,即可基于该内存池和该内存单元对接模块满足特定异构计算设备的内存使用需求,从而能够使用同一套内存分配系统满足不同异构计算设备的内存使用需求,进而可降低内存管理机制的维护开发成本。
-
公开(公告)号:CN118278527B
公开(公告)日:2024-08-16
申请号:CN202410704394.2
申请日:2024-06-03
Applicant: 浪潮电子信息产业股份有限公司
IPC: G06N5/04 , G06N3/045 , G06N3/0985 , G06F40/284 , G06F40/30 , G06F40/247 , G06F16/35
Abstract: 本发明公开了一种自然语言处理任务执行及模型训练方法、装置、设备,应用于人工智能技术领域。其中,方法包括,通过对包含至少一种数值运算符的数学关系式进行数值运算,得到对应的数值计算结果的方式,生成数值运算数据集;从数理逻辑角度对原始语言样本数据集进行数据增强处理,得到语言样本逻辑增强数据集;利用数值运算数据集、语言样本逻辑增强数据集和原始语言样本数据集,对待处理自然语言模型进行分阶段训练直至满足预设模型训练停止条件。利用训练好的自然语言模型执行自然语言处理任务。本发明可以解决相关技术用户对自然语言处理任务的执行效率及精度需求的问题,有效提高自然语言处理任务执行效率和精度。
-
公开(公告)号:CN118277133B
公开(公告)日:2024-07-30
申请号:CN202410704399.5
申请日:2024-06-03
Applicant: 浪潮电子信息产业股份有限公司
Abstract: 本申请公开了模型运算优化方法、产品、设备及介质,涉及数据处理技术领域,包括:监测针对用户自定义算子的目标广播请求;所述目标广播请求中携带有所述用户自定义算子和至少两个输入张量;通过调用智能问答模型或深度学习网络模型的深度学习框架完成对CUDA设备的调用,以分别对各输入张量进行遍历,并确定与遍历结果对应的用于通过乘法及减法进行偏移量余数计算的目标参数;根据利用目标参数分别确定的各输入张量的偏移量从对应的张量存储空间中提取相应的元素值,并基于计算逻辑关系式对提取到的元素值进行相应的广播,得到对应的张量广播结果。本申请能够降低对除法和取余操作的依赖,提高偏移量计算的速度以及张量广播的效率。
-
公开(公告)号:CN118378727A
公开(公告)日:2024-07-23
申请号:CN202410834403.X
申请日:2024-06-26
Applicant: 浪潮电子信息产业股份有限公司
Abstract: 本发明公开了一种基于混合精度的数据处理方法、系统、产品、设备及介质,涉及人工智能领域,为解决深度学习框架和计算设备适配效率低的问题,该方法包括获取目标计算设备对应的硬件黑白名单;利用目标深度学习框架分析预设模型得到多个当前算子;根据多个当前算子的标准名称和硬件黑白名单确定多个当前算子的执行精度;控制目标计算设备按执行算子的执行精度对输入数据进行算子计算。本发明将各个深度学习框架中下的算子名称进行统一,减少不同深度学习框架下的算子名称的二义性,以硬件算子黑白名单为基准取代各个深度学习框架中的黑白名单,实现各深度学习框架间的统一,从而降低深度学习框架和计算设备的适配难度,降低维护成本。
-
公开(公告)号:CN118193071A
公开(公告)日:2024-06-14
申请号:CN202410384463.6
申请日:2024-03-29
Applicant: 浪潮电子信息产业股份有限公司
IPC: G06F9/4401 , G06F9/445
Abstract: 本申请公开了一种硬件芯片接入方法、装置、设备及介质,涉及计算机技术领域,包括:基于深度学习平台发布的平台算子库确定内核头文件;内核头文件中的各个算子的参数信息与平台算子库中的参数信息相一致;确定用于配置内核头文件中的所述各个算子的实现方式的配置文件,并确定用于对不同硬件芯片厂商的硬件算子库的接入方式进行规范化处理的目标模板,然后通过所述内核头文件、所述配置文件和所述目标模板生成前端内核函数;将所述前端内核函数接入至后端算子接口,并通过所述后端算子接口对接所述不同硬件芯片厂商的硬件算子库,以实现硬件芯片的接入。可见,本申请能够降低硬件芯片接入的开发难度,提高开发效率和硬件芯片接入的灵活性。
-
公开(公告)号:CN117972438A
公开(公告)日:2024-05-03
申请号:CN202410380905.X
申请日:2024-03-31
Applicant: 浪潮电子信息产业股份有限公司
IPC: G06F18/214 , G06F18/24 , G06V10/764 , G06V10/774 , G06V10/82 , G06N3/045 , G06N3/08
Abstract: 本发明公开了一种数据处理方法、系统、设备及存储介质,应用于计算机技术领域,以解决传统方案中无法同时保障训练效率和准确性的问题,包括:建立第一模型并进行训练得到待扩展模型,保存待扩展模型的检查点文件;基于待扩展模型的检查点文件,对待扩展模型进行结构扩展得到第二模型,且第二模型的模型参数的数量大于第一模型的模型参数的数量;对第二模型进行训练得到第一目标模型;将待处理的文本数据或者图像数据输入至第一目标模型,得到第一目标模型所输出的针对文本数据的文本预测结果或者针对图像数据的图像处理结果。应用本发明的方案,可以有效地通过模型实现数据处理,既能够保障准确性,又有利于提高训练效率,降低计算成本。
-
-
-
-
-
-
-
-
-