-
公开(公告)号:CN118586448B
公开(公告)日:2024-10-11
申请号:CN202411074251.4
申请日:2024-08-07
Applicant: 浪潮电子信息产业股份有限公司
IPC: G06N3/0455 , G06N3/084 , G06N3/082 , G06N3/0985 , G06N5/04 , G06F40/205 , G06F16/35
Abstract: 本发明公开了一种文本任务处理方法及其模型训练方法、设备、介质、产品,应用于人工智能技术领域。其中,方法包括获取微调文本数据集和预训练好的初始语言模型。按照多个频率基准值对各微调文本样本的位置编码信息维度进行划分,并对不同组的位置编码信息采用相匹配的插值方法进行插值处理,以得到具有处理目标长度文本数据的过渡语言模型。基于目标长度设置窗口标记长度参数值和最大允许距离参数值,并基于推理文本长度设置目标文本长度参数值,利用窗口掩码方法对过渡语言模型进行外推处理,得到文本任务处理模型。本发明可以解决相关技术由于失去对长文本全局理解的能力导致性能下降的问题,能够有效提高长文本任务的执行精度。
-
公开(公告)号:CN119886360A
公开(公告)日:2025-04-25
申请号:CN202510352937.3
申请日:2025-03-25
Applicant: 浪潮电子信息产业股份有限公司
IPC: G06N5/04
Abstract: 本发明公开了一种推理任务执行方法、电子设备、可读存储介质及程序产品,涉及人工智能技术领域。其中,方法包括将待处理任务和提示词输入至包括第一语言模型和第二语言模型的任务处理模型。根据提示词,利用第一语言模型生成待处理任务对应的初始任务执行思路,利用第二语言模型和待处理任务对初始任务执行思路进行分析,并利用第一语言模型根据初始任务执行思路和思路分析结果确定任务执行思路;基于第二语言模型输出的单步骤分析结果,利用第一语言模型按照任务执行思路逐步生成各任务执行步骤。本发明可以解决相关技术中复杂推理任务成本高且准确度低的问题,能够高效且低成本生成高质量推理数据,有效提升复杂推理类任务的执行准确度。
-
公开(公告)号:CN118586448A
公开(公告)日:2024-09-03
申请号:CN202411074251.4
申请日:2024-08-07
Applicant: 浪潮电子信息产业股份有限公司
IPC: G06N3/0455 , G06N3/084 , G06N3/082 , G06N3/0985 , G06N5/04 , G06F40/205 , G06F16/35
Abstract: 本发明公开了一种文本任务处理方法及其模型训练方法、设备、介质、产品,应用于人工智能技术领域。其中,方法包括获取微调文本数据集和预训练好的初始语言模型。按照多个频率基准值对各微调文本样本的位置编码信息维度进行划分,并对不同组的位置编码信息采用相匹配的插值方法进行插值处理,以得到具有处理目标长度文本数据的过渡语言模型。基于目标长度设置窗口标记长度参数值和最大允许距离参数值,并基于推理文本长度设置目标文本长度参数值,利用窗口掩码方法对过渡语言模型进行外推处理,得到文本任务处理模型。本发明可以解决相关技术由于失去对长文本全局理解的能力导致性能下降的问题,能够有效提高长文本任务的执行精度。
-
公开(公告)号:CN118173219A
公开(公告)日:2024-06-11
申请号:CN202410340732.9
申请日:2024-03-22
Applicant: 浪潮电子信息产业股份有限公司
Abstract: 本发明涉及图像处理技术领域,公开了一种3D影像的文本报告生成装置、设备和存储介质。获取单元用于获取图像‑文本数据集;其中,图像‑文本数据集包含3D影像及其对应的文本报告。提取单元用于提取图像‑文本数据集中的图像特征和文本特征。图像特征和文本特征属于两种不同模态的特征,为了更好的挖掘图像特征和文本特征之间的关联性,可以通过映射单元将图像特征映射到语言信息空间,以得到语言信息。训练单元用于基于语言信息与文本特征对视觉语言大模型进行训练,可以得到训练好的视觉语言大模型。分析单元可以利用训练好的视觉语言大模型对新获取的目标3D影像进行分析,从而得到目标文本报告,解决了目前模型无法提供文本报告的问题。
-
-
-