-
公开(公告)号:CN118734943A
公开(公告)日:2024-10-01
申请号:CN202410805296.8
申请日:2024-06-20
申请人: 北京百度网讯科技有限公司
摘要: 本公开提供了模型数据布局优化方法、装置、电子设备及存储介质,涉及人工智能领域,尤其涉及深度学习、云计算与数据处理等技术领域。具体实现方案为:计算单元基于模型的第一计算图确定目标网络流图;计算单元在目标网络流图上运用最小割算法,得到第一集合和第二集合,其中,第一集合中的节点将在第一数据布局下运行;第二集合中的节点将在第二数据布局下运行;计算单元基于第二集合对第一计算图中的节点进行改写,得到模型的第二计算图,将模型的第二计算图存储至内存单元。根据本公开的方案,能对模型的数据布局进行优化,减少了因数据布局转换而引入的算子的计算开销,从而有助于提升模型的执行效率。
-
公开(公告)号:CN118551228A
公开(公告)日:2024-08-27
申请号:CN202410788392.6
申请日:2024-06-18
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F18/214 , G06F16/332 , G06N3/0455 , G06N3/0499 , G06N3/08
摘要: 本公开公开了样本生成方法、大模型的训练方法、问答方法、装置、电子设备、存储介质及程序产品,涉及人工智能技术领域,尤其涉及数据处理、大模型和人机交互等技术领域。具体实现方案为:对具有相同拼接特性的多个样本对进行样本拼接,生成样本序列,其中,样本对包括问题和答案;按照参考拼接长度,从多个样本序列中确定至少一个候选样本序列;以及利用预定填充数据对至少一个候选样本序列进行序列优化,生成样本序列集。
-
公开(公告)号:CN117332068B
公开(公告)日:2024-08-27
申请号:CN202311433823.9
申请日:2023-10-31
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F16/332 , G06F18/213 , G06F18/22 , G06F3/01
摘要: 本公开提供了人机交互方法、装置、电子设备以及存储介质,涉及人工智能技术领域,尤其涉及深度学习、自然语言处理、大模型技术领域。具体实现方案为:响应于人机交互请求,基于人机交互请求包括的第一对话文本,从大语言模型中注册的多个插件中确定与第一对话文本相关的第一目标插件;基于第一对话文本和第一目标插件的描述文本,得到第二对话文本;以及将第二对话文本输入大语言模型,得到回复文本。
-
公开(公告)号:CN116820577B
公开(公告)日:2024-08-13
申请号:CN202310698964.7
申请日:2023-06-13
申请人: 北京百度网讯科技有限公司
IPC分类号: G06F9/38
摘要: 本公开提供了模型的并行处理方法、装置、第一计算设备和电子设备,涉及人工智能技术领域,尤其涉及深度学习、自然语言处理、图像处理等领域。具体实现方案为:第一计算设备接收N个数据子矩阵中的第一数据子矩阵;基于第一数据子矩阵与N个模型子矩阵中的每个模型子矩阵分别进行处理,得到与N个模型子矩阵一一对应的N个子矩阵处理结果;基于N个子矩阵处理结果,得到第一计算设备的处理结果。采用本公开的技术方案,可以有效减少数据整合引入的额外开销,提升内存利用率以及模型的并行处理效率。
-
公开(公告)号:CN116542298B
公开(公告)日:2024-06-28
申请号:CN202310565645.9
申请日:2023-05-19
申请人: 北京百度网讯科技有限公司
摘要: 本公开提供了数据处理方法、装置、电子设备以及存储介质,涉及数据处理技术领域,尤其涉及人工智能、深度学习、模型推理优化等技术领域。具体实现方案为:从存储介质中读取待处理对象的激活矩阵,以及目标神经网络层的参数矩阵;采用至少一个内核从激活矩阵中分离出第一矩阵和第二矩阵,并从参数矩阵中分离出第三矩阵和第四矩阵;对第一矩阵和第三矩阵执行矩阵乘积操作,得到第一处理结果;对第二矩阵和第四矩阵执行矩阵乘积操作,得到第二处理结果;将第一处理结果和第二处理结果进行融合,得到目标神经网络层对激活矩阵的数据处理结果。本公开实施例可节约存储空间的同时,加速大模型的推理速度,以提高资源的利用率。
-
公开(公告)号:CN117744799A
公开(公告)日:2024-03-22
申请号:CN202311767964.4
申请日:2023-12-20
申请人: 北京百度网讯科技有限公司
摘要: 本公开提供了一种符号表达式的推理方法、装置、设备和介质,涉及人工智能技术领域,尤其涉及深度学习等技术领域。该方法包括:生成目标符号表达式的表达式树,表达式树包括多个结点,多个结点包括至少一个运算结点和至少一个变量结点;对表达式树进行后序遍历,得到待处理结点序列;依次对待处理结点序列中的结点进行处理,包括:响应于确定当前处理的结点为运算结点,确定该运算结点对应的运算结果是否已被缓存;响应于确定该运算结点对应的运算结果未被缓存,对该运算结点进行运算推理;以及将该运算结点的运算结果进行缓存。
-
公开(公告)号:CN117743609A
公开(公告)日:2024-03-22
申请号:CN202311761256.X
申请日:2023-12-20
申请人: 北京百度网讯科技有限公司
摘要: 本公开提供了多媒体数据处理方法、装置、电子设备、存储介质以及程序产品,涉及人工智能技术领域,尤其涉及大模型、大语言模型、Transformer(编码解码器)、对话式模型、生成式模型等技术领域。具体实现方案为:基于存储单元的可用存储容量和数据块序列的数据量,确定驱逐策略;重复执行下述操作,直至n等于N:在确定n小于N的情况下,基于驱逐策略,对第n‑1数据块特征进行驱逐,得到第n‑1驱逐后特征;基于第n‑1驱逐后特征和第n数据块,得到第n数据块特征;将第n数据块特征存储至存储单元;在确定n等于N的情况下,基于第n数据块特征,得到目标处理结果。
-
公开(公告)号:CN117610677A
公开(公告)日:2024-02-27
申请号:CN202311426412.7
申请日:2023-10-31
申请人: 北京百度网讯科技有限公司
IPC分类号: G06N20/00 , G06V10/774 , G06F40/205
摘要: 本公开提供了模型训练方法、装置、设备及存储介质。本公开涉及人工智能技术领域,具体为自然语言处理、深度学习、计算机视觉、图像处理等技术领域。具体方案为:在计算设备上部署待训练模型;对部署于计算设备上的待训练模型进行训练,得到目标模型;其中,对部署于计算设备上的待训练模型进行训练,包括:获取表征本轮梯度的值和表征历史梯度的值;基于表征历史梯度的值和表征本轮梯度的值,得到目标裁剪方式对应的参考值;在参考值达到目标裁剪方式对应的裁剪标准的情况下,采用目标裁剪方式对本轮梯度进行裁剪。根据本公开的方案,能够及时发现在模型训练过程中的梯度异常,有效抑制训练发散或损失尖峰的发生,进而有效提高模型训练的稳定性。
-
公开(公告)号:CN114841326B
公开(公告)日:2024-01-12
申请号:CN202210560831.9
申请日:2022-05-19
申请人: 北京百度网讯科技有限公司
摘要: 本公开提供了一种深度学习框架的算子处理方法,涉及计算机技术领域,尤其涉及深度学习等人工智能技术领域。具体实现方案为:获取待处理算子,其中,待处理算子包括算子核函数和与深度学习框架无关的模板参数;响应于接收到针对待处理算子的输入信息,利用输入信息解析模板参数,得到与深度学习框架相关的多个完整模板参数;以及根据多个完整模板参数,对算子核函数进行处理,得到用于深度学习框架的可用算子。本公开还提供了一种深度学习框架的算子处理装置、电子设备和存储介质。
-
公开(公告)号:CN114897146B
公开(公告)日:2023-11-03
申请号:CN202210551044.8
申请日:2022-05-18
申请人: 北京百度网讯科技有限公司
摘要: 本公开提供了一种模型生成方法、装置和电子设备,涉及计算机技术领域,尤其涉及深度学习技术领域。具体实现方案为:获取目标模型的前向传播计算图,所述前向传播计算图包括基础算子,所述基础算子为具有一次数学运算的算子;对所述前向传播计算图中的基础算子进行微分变换,得到目标计算图,所述目标计算图包括前向微分计算图和反向微分计算图中的至少一种;基于所述目标计算图生成所述目标模型。本公开可以简化模型生成的过程。
-
-
-
-
-
-
-
-
-