一种模型训练方法、装置、设备、介质及系统

    公开(公告)号:CN115879543B

    公开(公告)日:2023-05-05

    申请号:CN202310194708.4

    申请日:2023-03-03

    Abstract: 本申请公开了计算机技术领域内的一种模型训练方法、装置、设备、介质及系统。本申请在模型迭代过程中,若根据当前迭代次数确定本次迭代需分组,则将异构计算系统内的所有计算节点划分为多个计算组,并使同一计算组内的不同计算节点互联;在每一计算组内确定控制节点,并按照环状拓扑结构连接不同控制节点;控制同一计算组内的不同计算节点以All‑Reduce策略和当前计算组适用的模型优化算法执行本次迭代任务,控制各控制节点以Ring‑All‑Reduce策略执行本次迭代任务。该方案能充分发挥计算节点的特点,提高计算节点间的通信效率和模型训练效率。本申请提供的一种模型训练装置、设备、介质及系统,同样具有上述技术效果。

    一种目标检测方法、装置、设备及介质

    公开(公告)号:CN114842203A

    公开(公告)日:2022-08-02

    申请号:CN202210466978.1

    申请日:2022-04-29

    Abstract: 本申请公开了一种目标检测方法、装置、设备及介质,包括:确定待检测图像的图像尺寸;获取所述图像尺寸对应的切块位置参数;基于所述切块位置参数对所述待检测图像进行切块,得到切块数据;将所述待检测图像的所有所述切块数据构建为一个批处理数据;将所述批处理数据输入目标检测模型,得到各所述切块数据的目标检测结果;对所述目标检测结果进行融合,得到最终的目标检测结果。这样,利用目标检测模型对批处理数据进行一次推理,得到各切块数据的目标检测结果,最后对各切块数据的目标检测结果融合,得到最终的检测结果,这样降低了模型推理次数,从而提升了目标检测效率。

    模型训练方法、视频定位方法、系统、设备、产品及介质

    公开(公告)号:CN118395195B

    公开(公告)日:2024-09-24

    申请号:CN202410853495.6

    申请日:2024-06-28

    Abstract: 本发明公开了一种模型训练方法、视频定位方法、系统、设备、产品及介质,涉及视频数据处理领域,用于解决定位音频事件时将视频模态视作噪声导致定位不准确的问题。获取训练数据集;根据视觉特征得到第一知识图结构,根据音频特征得到第二知识图结构;根据两个知识图结构对第一神经网络模型优化得到目标神经网络模型,目标神经网络模型用于对待处理视频数据进行类别标签定位。本发明通过构建视觉特征和音频特征对应的知识图结构,使用知识图结构优化第一神经网络模型,并未将视觉信息视为噪声,能捕捉和利用音频与视频间的复杂关联关系,能够更好地整合和利用多模态数据,提高得到的目标神经网络模型的定位精度和可靠性。

    视觉问答及其模型训练方法、装置、电子设备、存储介质

    公开(公告)号:CN117892140A

    公开(公告)日:2024-04-16

    申请号:CN202410295706.9

    申请日:2024-03-15

    Abstract: 本发明公开了一种视觉问答及其模型训练方法、装置、电子设备、存储介质,应用于人工智能领域。其中,方法包括获取视觉问答训练样本数据集;将问题‑图像对样本输入至视觉问答模型,图文编码器对问题‑图像对样本进行图文编码处理,交互解码器从接收到的图文编码特征中提取交互对象的语义特征,推理解码器融合接收到的图文编码特征和交互对象特征,并基于融合图文编码特征对应的正确答案‑正确事件知识标签、与从知识库检索的答案、事件知识间的损失不断地迭代更新,直至满足预设模型训练结束条件。本发明可以解决相关技术无法满足用户高精度问答需求和答案可解释需求的问题,提升了基于场景交互任务中的视觉问答精度,让答案更具有可解释性。

    一种图像处理方法、装置、系统、设备及计算机存储介质

    公开(公告)号:CN116681973B

    公开(公告)日:2023-11-03

    申请号:CN202310967935.6

    申请日:2023-08-03

    Abstract: 本发明公开了一种图像处理方法、装置、系统、设备及计算机存储介质,涉及图像处理技术领域,应用于目标设备,对分配得到的图像处理子神经网络模型进行当前轮的训练;获取当前轮的局部激活矩阵、局部梯度矩阵;对目标设备的局部梯度矩阵和其他设备的局部梯度矩阵进行全局规约操作,得到全局梯度矩阵;将目标设备的局部激活矩阵和全局梯度矩阵进行对称拆分并运算来生成目标设备的局部梯度配置;传输局部梯度配置,以基于局部梯度配置生成当前轮的全局参数;若不结束训练,则基于当前轮的全局参数进行下一轮的训练;若结束训练,则结束。模型训练中只传输局部梯度配置,降低了数据传输量,提高了图像处理效率。

    一种图像处理方法、装置、系统、设备及计算机存储介质

    公开(公告)号:CN116704296A

    公开(公告)日:2023-09-05

    申请号:CN202310974709.0

    申请日:2023-08-04

    Abstract: 本发明公开了一种图像处理方法、装置、系统、设备及计算机存储介质,涉及图像处理技术领域,应用于目标设备,对目标设备分配得到的图像处理子神经网络模型进行当前轮的训练;计算当前轮训练好的图像处理子神经网络模型的目标函数的局部特征矩阵;判断是否传输当前轮的局部特征矩阵;若是,则传输当前轮的局部特征矩阵至主设备,以使主设备基于当前轮的局部特征矩阵生成当前轮的全局参数;若否,则不传输当前轮的局部特征矩阵至主设备,以使主设备基于上一轮的局部特征矩阵生成当前轮的全局参数;以基于当前轮的全局参数得到训练好的图像处理神经网络模型进行图像处理。目标设备选择性的将局部特征矩阵传输给主设备,提高了处理效率。

    一种数据识别方法、系统、设备及计算机可读存储介质

    公开(公告)号:CN115905456B

    公开(公告)日:2023-06-02

    申请号:CN202310016221.7

    申请日:2023-01-06

    Abstract: 本申请公开了一种数据识别方法、系统、设备及计算机可读存储介质,应用于信息处理技术领域,获取目标数量个文本数据;对于每个文本数据,均对文本数据进行实体识别,得到实体识别结果;提取文本数据的第一全局向量化特征;提取各个实体识别结果各自的实体向量化特征;基于实体向量化特征,确定所有的实体识别结果的第二全局向量化特征;将第一全局向量化特征与第二全局向量化特征进行连接,得到文本数据的目标向量化特征;基于目标向量化特征对文本数据进行聚类,得到聚类结果;基于聚类结果,生成对应的事件模式信息;基于事件模式信息对目标数据进行事件抽取,得到事件信息;基于事件信息对目标数据进行识别,可以高效率的得到识别结果。

    一种分布式计算方法、系统、存储介质和电子设备

    公开(公告)号:CN115660078A

    公开(公告)日:2023-01-31

    申请号:CN202211701753.6

    申请日:2022-12-29

    Abstract: 本申请提供一种分布式计算方法、系统、存储介质和电子设备,涉及分布式计算领域,包括:获取分布式计算任务;将分布式计算任务进行任务分解,得到子任务,并分配至各个计算节点;在每个计算节点中,利用训练线程训练子任务得到训练结果并存至第一缓存,利用通信线程获取当前全局数据存储至第二缓存;完成一次迭代后,交换第一缓存和第二缓存中的数据;在下一次迭代时,将当前全局数据作为下一次训练的初始值;迭代预设次数后得到计算节点对应的局部解;聚合各局部解,得到分布式计算任务的训练结果。本申请可以使得各计算节点训练得到的局部解更精确,还可以减少计算节点处理子任务的时间开销,提高分布式计算效率。

    一种图像生成方法、装置、设备及介质

    公开(公告)号:CN114648681B

    公开(公告)日:2022-10-28

    申请号:CN202210546381.8

    申请日:2022-05-20

    Abstract: 本申请公开了一种图像生成方法、装置、设备及介质,涉及人工智能领域,该方法包括:获取弱相关图文数据对,并根据弱相关图文数据对创建图文数据集,弱相关图文数据对为图文之间呈弱相关关系的图文数据对,利用图文数据集对预先基于对抗网络构建的图像生成模型进行训练,以得到训练后图像生成模型,图像生成模型中包含用于生成图片的生成器以及用于鉴别图片真假并计算相应损失值的判别器,当获取到待处理文本数据,则利用训练后图像生成模型生成与待处理文本数据对应的图片。本方法采用呈弱相关关系的图文数据,并使用单阶段端到端的训练方法,使生成的图像更加贴近实际的生活场景,容易落地实施,可用于指导艺术化、抽象化等图像的生成。

    一种实体链接方法、装置、设备及存储介质

    公开(公告)号:CN114841164A

    公开(公告)日:2022-08-02

    申请号:CN202210466937.2

    申请日:2022-04-29

    Abstract: 本申请涉及自然语言处理技术领域,公开了一种实体链接方法、装置、设备及存储介质,包括:获取与输入文本对应的实体提及、候选实体以及实体描述;构建包含实体提及与实体描述的第一融合序列和包含候选实体与输入文本的第二融合序列;利用第一模型计算实体提及的第一融合序列与第二融合序列的相似度,并根据相似度从候选实体中确定出实体提及的链接实体;第三模型为利用训练文本的实体提及训练样本的正样本和负样本通过对比学习的方式对采用对比损失函数的预训练模型进行训练得到。本申请在实体链接中融入实体描述信息,同时通过正负样本对比学习的方式训练模型来实现实体消歧,提高实体链接准确度以及在开放知识图谱上进行实体链接的性能。

Patent Agency Ranking