一种内存管理方法、装置、设备及介质

    公开(公告)号:CN114020454A

    公开(公告)日:2022-02-08

    申请号:CN202111257276.4

    申请日:2021-10-27

    Abstract: 本申请公开了一种内存管理方法、装置、设备及介质,包括:对异构加速计算系统的主机端的内存和各AI加速器设备的板载内存分别进行切片处理,得到相应的内存切片空间;从全部所述内存切片空间中确定出公共内存切片空间;对全部所述公共内存切片空间进行统一地址空间编址,得到相应的编址空间;在执行人工智能算法计算任务时,将人工智能算法模型部署于所述编址空间,以便各处理器访问所述编址空间中相应的公共内存切片空间,完成所述人工智能算法计算任务。能够突破AI异构加速设备间的内存物理隔离限制,提高异构加速计算系统的计算资源和内存资源利用效率。

    一种图像处理系统及其卷积神经网络

    公开(公告)号:CN111160458A

    公开(公告)日:2020-05-15

    申请号:CN201911386418.X

    申请日:2019-12-29

    Abstract: 本申请公开了一种图像处理系统及其卷积神经网络,该卷积神经网络包括智能密集连接模块,智能密集连接模块包括基本卷积模块和智能注意力模块,基本卷积模块用于对接收到的待处理图像进行卷积运算以得到相应的特征图,然后将特征图传输至与自身输出侧连接的智能注意力模块;智能注意力模块用于获取与自身输入侧连接的基本卷积模块传输的特征图作为输入侧特征图以及获取位于自身位置之前的其它模块传输的特征图作为待融合特征图,并从输入侧特征图的所有通道中筛选出部分通道作为目标通道,然后将目标通道对应的特征图与待融合特征图进行通道叠加以得到新的特征图并输出。通过本申请的上述技术方案,能够减少输入通道数,降低计算量。

    卷积神经网络模型的计算方法及装置

    公开(公告)号:CN110796245A

    公开(公告)日:2020-02-14

    申请号:CN201911022124.9

    申请日:2019-10-25

    Abstract: 本发明提供了的一种卷积神经网络模型的计算方法及装置,该方法包括:通过获取卷积神经网络模型的训练任务的计算模型;然后,将所述卷积神经网络模型的训练任务的计算模型中的乘累加运算拆分成多个乘加运算任务;再根据预设的计算模型与计算设备的对应关系,确认每一个乘加运算任务所对应的计算设备;最后,利用所述每一个乘加运算任务所对应的计算设备,分别对所述每一个乘加运算任务进行计算。达到了提高当CNN模型训练任务在不同计算设备上进行迁移或不同处理器协同计算的灵活性,提高计算速度的目的。

    一种卷积网络加速方法、装置及系统

    公开(公告)号:CN110516790A

    公开(公告)日:2019-11-29

    申请号:CN201910760810.X

    申请日:2019-08-16

    Abstract: 本发明公开了一种卷积网络加速方法、装置及系统,包括获取预先存储的固定长度指令集,固定长度指令集为预先基于待处理卷积网络的结构和参数信息建立的;固定长度指令集中包括多个固定长度赋值指令和固定长度操作指令,每个固定长度赋值指令和每个固定长度操作指令分别对应至少一个寄存器;依据与固定长度赋值指令对应的寄存器值对相应的固定长度操作指令的寄存器进行赋值,以便依据寄存器的寄存器值确定相应的指令参数;固定长度赋值指令对应的寄存器值为依据卷积网络的参数信息确定的;依据与固定长度操作指令对应的寄存器值获取相应的指令参数,并根据指令参数执行相应的操作;本发明节约内存、使用灵活性强、编译和映射的效率高、难度低。

    基于硬件环境的卷积计算仿真测试方法、装置及相关设备

    公开(公告)号:CN110516334A

    公开(公告)日:2019-11-29

    申请号:CN201910760181.0

    申请日:2019-08-16

    Abstract: 本发明公开了一种基于硬件环境的卷积计算仿真测试方法,该方法包括以下步骤:获取待用于进行卷积计算的数据信息;模拟硬件环境的卷积计算实现逻辑,基于数据信息进行卷积计算的软件仿真,获得第一结果数据;将第一结果数据与第二结果数据进行比对,获得第一比对结果,第二结果数据为在硬件环境下使用数据信息进行卷积计算获得的数据;根据第一比对结果,验证硬件实现逻辑是否正确。应用本发明实施例所提供的技术方案,可以有效进行卷积计算的仿真测试,及时发现硬件实现逻辑的错误之处,方便硬件调试,可以提高硬件开发效率。本发明还公开了一种基于硬件环境的卷积计算仿真测试装置、设备及存储介质,具有相应技术效果。

    视觉语言模型训练方法、设备、介质及计算机程序产品

    公开(公告)号:CN119229238B

    公开(公告)日:2025-04-29

    申请号:CN202411719465.2

    申请日:2024-11-28

    Abstract: 本发明涉及人工智能视觉处理技术领域,具体公开了视觉语言模型训练方法、设备、介质及计算机程序产品,通过将图像数据集中的各示例图像建立全局视觉特征、前景视觉特征、聚合视觉特征的层级式视觉特征库,在训练视觉语言模型时,利用视觉语言模型的视觉提示器进行层级式筛选,提高查询示例图像的效率以及质量,利用关联示例图像与查询图像之间的相似性损失值以及图像处理结果的处理损失值计算得到模型训练损失值来更新视觉感知模型的参数,实现对视觉语言模型的全局优化,相较于传统方案中采用局部模块适配的方式能够避免陷入局部最优,从而进一步提高图像处理质量。

    视觉语言模型训练方法、设备、介质及计算机程序产品

    公开(公告)号:CN119229238A

    公开(公告)日:2024-12-31

    申请号:CN202411719465.2

    申请日:2024-11-28

    Abstract: 本发明涉及人工智能视觉处理技术领域,具体公开了视觉语言模型训练方法、设备、介质及计算机程序产品,通过将图像数据集中的各示例图像建立全局视觉特征、前景视觉特征、聚合视觉特征的层级式视觉特征库,在训练视觉语言模型时,利用视觉语言模型的视觉提示器进行层级式筛选,提高查询示例图像的效率以及质量,利用关联示例图像与查询图像之间的相似性损失值以及图像处理结果的处理损失值计算得到模型训练损失值来更新视觉感知模型的参数,实现对视觉语言模型的全局优化,相较于传统方案中采用局部模块适配的方式能够避免陷入局部最优,从而进一步提高图像处理质量。

    基于分离式内存系统的内存调度方法、系统以及产品

    公开(公告)号:CN119149210A

    公开(公告)日:2024-12-17

    申请号:CN202411667145.7

    申请日:2024-11-21

    Abstract: 本发明公开了一种基于分离式内存系统的内存调度方法、系统以及产品,涉及内存调度技术领域。根据当前任务的需求参数和分离式内存系统的实际运行参数确定当前任务访问的目标内存设备,在实际部署内存设备之前,根据当前任务的执行的需求参数,实现对应不同任务的需求参数与分离式内存系统的实际运行参数初步确定当前任务待访问的目标内存设备。为了减小当前任务对应的访问时延,通过当前任务对应的目标计算加速器的历史调用次数和访问时延预估当前目标内存设备的访问代价,根据访问代价确定当前任务的调度内存设备,使每个任务对应的目标计算加速器访问的调度内存设备的访问代价较小,提高当前任务的目标计算加速器的访问执行效率。

    模型训练方法、视频定位方法、系统、设备、产品及介质

    公开(公告)号:CN118395195A

    公开(公告)日:2024-07-26

    申请号:CN202410853495.6

    申请日:2024-06-28

    Abstract: 本发明公开了一种模型训练方法、视频定位方法、系统、设备、产品及介质,涉及视频数据处理领域,用于解决定位音频事件时将视频模态视作噪声导致定位不准确的问题。获取训练数据集;根据视觉特征得到第一知识图结构,根据音频特征得到第二知识图结构;根据两个知识图结构对第一神经网络模型优化得到目标神经网络模型,目标神经网络模型用于对待处理视频数据进行类别标签定位。本发明通过构建视觉特征和音频特征对应的知识图结构,使用知识图结构优化第一神经网络模型,并未将视觉信息视为噪声,能捕捉和利用音频与视频间的复杂关联关系,能够更好地整合和利用多模态数据,提高得到的目标神经网络模型的定位精度和可靠性。

    一种任务处理方法、装置及电子设备和存储介质

    公开(公告)号:CN118113444A

    公开(公告)日:2024-05-31

    申请号:CN202410534357.1

    申请日:2024-04-30

    Abstract: 本申请公开了一种任务处理方法、装置及电子设备和存储介质,涉及自然语言理解技术领域,该方法包括:获取目标任务的输入内容和输出描述;利用预训练语言模型基于所述目标任务的输入内容和输出描述对所述目标任务进行步骤分解,以生成所述目标任务对应的思维树;其中,所述思维树中的节点为步骤分解得到的步骤;基于预设搜索算法在所述思维树中搜索执行所述目标任务的最佳步骤路径;基于所述最佳步骤路径根据所述输入内容执行所述目标任务,输出所述目标任务的执行结果。本申请提高了执行目标任务的效果,可适用于不同类型的任务,泛化性较高。

Patent Agency Ranking