数据块的处理方法、装置及存储介质

    公开(公告)号:CN112308199A

    公开(公告)日:2021-02-02

    申请号:CN201910683971.3

    申请日:2019-07-26

    Inventor: 李哲暘

    Abstract: 本申请公开了一种数据块的处理方法、装置及存储介质,属于机器学习技术领域。所述方法包括:通过神经网络模型中的元素级操作层,获取上一级网络层输入的数据类型为定点型数据的n个数据块,从已存储的模型数据或元素级操作层的输入数据中,获取每个数据块的各个通道对应的补偿系数,将n个数据块中的各个通道上的数据,分别与各个通道对应的补偿系数进行相乘,得到n个补偿数据块,若n大于1,则对n个补偿数据块进行元素级操作,对得到的元素级操作结果进行输出。本申请通过为各个通道设置补偿系数,使得元素级操作层能够对定点型数据进行处理,操作方式更为灵活,且获取补偿系数的获取方式也较为灵活。

    一种视频帧融合方法、装置、电子设备

    公开(公告)号:CN111754544A

    公开(公告)日:2020-10-09

    申请号:CN201910251735.4

    申请日:2019-03-29

    Abstract: 本发明实施例提供了一种视频帧融合方法、装置、电子设备,方法包括:获取待融合视频中的第一视频帧和第二视频帧,第一视频帧为待融合的视频帧,第二视频帧与第一视频帧相差帧数不超过预设帧数;基于第一视频帧和第二视频帧,确定目标物体的移动速度;根据移动速度,以及预设的移动速度与融合帧数的对应关系,确定与第一视频帧进行融合的视频帧的融合帧数;确定与第一视频帧相邻的融合帧数个第三视频帧;对第一视频帧和融合帧数个第三视频帧进行视频帧融合,得到融合后的第一视频帧。相比于现有的采用统一的融合帧数进行视频帧融合的方法,提高了融合后视频帧中目标物体的显示效果,便于后续的目标检测或目标分析等过程。

    一种前向耗时的确定方法、装置及设备

    公开(公告)号:CN111753950A

    公开(公告)日:2020-10-09

    申请号:CN202010062768.7

    申请日:2020-01-19

    Abstract: 本申请提供一种前向耗时的确定方法、装置及设备,该方法包括:将待测神经网络划分为多个子网络;从多个子网络中选取至少一个子网络作为目标子网络;针对每个目标子网络,确定与所述目标子网络对应的子网络集合;子网络集合包括所述目标子网络和所述目标子网络的关联子网络,所述关联子网络为多个子网络中除所述目标子网络之外的子网络;根据子网络集合的信息获取所述目标子网络的耗时;根据每个目标子网络的耗时确定待测神经网络的前向耗时。通过本申请的技术方案,能够有效预测待测神经网络的前向耗时。

    一种神经网络模型压缩方法、装置和计算机设备

    公开(公告)号:CN110874636A

    公开(公告)日:2020-03-10

    申请号:CN201811027522.5

    申请日:2018-09-04

    Abstract: 本申请提供一种神经网络模型压缩方法、装置和计算机设备。本申请提供的神经网络模型压缩方法,包括:针对待压缩神经网络模型的每一个原始卷积层,将原始卷积层分解为级联的多个目标卷积层;获取原始卷积层对输入数据进行卷积处理后的第一卷积处理结果,以及级联的多个目标卷积层依序对输入数据进行卷积处理后的第二卷积处理结果;根据第一卷积处理结果和第二卷积处理结果,对级联的多个目标卷积层的权值矩阵进行修正处理,得到压缩后的神经网络模型。本申请提供的神经网络模型压缩方法、装置和计算机设备,通过对该级联的多个目标卷积层的权值矩阵进行修正处理,这样,可避免因模型压缩导致的性能损失。

    一种目标检测方法及其装置

    公开(公告)号:CN110659658A

    公开(公告)日:2020-01-07

    申请号:CN201810713179.3

    申请日:2018-06-29

    Inventor: 李哲暘 谭文明

    Abstract: 本申请提供一种目标检测方法及其装置,该方法包括:利用预先训练的尺度回归网络确定待检测图像中各分块的缩放系数;按照所述缩放系数对各分块进行缩放;分别对缩放后的各分块进行目标检测;对各分块中的目标进行融合输出,以得到所述待检测图像中的目标检测结果。该方法可以降低目标检测模型的复杂度和训练难度,并提高目标检测的准确率。

    一种模型压缩方法、装置、电子设备、存储介质及产品

    公开(公告)号:CN119227757B

    公开(公告)日:2025-03-04

    申请号:CN202411752106.7

    申请日:2024-12-02

    Abstract: 本申请实施例提供了一种模型压缩方法、装置、电子设备、存储介质及产品,涉及深度学习技术领域,方法包括:针对同一输入数据,分别利用待压缩模型和量化模型进行处理;计算待压缩模型与量化模型的输出数据之间的差异,作为量化模型对应的第一差异;按照第一差异对待压缩模型中每一网络层的量化参数进行调整;基于每一网络层的最优量化参数计算该网络层的连续域量化位宽;从需要部署模型的硬件平台所支持的各离散域量化位宽中,确定大于该网络层的连续域量化位宽且与该网络层的连续域量化位宽的差值最小的离散域量化位宽;从利用多个稀疏度组合分别进行压缩得到的各备选压缩模型中,确定对应的第二差异最小的目标压缩模型。可以提高模型的适用性。

    多模态大语言模型量化方法、装置、设备、存储介质及产品

    公开(公告)号:CN119227770A

    公开(公告)日:2024-12-31

    申请号:CN202411755976.X

    申请日:2024-12-03

    Abstract: 本申请涉及模型部署技术领域,公开了多模态大语言模型量化方法、装置、设备、存储介质及产品,包括:将待量化大模型划分为多模态处理分块以及语言模型分块;根据多模态处理分块中各处理子模块对应的量化误差构建处理子模块序列;基于处理子模块序列对多模态处理分块中各处理子模块分别进行量化;根据量化后的所述多模态处理分块确定语言子模块序列;依据语言子模块序列对所述语言模型分块中各语言子模块分别进行量化。由于可依据多模态语言大模型的计算特性进行针对性的模块划分,并基于模块划分顺序进行量化调整,确保量化符合模型的实际计算特性,提升了对多模态语言大模型进行量化部署的效果。

    模型量化方法、装置、设备、存储介质及产品

    公开(公告)号:CN118839742B

    公开(公告)日:2024-12-20

    申请号:CN202411329970.6

    申请日:2024-09-24

    Abstract: 本申请涉及模型量化技术领域,公开了模型量化方法、装置、设备、存储介质及产品,包括:获取初始浮点模型的模型输出数据,以及初始浮点模型的输出层各输出节点对应的相关性分值,并获取初始浮点模型中各层网络对应的单层量化输出数据;计算初始浮点模型中各层网络分别对应的敏感度评估值;根据敏感度评估值从初始浮点模型中各层网络中选取待调整网络;对初始浮点模型中待调整网络及其他层网络设置量化配置;根据设置后的量化配置对初始浮点模型进行模型量化。由于是根据可表征网络的量化对模型输出影响程度的敏感度评估值选取部分网络作为待调整网络,并将待调整网络设置为量化精度较高的量化配置,保证了可合理的调整量化方式,提高量化效果。

    一种自注意力机制计算方法、推理方法

    公开(公告)号:CN118396039B

    公开(公告)日:2024-08-27

    申请号:CN202410852330.7

    申请日:2024-06-27

    Abstract: 本申请实施例提供了一种自注意力机制计算方法、推理方法,该方法包括:基于待处理对象确定查询矩阵、键矩阵、以及值矩阵;待处理对象包括图像、文本、视频、音频、信号中的任一种或多种;并计算查询矩阵与转置后键矩阵的乘积,作为第一乘积矩阵;以自然常数e为底数,并以第一乘积矩阵为指数,得到第二乘积矩阵;若值矩阵的列数小于第一乘积矩阵的列数,计算第二乘积矩阵与值矩阵的乘积,作为第三乘积矩阵;计算第二乘积矩阵的和值,作为矩阵和值;并计算第三乘积矩阵与矩阵和值的比值,作为基于自注意力机制得到的输出特征。应用本申请实施例提供的技术方案,能够提高基于自注意力机制的推理任务的效率。

Patent Agency Ranking