目标检测方法、装置及存储介质

    公开(公告)号:CN111783797B

    公开(公告)日:2023-08-18

    申请号:CN202010610242.8

    申请日:2020-06-30

    Abstract: 本发明实施例提供一种目标检测方法、装置及存储介质,通过对待检测图像进行特征提取和特征融合,得到多张不同尺度的第一特征图,分别对多张不同尺度的第一特征图进行目标检测,得到第一目标检测结果。通过对第一目标检测结果中的各目标框对应的类别分数信息进行修正,得到修正后的第二目标检测结果。再对第二目标检测结果中的各目标框进行非极大值抑制,确定最终的目标检测结果。上述方法可有效降低相近类别之间的误检,提高目标检测的准确性。

    基于模型量化的任务处理方法、装置、设备及存储介质

    公开(公告)号:CN115860068A

    公开(公告)日:2023-03-28

    申请号:CN202211186183.1

    申请日:2022-09-27

    Abstract: 本申请提供一种基于模型量化的任务处理方法、装置、设备及存储介质,该基于模型量化的任务处理方法包括:依据Transformer模型中优化单元的第一量化输出和第一浮点输出之间的差异,对优化单元的权重量化系数和激活量化系数进行更新;依据优化单元的第二量化输出和第二浮点输出之间的差异,对优化单元的权重量化增量进行更新;依据目标量化系数对优化单元的权重参数进行量化,并依据目标权重量化增量确定优化单元的权重量化取整方向;依据优化单元的目标量化权重参数对优化单元的输入数据进行前向推理计算,并依据优化单元的目标激活量化系数对优化单元的输入/输出进行量化。该方法可以提升任务处理的准确性。

    一种网络模型的训练方法、装置及设备

    公开(公告)号:CN115062793A

    公开(公告)日:2022-09-16

    申请号:CN202210753273.8

    申请日:2022-06-28

    Abstract: 本申请提供一种网络模型的训练方法、装置及设备,该方法包括:获取网络层对应的浮点型激活梯度值,对浮点型激活梯度值进行量化,得到定点型激活梯度值和激活值量化超参;基于定点型激活梯度值对网络层的初始模型权重进行调整,将调整后的模型权重更新为所述网络层的初始模型权重;若所述网络层不是首个网络层,则对网络层的初始模型权重进行量化,得到反向定点型权重和反向权重值量化超参;基于所述定点型激活梯度值、所述反向定点型权重、所述激活值量化超参和所述反向权重值量化超参,确定所述网络层的前一个网络层对应的浮点型激活梯度值。通过本申请的技术方案,可以减轻运算复杂度,运算量较小,资源消耗较小,能够对训练过程进行加速。

    神经网络模型裁剪方法、装置、电子设备及存储介质

    公开(公告)号:CN114897164A

    公开(公告)日:2022-08-12

    申请号:CN202210615980.0

    申请日:2022-05-31

    Abstract: 本申请提供一种神经网络模型裁剪方法、装置、电子设备及存储介质,该方法包括:依据待裁剪神经网络模型的结构特性,将所述待裁剪神经网络模型划分为多个结构分组;依据对所述待裁剪神经网络模型进行裁剪前后的损失函数变化,确定对所述多个结构分组中各结构分组进行裁剪的目标裁剪率;其中,所述损失函数变化依据第一因子和第二因子确定,所述第一因子用于表征各结构分组中各个权重的重要性,所述第二因子用于表征不同结构分组之间的相互作用;依据所述目标裁剪率,分别对各结构分组进行裁剪,得到裁剪后的神经网络模型。该方法可以在较小性能损失的情况下加速压缩神经网络模型。

    神经网络的训练方法、装置及设备

    公开(公告)号:CN114202052A

    公开(公告)日:2022-03-18

    申请号:CN202010911838.1

    申请日:2020-09-02

    Abstract: 本发明提供一种神经网络的训练方法、装置及设备、存储介质,可更好地保证结果的精度与特征图的稀疏度。该方法包括:将样本数据输入至第一神经网络中,得到第一神经网络输出的预测标签、以及第一神经网络的至少一个指定处理层输出的特征图,特征图是在第一神经网络确定预测标签的过程中输出的,特征图包含多个特征值;依据预测标签与样本数据对应的样本标签并采用预设的损失函数确定损失值,损失值用于表征预测标签与样本标签之间的差异;依据特征图确定用于表征特征图的稀疏度的稀疏度值;依据损失值与稀疏度值确定用于优化第一神经网络的优化参数值;依据优化参数值优化第一神经网络得到第二神经网络。

    一种目标检测方法、装置及电子设备

    公开(公告)号:CN111767935A

    公开(公告)日:2020-10-13

    申请号:CN201911056322.7

    申请日:2019-10-31

    Abstract: 本发明实施例提供了一种目标检测方法、装置及电子设备。其中,所述方法包括:获取待处理图像在多个降采样倍率下的多个初始图像特征;针对除目标降采样倍率外其他降采样倍率下的各个初始图像特征,将该初始图像特征缩放至所述目标降采样倍率,得到映射图像特征;融合所述目标降采样倍率下的初始图像特征和各个所述映射图像特征,得到所述目标降采样倍率下的融合图像特征;将所述目标降采样倍率下的融合图像特征缩放至各个所述其他降采样倍率,得到各个所述其他降采样倍率下的融合图像特征;基于所述待处理图像在所述多个降采样倍率下的融合图像特征,对所述待处理图像进行目标检测。可以提高目标检测的准确性。

    一种前向耗时的确定方法、装置及设备

    公开(公告)号:CN111753978A

    公开(公告)日:2020-10-09

    申请号:CN202010062755.X

    申请日:2020-01-19

    Abstract: 本申请提供一种前向耗时的确定方法、装置及设备,该方法包括:将待测神经网络划分为多个操作节点;从所述多个操作节点中选取至少一个操作节点作为目标操作节点;针对每个目标操作节点,确定与所述目标操作节点对应的操作节点集合,所述操作节点集合包括所述目标操作节点和所述目标操作节点的关联操作节点,所述关联操作节点为所述多个操作节点中除所述目标操作节点之外的操作节点;根据所述操作节点集合的信息获取所述目标操作节点的耗时;根据每个目标操作节点的耗时确定所述待测神经网络的前向耗时。通过本申请的技术方案,能够有效预测待测神经网络的前向耗时。

    多模态大语言模型量化方法、装置、设备、存储介质及产品

    公开(公告)号:CN119227770B

    公开(公告)日:2025-04-08

    申请号:CN202411755976.X

    申请日:2024-12-03

    Abstract: 本申请涉及模型部署技术领域,公开了多模态大语言模型量化方法、装置、设备、存储介质及产品,包括:将待量化大模型划分为多模态处理分块以及语言模型分块;根据多模态处理分块中各处理子模块对应的量化误差构建处理子模块序列;基于处理子模块序列对多模态处理分块中各处理子模块分别进行量化;根据量化后的所述多模态处理分块确定语言子模块序列;依据语言子模块序列对所述语言模型分块中各语言子模块分别进行量化。由于可依据多模态语言大模型的计算特性进行针对性的模块划分,并基于模块划分顺序进行量化调整,确保量化符合模型的实际计算特性,提升了对多模态语言大模型进行量化部署的效果。

    基于模型量化的任务处理方法、装置、设备及存储介质

    公开(公告)号:CN119647530A

    公开(公告)日:2025-03-18

    申请号:CN202411708331.0

    申请日:2022-09-27

    Abstract: 本申请提供一种基于模型量化的任务处理方法、装置、设备及存储介质,该基于模型量化的任务处理方法包括:依据Transformer模型中优化单元的第一量化输出和第一浮点输出之间的差异,对优化单元的权重量化系数和激活量化系数进行更新;依据优化单元的第二量化输出和第二浮点输出之间的差异,对优化单元的权重量化增量进行更新;依据目标量化系数对优化单元的权重参数进行量化,并依据目标权重量化增量确定优化单元的权重量化取整方向;依据优化单元的目标量化权重参数对优化单元的输入数据进行前向推理计算,并依据优化单元的目标激活量化系数对优化单元的输入/输出进行量化。该方法可以提升任务处理的准确性。

Patent Agency Ranking