一种前向耗时的确定方法、装置及设备

    公开(公告)号:CN111753950A

    公开(公告)日:2020-10-09

    申请号:CN202010062768.7

    申请日:2020-01-19

    Abstract: 本申请提供一种前向耗时的确定方法、装置及设备,该方法包括:将待测神经网络划分为多个子网络;从多个子网络中选取至少一个子网络作为目标子网络;针对每个目标子网络,确定与所述目标子网络对应的子网络集合;子网络集合包括所述目标子网络和所述目标子网络的关联子网络,所述关联子网络为多个子网络中除所述目标子网络之外的子网络;根据子网络集合的信息获取所述目标子网络的耗时;根据每个目标子网络的耗时确定待测神经网络的前向耗时。通过本申请的技术方案,能够有效预测待测神经网络的前向耗时。

    一种前向耗时的确定方法、装置及设备

    公开(公告)号:CN111753978B

    公开(公告)日:2024-03-01

    申请号:CN202010062755.X

    申请日:2020-01-19

    Abstract: 本申请提供一种前向耗时的确定方法、装置及设备,该方法包括:将待测神经网络划分为多个操作节点;从所述多个操作节点中选取至少一个操作节点作为目标操作节点;针对每个目标操作节点,确定与所述目标操作节点对应的操作节点集合,所述操作节点集合包括所述目标操作节点和所述目标操作节点的关联操作节点,所述关联操作节点为所述多个操作节点中除所述目标操作节点之外的操作节点;根据所述操作节点集合的信息获取所述目标操作节点的耗时;根据每个目标操作节点的耗时确定所述待测神经网络的前向耗时。通过本申请的技术方案,能够有效预测待测神经网络的前向耗时。

    一种前向耗时的确定方法、装置及设备

    公开(公告)号:CN111753978A

    公开(公告)日:2020-10-09

    申请号:CN202010062755.X

    申请日:2020-01-19

    Abstract: 本申请提供一种前向耗时的确定方法、装置及设备,该方法包括:将待测神经网络划分为多个操作节点;从所述多个操作节点中选取至少一个操作节点作为目标操作节点;针对每个目标操作节点,确定与所述目标操作节点对应的操作节点集合,所述操作节点集合包括所述目标操作节点和所述目标操作节点的关联操作节点,所述关联操作节点为所述多个操作节点中除所述目标操作节点之外的操作节点;根据所述操作节点集合的信息获取所述目标操作节点的耗时;根据每个目标操作节点的耗时确定所述待测神经网络的前向耗时。通过本申请的技术方案,能够有效预测待测神经网络的前向耗时。

    一种前向耗时的确定方法、装置及设备

    公开(公告)号:CN111753950B

    公开(公告)日:2024-02-27

    申请号:CN202010062768.7

    申请日:2020-01-19

    Abstract: 本申请提供一种前向耗时的确定方法、装置及设备,该方法包括:将待测神经网络划分为多个子网络;从多个子网络中选取至少一个子网络作为目标子网络;针对每个目标子网络,确定与所述目标子网络对应的子网络集合;子网络集合包括所述目标子网络和所述目标子网络的关联子网络,所述关联子网络为多个子网络中除所述目标子网络之外的子网络;根据子网络集合的信息获取所述目标子网络的耗时;根据每个目标子网络的耗时确定待测神经网络的前向耗时。通过本申请的技术方案,能够有效预测待测神经网络的前向耗时。

    一种模型蒸馏方法、装置、存储介质和电子设备

    公开(公告)号:CN117350365A

    公开(公告)日:2024-01-05

    申请号:CN202311269007.9

    申请日:2023-09-27

    Abstract: 本申请公开了一种模型蒸馏方法、装置、存储介质和电子设备,包括:利用通识模型对不同领域的存量数据样本进行识别;利用目标任务的训练样本集训练生成教师模型;利用通识模型对训练样本集中的训练样本进行识别;确定与训练样本语义相关的存量数据样本构成初筛样本集;为初筛样本集和训练样本集中的样本确定各实例的实例特征;在初筛样本集中选择其实例特征与训练样本的实例特征的相似程度在指定范围内的存量数据样本,构成搜索样本集;将搜索样本集和训练样本集作为蒸馏样本集,利用教师模型进行蒸馏训练,得到蒸馏后的学生模型。应用本申请,能够对训练样本域进行扩张,再基于扩张后多领域的样本进行蒸馏处理,从而提高模型在多场景的泛化能力。

    检测模型蒸馏方法、目标检测方法、装置及电子设备

    公开(公告)号:CN117593624A

    公开(公告)日:2024-02-23

    申请号:CN202311523725.4

    申请日:2023-11-14

    Abstract: 本申请公开一种检测模型蒸馏方法、目标检测方法、装置及电子设备,涉及机器学习技术领域,用于训练出精度更高的学生模型,得到更好的目标检测结果。该方法包括:将样本图像分别输入教师模型和学生模型,从教师模型对样本图像进行处理后输出的识别结果中筛选出教师正样本识别结果;对于每个教师正样本识别结果,从学生模型对样本图像进行处理后预设的多个锚框中确定与教师正样本识别结果匹配的目标锚框;对每对相匹配的教师正样本识别结果和目标锚框进行逻辑输出蒸馏,得到逻辑输出蒸馏损失;基于识别结果真值,确定检测任务损失;基于逻辑输出蒸馏损失,以及检测任务损失,对学生模型进行训练,得到训练后的学生模型。

Patent Agency Ranking