-
公开(公告)号:CN118839167B
公开(公告)日:2024-12-31
申请号:CN202411316530.7
申请日:2024-09-20
Applicant: 杭州海康威视数字技术股份有限公司
IPC: G06F18/214 , G06F18/241 , G06N3/096 , G06N3/045 , G06N3/0464 , G06N3/0455
Abstract: 本申请实施例提供了一种数据生成、模型蒸馏方法、装置、电子设备及存储介质,涉及计算机技术领域,该方法包括:获取第一训练数据,并获取第一分组对应的第一语义描述集合,第一语义描述集合包括第一分组中的训练数据对应的多个语义描述;从第一语义描述集合中,选择多个第一语义描述;根据第一训练数据、第一分组的标识和多个第一语义描述,确定数据生成条件;将数据生成条件输入生成模型,得到第二训练数据。该方法能够在较快的速度、较低的成本下获得多样化数据,解决学生模型蒸馏中过拟合和泛化性差的问题。
-
公开(公告)号:CN111753950A
公开(公告)日:2020-10-09
申请号:CN202010062768.7
申请日:2020-01-19
Applicant: 杭州海康威视数字技术股份有限公司
IPC: G06N3/04
Abstract: 本申请提供一种前向耗时的确定方法、装置及设备,该方法包括:将待测神经网络划分为多个子网络;从多个子网络中选取至少一个子网络作为目标子网络;针对每个目标子网络,确定与所述目标子网络对应的子网络集合;子网络集合包括所述目标子网络和所述目标子网络的关联子网络,所述关联子网络为多个子网络中除所述目标子网络之外的子网络;根据子网络集合的信息获取所述目标子网络的耗时;根据每个目标子网络的耗时确定待测神经网络的前向耗时。通过本申请的技术方案,能够有效预测待测神经网络的前向耗时。
-
公开(公告)号:CN111753978B
公开(公告)日:2024-03-01
申请号:CN202010062755.X
申请日:2020-01-19
Applicant: 杭州海康威视数字技术股份有限公司
Abstract: 本申请提供一种前向耗时的确定方法、装置及设备,该方法包括:将待测神经网络划分为多个操作节点;从所述多个操作节点中选取至少一个操作节点作为目标操作节点;针对每个目标操作节点,确定与所述目标操作节点对应的操作节点集合,所述操作节点集合包括所述目标操作节点和所述目标操作节点的关联操作节点,所述关联操作节点为所述多个操作节点中除所述目标操作节点之外的操作节点;根据所述操作节点集合的信息获取所述目标操作节点的耗时;根据每个目标操作节点的耗时确定所述待测神经网络的前向耗时。通过本申请的技术方案,能够有效预测待测神经网络的前向耗时。
-
公开(公告)号:CN113869491A
公开(公告)日:2021-12-31
申请号:CN202111075279.6
申请日:2021-09-14
Applicant: 杭州海康威视数字技术股份有限公司
Abstract: 本申请提供一种网络模型确定方法、装置、电子设备及可读存储介质,该方法包括:依据预设搜索空间构建超网络;依据所述超网络,分别训练得到浮点超网络、浮点比特超网络、N1/N2比特超网络;其中,N1、N2为正整数;依据所述浮点超网络、浮点比特超网络、N1/N2比特超网络,进行模型结构和混合比特联合搜索,确定最终模型结构和量化比特。该方法可以在优化所确定的最终网络模型的性能的情况下,减少搜索空间,提高搜索效率。
-
公开(公告)号:CN111753978A
公开(公告)日:2020-10-09
申请号:CN202010062755.X
申请日:2020-01-19
Applicant: 杭州海康威视数字技术股份有限公司
Abstract: 本申请提供一种前向耗时的确定方法、装置及设备,该方法包括:将待测神经网络划分为多个操作节点;从所述多个操作节点中选取至少一个操作节点作为目标操作节点;针对每个目标操作节点,确定与所述目标操作节点对应的操作节点集合,所述操作节点集合包括所述目标操作节点和所述目标操作节点的关联操作节点,所述关联操作节点为所述多个操作节点中除所述目标操作节点之外的操作节点;根据所述操作节点集合的信息获取所述目标操作节点的耗时;根据每个目标操作节点的耗时确定所述待测神经网络的前向耗时。通过本申请的技术方案,能够有效预测待测神经网络的前向耗时。
-
公开(公告)号:CN118839167A
公开(公告)日:2024-10-25
申请号:CN202411316530.7
申请日:2024-09-20
Applicant: 杭州海康威视数字技术股份有限公司
IPC: G06F18/214 , G06F18/241 , G06N3/096 , G06N3/045 , G06N3/0464 , G06N3/0455
Abstract: 本申请实施例提供了一种数据生成、模型蒸馏方法、装置、电子设备及存储介质,涉及计算机技术领域,该方法包括:获取第一训练数据,并获取第一分组对应的第一语义描述集合,第一语义描述集合包括第一分组中的训练数据对应的多个语义描述;从第一语义描述集合中,选择多个第一语义描述;根据第一训练数据、第一分组的标识和多个第一语义描述,确定数据生成条件;将数据生成条件输入生成模型,得到第二训练数据。该方法能够在较快的速度、较低的成本下获得多样化数据,解决学生模型蒸馏中过拟合和泛化性差的问题。
-
公开(公告)号:CN111753950B
公开(公告)日:2024-02-27
申请号:CN202010062768.7
申请日:2020-01-19
Applicant: 杭州海康威视数字技术股份有限公司
Abstract: 本申请提供一种前向耗时的确定方法、装置及设备,该方法包括:将待测神经网络划分为多个子网络;从多个子网络中选取至少一个子网络作为目标子网络;针对每个目标子网络,确定与所述目标子网络对应的子网络集合;子网络集合包括所述目标子网络和所述目标子网络的关联子网络,所述关联子网络为多个子网络中除所述目标子网络之外的子网络;根据子网络集合的信息获取所述目标子网络的耗时;根据每个目标子网络的耗时确定待测神经网络的前向耗时。通过本申请的技术方案,能够有效预测待测神经网络的前向耗时。
-
公开(公告)号:CN117350365A
公开(公告)日:2024-01-05
申请号:CN202311269007.9
申请日:2023-09-27
Applicant: 杭州海康威视数字技术股份有限公司
IPC: G06N3/096 , G06N3/0455 , G06N3/0464 , G06V10/82 , G06V10/44 , G06V10/762 , G06V10/764
Abstract: 本申请公开了一种模型蒸馏方法、装置、存储介质和电子设备,包括:利用通识模型对不同领域的存量数据样本进行识别;利用目标任务的训练样本集训练生成教师模型;利用通识模型对训练样本集中的训练样本进行识别;确定与训练样本语义相关的存量数据样本构成初筛样本集;为初筛样本集和训练样本集中的样本确定各实例的实例特征;在初筛样本集中选择其实例特征与训练样本的实例特征的相似程度在指定范围内的存量数据样本,构成搜索样本集;将搜索样本集和训练样本集作为蒸馏样本集,利用教师模型进行蒸馏训练,得到蒸馏后的学生模型。应用本申请,能够对训练样本域进行扩张,再基于扩张后多领域的样本进行蒸馏处理,从而提高模型在多场景的泛化能力。
-
公开(公告)号:CN117593624A
公开(公告)日:2024-02-23
申请号:CN202311523725.4
申请日:2023-11-14
Applicant: 杭州海康威视数字技术股份有限公司
Abstract: 本申请公开一种检测模型蒸馏方法、目标检测方法、装置及电子设备,涉及机器学习技术领域,用于训练出精度更高的学生模型,得到更好的目标检测结果。该方法包括:将样本图像分别输入教师模型和学生模型,从教师模型对样本图像进行处理后输出的识别结果中筛选出教师正样本识别结果;对于每个教师正样本识别结果,从学生模型对样本图像进行处理后预设的多个锚框中确定与教师正样本识别结果匹配的目标锚框;对每对相匹配的教师正样本识别结果和目标锚框进行逻辑输出蒸馏,得到逻辑输出蒸馏损失;基于识别结果真值,确定检测任务损失;基于逻辑输出蒸馏损失,以及检测任务损失,对学生模型进行训练,得到训练后的学生模型。
-
-
-
-
-
-
-
-