-
公开(公告)号:CN110874636A
公开(公告)日:2020-03-10
申请号:CN201811027522.5
申请日:2018-09-04
Applicant: 杭州海康威视数字技术股份有限公司
Abstract: 本申请提供一种神经网络模型压缩方法、装置和计算机设备。本申请提供的神经网络模型压缩方法,包括:针对待压缩神经网络模型的每一个原始卷积层,将原始卷积层分解为级联的多个目标卷积层;获取原始卷积层对输入数据进行卷积处理后的第一卷积处理结果,以及级联的多个目标卷积层依序对输入数据进行卷积处理后的第二卷积处理结果;根据第一卷积处理结果和第二卷积处理结果,对级联的多个目标卷积层的权值矩阵进行修正处理,得到压缩后的神经网络模型。本申请提供的神经网络模型压缩方法、装置和计算机设备,通过对该级联的多个目标卷积层的权值矩阵进行修正处理,这样,可避免因模型压缩导致的性能损失。
-
公开(公告)号:CN110659658A
公开(公告)日:2020-01-07
申请号:CN201810713179.3
申请日:2018-06-29
Applicant: 杭州海康威视数字技术股份有限公司
Abstract: 本申请提供一种目标检测方法及其装置,该方法包括:利用预先训练的尺度回归网络确定待检测图像中各分块的缩放系数;按照所述缩放系数对各分块进行缩放;分别对缩放后的各分块进行目标检测;对各分块中的目标进行融合输出,以得到所述待检测图像中的目标检测结果。该方法可以降低目标检测模型的复杂度和训练难度,并提高目标检测的准确率。
-
公开(公告)号:CN109583266A
公开(公告)日:2019-04-05
申请号:CN201710900835.6
申请日:2017-09-28
Applicant: 杭州海康威视数字技术股份有限公司
Inventor: 谭文明
Abstract: 本发明实施例提供了一种目标检测方法、装置、计算机设备及存储介质,其中,目标检测方法包括:基于待检测目标的特征信息,分别提取视频中多个视频帧的特征信息;采用预设多特征融合方式,将各视频帧的特征信息进行融合,得到融合特征;基于融合特征,对待检测目标进行检测。通过本方案可以提高目标检测性能。
-
公开(公告)号:CN102136075B
公开(公告)日:2013-05-15
申请号:CN201110051942.9
申请日:2011-03-04
Applicant: 杭州海康威视数字技术股份有限公司
IPC: G06K9/66
Abstract: 本发明涉及视频监控领域,公开了一种复杂场景下的多视角人脸检测方法及其装置。本发明中,在对待测子窗口进行人脸检测的级联矢量树结构检测器中,在至少一个分支节点分类器之前,有至少一个级联的无分支节点分类器。通过在分支节点分类器之间引入级联分类器,利用级联分类器对各个分支上的非人脸子窗口进行逐级有效的去除,降低了分支节点分类器的复杂度,减少了所含的弱分类器个数,从而在保证检测率的同时提高检测速度。
-
公开(公告)号:CN119903348A
公开(公告)日:2025-04-29
申请号:CN202510399045.9
申请日:2025-03-31
Applicant: 杭州海康威视数字技术股份有限公司
IPC: G06F18/214 , G06F18/2431 , G06N5/04 , G06F18/22
Abstract: 本申请实施例提供了一种多模态大模型训练方法、目标检测方法、装置及电子设备,涉及人工智能技术领域,多模态大模型训练方法包括:获取多个样本图像和图像中对象标注框的第一样本描述文本;利用第一大语言模型和第一文本提示,提取每一样本图像对应的第一样本描述文本所描述的对象的类别名称以及属性,并将得到的类别名称与属性中的至少一个进行组合,得到第二样本描述文本;确定该样本图像中每一对象标注框与对应的多个第二样本描述文本的每一属性是否相匹配;构建包含第二样本描述文本的样本问题以及对应的思维链形式的样本回答,得到问答样本对;利用构建的问答样本对进行多模态大模型的训练。可以降低描述性目标检测的复杂性,提高检测效率。
-
公开(公告)号:CN119150997B
公开(公告)日:2025-03-28
申请号:CN202411650667.6
申请日:2024-11-19
Applicant: 杭州海康威视数字技术股份有限公司
IPC: G06N5/04 , G06N20/00 , G06F16/583 , G06F16/3329
Abstract: 本申请公开了多模态大模型的训练方法、装置、存储介质和电子设备,训练方法包括:利用预先训练的用于进行标签标注的标签专家LMM,对原始多模态训练数据预测标签;基于答案评级标签对原始多模态训练数据进行过滤,得到过滤数据集;基于过滤数据集中的所有数据样本的图像标签和指令标签,从过滤数据集中选择数据样本作为采样数据,使基于所有采样数据的图像标签和指令标签确定的标签熵最大化;将采样数据作为训练样本进行多模态大模型的训练。应用本申请,能够利用筛选后的训练数据进行多模态大模型训练,并有效保证多模态大模型的性能。
-
公开(公告)号:CN119227757B
公开(公告)日:2025-03-04
申请号:CN202411752106.7
申请日:2024-12-02
Applicant: 杭州海康威视数字技术股份有限公司
IPC: G06N3/0495 , G06N3/08
Abstract: 本申请实施例提供了一种模型压缩方法、装置、电子设备、存储介质及产品,涉及深度学习技术领域,方法包括:针对同一输入数据,分别利用待压缩模型和量化模型进行处理;计算待压缩模型与量化模型的输出数据之间的差异,作为量化模型对应的第一差异;按照第一差异对待压缩模型中每一网络层的量化参数进行调整;基于每一网络层的最优量化参数计算该网络层的连续域量化位宽;从需要部署模型的硬件平台所支持的各离散域量化位宽中,确定大于该网络层的连续域量化位宽且与该网络层的连续域量化位宽的差值最小的离散域量化位宽;从利用多个稀疏度组合分别进行压缩得到的各备选压缩模型中,确定对应的第二差异最小的目标压缩模型。可以提高模型的适用性。
-
公开(公告)号:CN119227770A
公开(公告)日:2024-12-31
申请号:CN202411755976.X
申请日:2024-12-03
Applicant: 杭州海康威视数字技术股份有限公司
IPC: G06N3/082
Abstract: 本申请涉及模型部署技术领域,公开了多模态大语言模型量化方法、装置、设备、存储介质及产品,包括:将待量化大模型划分为多模态处理分块以及语言模型分块;根据多模态处理分块中各处理子模块对应的量化误差构建处理子模块序列;基于处理子模块序列对多模态处理分块中各处理子模块分别进行量化;根据量化后的所述多模态处理分块确定语言子模块序列;依据语言子模块序列对所述语言模型分块中各语言子模块分别进行量化。由于可依据多模态语言大模型的计算特性进行针对性的模块划分,并基于模块划分顺序进行量化调整,确保量化符合模型的实际计算特性,提升了对多模态语言大模型进行量化部署的效果。
-
公开(公告)号:CN118839742B
公开(公告)日:2024-12-20
申请号:CN202411329970.6
申请日:2024-09-24
Applicant: 杭州海康威视数字技术股份有限公司
IPC: G06N3/082 , G06N3/0495 , G06N3/045
Abstract: 本申请涉及模型量化技术领域,公开了模型量化方法、装置、设备、存储介质及产品,包括:获取初始浮点模型的模型输出数据,以及初始浮点模型的输出层各输出节点对应的相关性分值,并获取初始浮点模型中各层网络对应的单层量化输出数据;计算初始浮点模型中各层网络分别对应的敏感度评估值;根据敏感度评估值从初始浮点模型中各层网络中选取待调整网络;对初始浮点模型中待调整网络及其他层网络设置量化配置;根据设置后的量化配置对初始浮点模型进行模型量化。由于是根据可表征网络的量化对模型输出影响程度的敏感度评估值选取部分网络作为待调整网络,并将待调整网络设置为量化精度较高的量化配置,保证了可合理的调整量化方式,提高量化效果。
-
公开(公告)号:CN119150997A
公开(公告)日:2024-12-17
申请号:CN202411650667.6
申请日:2024-11-19
Applicant: 杭州海康威视数字技术股份有限公司
IPC: G06N5/04 , G06N20/00 , G06F16/583 , G06F16/332
Abstract: 本申请公开了多模态大模型的训练方法、装置、存储介质和电子设备,训练方法包括:利用预先训练的用于进行标签标注的标签专家LMM,对原始多模态训练数据预测标签;基于答案评级标签对原始多模态训练数据进行过滤,得到过滤数据集;基于过滤数据集中的所有数据样本的图像标签和指令标签,从过滤数据集中选择数据样本作为采样数据,使基于所有采样数据的图像标签和指令标签确定的标签熵最大化;将采样数据作为训练样本进行多模态大模型的训练。应用本申请,能够利用筛选后的训练数据进行多模态大模型训练,并有效保证多模态大模型的性能。
-
-
-
-
-
-
-
-
-