-
公开(公告)号:CN118838722B
公开(公告)日:2025-02-11
申请号:CN202411328221.1
申请日:2024-09-23
Applicant: 杭州海康威视数字技术股份有限公司
Abstract: 本申请实施例提供了一种算子优化方法、装置、电子设备及存储介质,涉及到计算机技术领域,方法包括:在深度学习模型推理过程中,获取待优化算子计算过程的内存占用量及计算耗时;在所述内存占用量超过片上内存的情况下,基于所述待优化算子的内存占用量及计算耗时,按照最小化运行时间的优化方式对所述待优化算子进行优化,其中,所述运行时间包括所述计算耗时和数据交互耗时,所述数据交互耗时与所述内存占用量正相关。本申请实施例实现了提高深度学习模型的推理速度。
-
公开(公告)号:CN117724819A
公开(公告)日:2024-03-19
申请号:CN202311829328.X
申请日:2023-12-27
Applicant: 杭州海康威视数字技术股份有限公司
IPC: G06F9/48 , G06F9/50 , G06N3/10 , G06N3/0464
Abstract: 本申请提供了网络模型分散加载方法、装置及电子设备。本申请,在终端设备加载神经网络模型时,会先依据终端设备的当前可用内存空间DM,确定DM是否满足终端设备当前待加载的神经网络模型所需的存储资源要求,在确定DM不满足待加载的神经网络模型所需的存储资源要求时,依据DM对神经网络模型中的网络层进行分段,以使得任一分段被终端设备加载运行时所需要的存储资源小于DM,之后,终端设备按照神经网络模型被运行时的操作顺序依次加载分段并运行,这实现了终端设备通过神经网络模型分散加载的方式加载神经网络模型,避免神经网络模型本身容量和计算指令的内存占用量与终端设备本地可用内存的冲突。
-
公开(公告)号:CN117271069A
公开(公告)日:2023-12-22
申请号:CN202210657573.6
申请日:2022-06-10
Applicant: 杭州海康威视数字技术股份有限公司
IPC: G06F9/48 , G06F18/214 , G06N3/08
Abstract: 本申请提供一种处理器的调度方法、装置、设备及存储介质,涉及视频监控及分析领域。该方法应用于第一电子设备,第一电子设备包括多种处理器。该方法包括:获取第一计算机视觉CV算子的特征信息;根据第一特征信息和预设的调度模型,确定与第一CV算子对应的目标处理器;目标处理器是多种处理器中的一种;利用目标处理器执行第一CV算子。该方法适用于执行CV算子的过程中,用于优化CV算子的执行效果。
-
公开(公告)号:CN116361427A
公开(公告)日:2023-06-30
申请号:CN202111627296.6
申请日:2021-12-28
Applicant: 杭州海康威视数字技术股份有限公司
IPC: G06F16/332 , G06F16/36
Abstract: 本申请实施例提供了一种网络拓扑结构解析方法和电子设备,涉及机器学习技术领域。该方法包括:获取网络模型的代码,作为目标代码。在目标代码中查找第一关键字,第一关键字用于指示目标代码的框架语言,第一关键字包括在预设的关键字数据库中。根据第一关键字,确定目标代码的第一框架语言。根据第一框架语言,确定网络模型的网络拓扑结构。从而简单快捷地得到该网络模型的网络拓扑结构,解析效率较高,且无需配置深度学习框架的运行环境,易于使用。
-
公开(公告)号:CN109032610A
公开(公告)日:2018-12-18
申请号:CN201710429234.1
申请日:2017-06-08
Applicant: 杭州海康威视数字技术股份有限公司
IPC: G06F8/60 , G06K9/00 , G06N99/00 , H04L12/931
CPC classification number: G06F8/60 , G06F9/445 , G06K9/00 , G06N99/00 , G06K9/00979 , H04L49/358
Abstract: 本发明实施例提供了一种程序包部署方法、电子设备及分布式系统,该方法应用于第一计算节点,包括:接收训练任务信息,训练任务信息中包含执行训练任务的各台计算节点信息;根据训练任务信息,确定第一计算节点的状态是否为主用状态;如果为主用状态,获取训练程序包,并将所获取的训练程序包部署到执行训练任务的各台计算节点。可见,本方案中,只有主用状态的计算节点获取训练程序包,并将所获取的训练程序包部署到执行训练任务的各台计算节点,也就是说,并不是每台计算节点都从管理设备中获取程序包,降低了网络带宽压力。
-
公开(公告)号:CN104461594A
公开(公告)日:2015-03-25
申请号:CN201310433674.6
申请日:2013-09-22
Applicant: 杭州海康威视数字技术股份有限公司
IPC: G06F9/445
Abstract: 本发明公开了一种嵌入式操作系统的升级方法及装置,在上述方法中,接收来自于服务器的升级文件包,并将升级文件包存储至预设存储区域;对嵌入式操作系统进行重新启动,从预设存储区域中获取升级文件包并对升级文件包进行完整性和准确性校验;如果校验成功,则采用升级文件包进行升级操作,并在升级操作完成后采用EWF中的预设命令将在升级操作过程中修改的数据写入受保护的磁盘。根据本发明提供的技术方案,实现了对嵌入式设备进行远程升级,且升级操作可靠性强、安全性高。
-
公开(公告)号:CN114296942A
公开(公告)日:2022-04-08
申请号:CN202111674182.7
申请日:2021-12-28
Applicant: 杭州海康威视数字技术股份有限公司
IPC: G06F9/50
Abstract: 本发明实施例提供的一种内存管理方法、装置、电子设备及存储介质,应用于智能算法的技术领域,包括:针对多个待分配内存的网络模型中的每一个网络模型,获取该网络模型在运行过程中所需的各类型内存的大小;针对每一类型的内存,根据所述多个待分配内存的网络模型在运行过程中所需的各类型内存的大小计算该类型的内存对应的共享内存的大小;根据计算得到的每一类型的内存对应的共享内存的大小,创建每一类型对应的共享内存。通过本申请实施例的方法,可以获取并根据多个待分配内存的网络模型所需的多种类型的内存的大小,计算并创建共享内存,从而通过共享内存进行模型的训练,降低模型训练过程中内存的压力。
-
公开(公告)号:CN113743598A
公开(公告)日:2021-12-03
申请号:CN202010462971.3
申请日:2020-05-27
Applicant: 杭州海康威视数字技术股份有限公司
Abstract: 本申请实施例提供了一种AI芯片的运行方式的确定方法和装置,方法包括:获得目标神经网络模型;获得AI芯片支持的运行方式的不同组合,每种组合包括:目标神经网络模型中的各个网络层的运行方式;使得AI芯片基于不同组合,用目标神经网络模型对第一预设测试数据进行多次处理;获得AI芯片每次对第一预设测试数据处理完成所用的第一处理时长;选择第一处理时长最短的组合中包括的运行方式,确定为基于目标神经网络模型对数据进行处理时,AI芯片的运行方式,基于上述处理,能够提高基于神经网络模型进行数据处理的效率。
-
公开(公告)号:CN118838722A
公开(公告)日:2024-10-25
申请号:CN202411328221.1
申请日:2024-09-23
Applicant: 杭州海康威视数字技术股份有限公司
Abstract: 本申请实施例提供了一种算子优化方法、装置、电子设备及存储介质,涉及到计算机技术领域,方法包括:在深度学习模型推理过程中,获取待优化算子计算过程的内存占用量及计算耗时;在所述内存占用量超过片上内存的情况下,基于所述待优化算子的内存占用量及计算耗时,按照最小化运行时间的优化方式对所述待优化算子进行优化,其中,所述运行时间包括所述计算耗时和数据交互耗时,所述数据交互耗时与所述内存占用量正相关。本申请实施例实现了提高深度学习模型的推理速度。
-
公开(公告)号:CN116861952A
公开(公告)日:2023-10-10
申请号:CN202210289267.1
申请日:2022-03-22
Applicant: 杭州海康威视数字技术股份有限公司
Abstract: 本申请实施例提供了一种计算图切分方法、装置、电子设备及存储介质。获取单向无环图;确定算子的预设优化类别为不参与算子融合的节点,作为第一类节点;针对每一第一类节点,将该第一类节点的父节点中的第二类节点标记为缩点中止节点,将该第一类节点的子节点中的第二类节点标记为缩点起始节点;根据每一关系边连接的两个节点的节点类型,确定该关系边的权重;基于缩点中止节点、缩点起始节点和每一关系边的权重进行缩点处理,得到缩点图;基于缩点图对单向无环图进行切分,得到多个第一子计算图。通过本申请实施例提供的技术方案,使得切分得到的各子计算图间的依赖关系较低,以及切分得到的子计算图的数量较少,从而提高网络模型的处理效率。
-
-
-
-
-
-
-
-
-