-
公开(公告)号:CN114581952A
公开(公告)日:2022-06-03
申请号:CN202210242524.6
申请日:2022-03-11
Applicant: 浪潮(北京)电子信息产业有限公司
Abstract: 本申请公开了一种行人重识别方法、系统、装置、设备及计算机可读存储介质,应用于异构计算设备,获取图像特征、量化参数、指令序列和滤波系数;图像特征包括待识别的目标行人图像的图像特征;按照指令序列对图像特征进行池化处理,得到池化处理结果;按照指令序列并基于量化参数和滤波系数对图像特征进行卷积处理,得到卷积处理结果;基于池化处理结果和卷积处理结果确定目标行人图像对应的行人重识别结果。本申请借助异构计算设备实现了行人重识别网络,可以提高计算效率,能效比及灵活性高,适用性好。本申请提供的一种行人重识别系统、装置、设备及计算机可读存储介质也解决了相应技术问题。
-
公开(公告)号:CN111124491A
公开(公告)日:2020-05-08
申请号:CN201911288737.7
申请日:2019-12-12
Applicant: 浪潮(北京)电子信息产业有限公司
Abstract: 本申请公开了一种批处理方法、装置、设备及存储介质,该方法的步骤包括:获取批数据以及指令流,指令流的指令中包含执行标志位;在指令流的指令中选取执行标志位对应的状态信息满足可执行标准的目标指令;根据目标指令对批数据执行批处理操作。本方法相对避免了运算设备执行未与批数据中的数据对应的多余指令,进而确保了批处理操作的可靠性。此外,本申请还提供一种批处理装置、设备及存储介质,有益效果同上所述。
-
公开(公告)号:CN114219080B
公开(公告)日:2025-02-11
申请号:CN202111682484.9
申请日:2021-12-31
Applicant: 浪潮(北京)电子信息产业有限公司
IPC: G06N3/0464 , G06N3/063
Abstract: 本申请公开了一种神经网络加速处理方法,包括:加速设备从片上特征缓存模块获取特征数据;从片上权重缓存模块获取权重数据;采用逐点处理阵列中的多个处理组合以流水线的方式对特征数据和权重数据进行并行卷积计算,得到逐点卷积结果;采用累加模块对逐点卷积结果进行累加计算处理,得到逐点累加处理结果;采用逐通道处理阵列以流水线的方式对逐点累加处理结果和片上权重缓存模块中对应的权重数据进行并行卷积计算,得到逐通道卷积结果,提高对卷积计算进行加速的效果,并且兼容处理深度可分离卷积和普通卷积。本申请还公开了一种神经网络加速处理装置、加速系统以及计算机可读存储介质,具有以上有益效果。
-
公开(公告)号:CN111143272A
公开(公告)日:2020-05-12
申请号:CN201911385140.4
申请日:2019-12-28
Applicant: 浪潮(北京)电子信息产业有限公司
IPC: G06F15/173
Abstract: 本申请公开了一种异构计算平台的数据处理方法、装置及计算机可读存储介质。其中,方法包括预先在主机内存空间中开辟数据存储区域和数据处理结果存储区域,在FPGA加速板卡内存空间中开辟待处理数据存储区域和计算结果存储区域。主机将待计算数据存储在数据存储区域后,向FPGA加速板卡下发数据处理请求,FPGA加速板卡主动从数据存储区域读取待计算数据并存储至自己的待处理数据存储区域;然后调用相应数据处理算法对待处理数据存储区域中的待计算数据进行数据计算,得到数据计算结果并存储于自己的计算结果存储区域;最后主动将数据计算结果写回至主机的数据处理结果存储区域。本申请提高了异构计算平台的数据传递效率,提升FPGA加速板卡的计算性能。
-
-
公开(公告)号:CN111124491B
公开(公告)日:2022-04-22
申请号:CN201911288737.7
申请日:2019-12-12
Applicant: 浪潮(北京)电子信息产业有限公司
Abstract: 本申请公开了一种批处理方法、装置、设备及存储介质,该方法的步骤包括:获取批数据以及指令流,指令流的指令中包含执行标志位;在指令流的指令中选取执行标志位对应的状态信息满足可执行标准的目标指令;根据目标指令对批数据执行批处理操作。本方法相对避免了运算设备执行未与批数据中的数据对应的多余指令,进而确保了批处理操作的可靠性。此外,本申请还提供一种批处理装置、设备及存储介质,有益效果同上所述。
-
公开(公告)号:CN114219080A
公开(公告)日:2022-03-22
申请号:CN202111682484.9
申请日:2021-12-31
Applicant: 浪潮(北京)电子信息产业有限公司
Abstract: 本申请公开了一种神经网络加速处理方法,包括:加速设备从片上特征缓存模块获取特征数据;从片上权重缓存模块获取权重数据;采用逐点处理阵列中的多个处理组合以流水线的方式对特征数据和权重数据进行并行卷积计算,得到逐点卷积结果;采用累加模块对逐点卷积结果进行累加计算处理,得到逐点累加处理结果;采用逐通道处理阵列以流水线的方式对逐点累加处理结果和片上权重缓存模块中对应的权重数据进行并行卷积计算,得到逐通道卷积结果,提高对卷积计算进行加速的效果,并且兼容处理深度可分离卷积和普通卷积。本申请还公开了一种神经网络加速处理装置、加速系统以及计算机可读存储介质,具有以上有益效果。
-
-
公开(公告)号:CN114298291A
公开(公告)日:2022-04-08
申请号:CN202111591806.9
申请日:2021-12-23
Applicant: 浪潮(北京)电子信息产业有限公司
Abstract: 本申请公开了一种模型量化处理系统,所述系统包括:BIAS参数存储器,用于存储神经网络模型的BIAS参数,并将BIAS参数传输至卷积计算模块;移位参数存储器,用于存储神经网络模型的移位参数,并将移位参数传输至卷积计算模块;零点参数存储器,用于存储神经网络模型的零点参数,并将零点参数传输至卷积计算模块;其中,BIAS参数存储器、移位参数存储器和零点参数存储器为BRAM类型的存储器;卷积计算模块,用于对量化参数进行量化计算并进行模型量化处理。本申请能够适应不同种类量化方法对应的量化参数的存储与更新,提高模型量化操作的效率。本申请还公开了一种模型量化处理方法,具有以上有益效果。
-
-
-
-
-
-
-
-