基于Tensorflow框架的深度学习训练方法

    公开(公告)号:CN114021715B

    公开(公告)日:2025-02-11

    申请号:CN202111163121.4

    申请日:2021-09-30

    Abstract: 本申请提供一种基于Tensorflow框架的深度学习训练方法,包括:接收深度学习训练请求;将深度学习训练请求对应的FPGA板卡虚拟为本地FPGA节点;将本地FPGA节点注册为Tensorflow框架对应的VFPGA设备;配置VFPGA设备的前向算子和反向算子,并编译前向算子和反向算子得到FPGA的bit文件;烧写bit文件到本地FPGA节点,生成本地FPGA节点对应的FPGA设备;利用FPGA设备执行深度学习训练。本申请降低了通信时延,从而提高了深度学习训练效率。本申请还提供一种基于Tensorflow框架的深度学习训练系统、FPGA板卡、计算机可读存储介质和电子设备,具有上述有益效果。

    一种图片加密方法、解密方法、加密系统及相关装置

    公开(公告)号:CN113726979B

    公开(公告)日:2024-04-26

    申请号:CN202110876887.0

    申请日:2021-07-31

    Abstract: 本申请提供一种图片加密方法,包括:获取待加密图片,利用DNN分类模型对所述待加密图片进行前向计算;所述DNN分类模型包括输入层、隐含层和输出层,所述隐含层包含若干中间层;记录所述待加密图片经过每层时的元数据;将所述元数据作为所述待加密图片的加密数据。本申请实现加密过程可控制,且难以破解,且所得到的元数据可以根据信息量选择提取部分元数据作为加密数据,使得得到的加密数据远小于原始信息。本申请还提供一种图片解密方法、图片加密系统、计算机可读存储介质和电子设备,具有上述有益效果。

    一种基于FPGA的数据处理方法、装置、设备及介质

    公开(公告)号:CN114969851B

    公开(公告)日:2024-02-23

    申请号:CN202210609566.9

    申请日:2022-05-31

    Abstract: 本申请公开了一种基于FPGA的数据处理方法、装置、设备及介质,涉及计算机技术领域,所述方法包括:将从服务器主板中获取的加密后的指令以及数据保存至FPGA数据处理板本地的第一内存空间中;基于指令的配置信息和数据的存储信息确定出目标微核,并通过目标微核从第一内存空间中读取数据以及指令,在对读取到的数据以及指令进行解密后,利用指令对数据进行处理;对相应的处理结果进行加密后保存至FPGA数据处理板本地的第二内存空间中。可见,本申请中数据、指令以及处理结果均以加密的方式在服务器主板与FPGA数据处理板之间进行传输,降低了数据泄露风险,由此保证了数据的安全性,此外,本申请将加解密任务卸载至FPGA数据处理板上,降低了CPU的负载率。

    一种池化异构资源启动方法、装置、设备及存储介质

    公开(公告)号:CN114936043B

    公开(公告)日:2024-02-09

    申请号:CN202210551809.8

    申请日:2022-05-20

    Abstract: 本申请公开了一种池化异构资源启动方法、装置、设备及存储介质,涉及异构资源虚拟化技术领域,包括:监测应用服务器是否开始启动,得到相应的监测结果;根据监测结果确定是否下载应用逻辑存储服务器中预先存储的应用逻辑至池化异构资源并记录相应的下载情况;基于下载情况触发启动控制指令,并利用启动控制指令控制池化异构资源启动。本申请在监测到所述应用服务器开始启动时,直接下载应用逻辑存储服务器中预先存储的应用逻辑至池化异构资源,避免应用逻辑从应用逻辑存储服务器中转到应用服务器,然后再到池化异构资源上所造成的时延,而且能够解决应用服务器启动之后,才能启动池化异构资源的问题,从而避免耗费大量的启动时间,提高启动性能。

    一种自然语言处理方法、系统、设备及存储介质

    公开(公告)号:CN115329744B

    公开(公告)日:2023-04-07

    申请号:CN202211237680.X

    申请日:2022-10-11

    Abstract: 本申请公开了一种自然语言处理方法、系统、设备及存储介质,应用于机器学习技术领域,包括:得到训练完毕的第一自然语言处理模型;设定用于决定第一自然语言处理模型的模型参数矩阵中的行、列是否保留的行、列稀疏化参数组并进行训练,通过预测损失进行当前未被稀疏的剩余参数的更新,通过预测损失和稀疏度损失,对各个行、列稀疏化参数组进行更新;当总损失收敛时,得到训练完成的第二自然语言处理模型;基于第二自然语言处理模型进行硬件部署,并在部署完成之后,将待处理文本输入至第二自然语言处理模型,得到自然语言处理结果。应用本申请的方案,可以有效地实现自然语言处理,进行软硬件层面的协同优化,且不会损失精度。

    一种图像处理方法、装置、设备及可读存储介质

    公开(公告)号:CN114998614B

    公开(公告)日:2023-01-24

    申请号:CN202210942303.X

    申请日:2022-08-08

    Abstract: 本申请公开了一种图像处理方法、装置、设备及可读存储介质。本申请确定待处理图像中的待分类目标后,进一步确定待分类目标的轮廓像素点集,然后基于轮廓像素点集确定待分类目标的轮廓形态特征、轮廓形状分布特征、轮廓颜色特征和轮廓纹理特征,再拼接轮廓形态特征、轮廓形状分布特征、轮廓颜色特征和轮廓纹理特征得到待分类目标的特征表示,最后基于特征表示进行图像分类任务,可使表示待分类目标的特征同时包含全局、局部、形状、颜色、纹理等特征,提升了图像特征的准确性,同时以待分类目标的轮廓像素为特征提取基础,降低了特征提取的计算量。本申请提供的一种图像处理装置、设备及可读存储介质,也同样具有上述技术效果。

    一种GPGPU资源分配方法、装置、设备及存储介质

    公开(公告)号:CN115599554A

    公开(公告)日:2023-01-13

    申请号:CN202211433682.6

    申请日:2022-11-16

    Abstract: 本发明公开了一种GPGPU资源分配方法、装置、设备及存储介质,应用于计算机技术。该方法包括:对已分配有资源核的用户进行状态检测;在用户为空闲用户的情况下,基于预设规则对用户的资源核进行回收;在用户为忙碌用户的情况下,基于用户的忙碌情况从未分配的各资源核中为用户增补预设数量的资源核;本发明基于用户状态对资源核的分配情况进行动态调节,更好的满足用户需求,提升资源利用率。

    一种自然语言处理方法、系统、设备及存储介质

    公开(公告)号:CN115329744A

    公开(公告)日:2022-11-11

    申请号:CN202211237680.X

    申请日:2022-10-11

    Abstract: 本申请公开了一种自然语言处理方法、系统、设备及存储介质,应用于机器学习技术领域,包括:得到训练完毕的第一自然语言处理模型;设定用于决定第一自然语言处理模型的模型参数矩阵中的行、列是否保留的行、列稀疏化参数组并进行训练,通过预测损失进行当前未被稀疏的剩余参数的更新,通过预测损失和稀疏度损失,对各个行、列稀疏化参数组进行更新;当总损失收敛时,得到训练完成的第二自然语言处理模型;基于第二自然语言处理模型进行硬件部署,并在部署完成之后,将待处理文本输入至第二自然语言处理模型,得到自然语言处理结果。应用本申请的方案,可以有效地实现自然语言处理,进行软硬件层面的协同优化,且不会损失精度。

    一种基于FPGA的数据处理方法、装置、设备及介质

    公开(公告)号:CN114969851A

    公开(公告)日:2022-08-30

    申请号:CN202210609566.9

    申请日:2022-05-31

    Abstract: 本申请公开了一种基于FPGA的数据处理方法、装置、设备及介质,涉及计算机技术领域,所述方法包括:将从服务器主板中获取的加密后的指令以及数据保存至FPGA数据处理板本地的第一内存空间中;基于指令的配置信息和数据的存储信息确定出目标微核,并通过目标微核从第一内存空间中读取数据以及指令,在对读取到的数据以及指令进行解密后,利用指令对数据进行处理;对相应的处理结果进行加密后保存至FPGA数据处理板本地的第二内存空间中。可见,本申请中数据、指令以及处理结果均以加密的方式在服务器主板与FPGA数据处理板之间进行传输,降低了数据泄露风险,由此保证了数据的安全性,此外,本申请将加解密任务卸载至FPGA数据处理板上,降低了CPU的负载率。

    一种图像处理方法、装置、设备及介质

    公开(公告)号:CN114866534A

    公开(公告)日:2022-08-05

    申请号:CN202210465766.1

    申请日:2022-04-29

    Abstract: 本申请公开了一种图像处理方法、装置、设备及介质,涉及计算机技术领域,该方法应用于基于远程直接数据存取技术的图像处理单元,包括:通过网络链接获取数据端发送的原始图像数据、计算指令、第一指定地址和第二指定地址,将原始图像数据和计算指令分别存储至本地第一指定地址和第二指定地址;通过网络链接获取数据端发送的第一信息以启动计算核心,基于原始图像数据和计算指令获取图像计算结果,将图像计算结果所在的本地目标地址发送至数据端;通过网络链接获取数据端返回的与目标地址绑定的第三指定地址,将目标地址上的计算结果发送至位于所述数据端的第三指定地址上。通过网络链路获取数据端发送数据和地址提高了数据端运算资源的利用率。

Patent Agency Ranking