文本生成方法及其模型梯度剪枝方法、装置、设备、介质

    公开(公告)号:CN117910536B

    公开(公告)日:2024-06-07

    申请号:CN202410309633.4

    申请日:2024-03-19

    Abstract: 本发明涉及人工智能技术领域,公开了文本生成方法及其模型梯度剪枝方法、装置、设备、介质,训练预热阶段保持文本生成模型当前的模型梯度不变;非训练预热阶段,基于滑窗尺寸信息和性能损失函数,确定出文本生成模型在每个训练步数下以损失函数变化率为表征的性能;根据设定的训练状态条件以及每个训练步数下以损失函数变化率为表征的性能和单步训练时长,依次对每个训练步数下的梯度剪枝量进行调整。每得到一个调整后的梯度剪枝量,则按照调整后的梯度剪枝量对文本生成模型进行梯度剪枝操作,直至当前训练步数达到文本生成模型的总训练步数,结束对文本生成模型的剪枝操作,保证了文本生成模型的训练任务能够在低速不稳定的网络环境中顺利完成。

    一种加速计算系统
    2.
    发明公开

    公开(公告)号:CN113988307A

    公开(公告)日:2022-01-28

    申请号:CN202111150949.6

    申请日:2021-09-29

    Abstract: 本申请公开了一种加速计算系统。本申请使用机载加速器和FPGA集群的控制端就可以实现对FPGA集群的启动等控制操作,机载加速器的网络加速功能还可以提高控制效率。同时,让FPGA集群的控制端直接将相关数据传输给FPGA集群,从而可以节省传输时间,提高数据传输效率,数据安全也能得到保障。再者,本申请提供的FPGA集群支持算子层面的数据处理,能够对机器学习模型中更细粒度的操作进行单独处理,因此加速计算系统的通用性更好。

    一种文件传输方法、装置、设备及存储介质

    公开(公告)号:CN113746897A

    公开(公告)日:2021-12-03

    申请号:CN202110856466.1

    申请日:2021-07-28

    Abstract: 本发明公开了一种文件传输方法、装置、设备及存储介质,该方法包括:接收应用程序发起的文件传输请求,在文件传输请求的触发下申请内核缓存,并从磁盘中读取相应文件至内核缓存中;通过RDMA网卡驱动告知RDMA网卡硬件发起读操作,以指示RDMA网卡硬件读取内核缓存中的文件至RDMA网卡硬件的内部缓存中,并将内部缓存中的文件发送至远端节点。可见,本申请以内核空间已有的RDMA网卡驱动提供的相关功能为基础,通过将磁盘中相应文件读入申请的内核缓存及将内核缓存中相应文件读入RDMA网卡硬件实现文件传输,避免冗余的内存拷贝操作,降低数据从磁盘搬运到RDMA网卡硬件内部缓存的时间,提高文件传输的传输效率。

    一种图片加密方法、解密方法、加密系统及相关装置

    公开(公告)号:CN113726979B

    公开(公告)日:2024-04-26

    申请号:CN202110876887.0

    申请日:2021-07-31

    Abstract: 本申请提供一种图片加密方法,包括:获取待加密图片,利用DNN分类模型对所述待加密图片进行前向计算;所述DNN分类模型包括输入层、隐含层和输出层,所述隐含层包含若干中间层;记录所述待加密图片经过每层时的元数据;将所述元数据作为所述待加密图片的加密数据。本申请实现加密过程可控制,且难以破解,且所得到的元数据可以根据信息量选择提取部分元数据作为加密数据,使得得到的加密数据远小于原始信息。本申请还提供一种图片解密方法、图片加密系统、计算机可读存储介质和电子设备,具有上述有益效果。

    一种图像处理方法、装置、设备及可读存储介质

    公开(公告)号:CN114998614B

    公开(公告)日:2023-01-24

    申请号:CN202210942303.X

    申请日:2022-08-08

    Abstract: 本申请公开了一种图像处理方法、装置、设备及可读存储介质。本申请确定待处理图像中的待分类目标后,进一步确定待分类目标的轮廓像素点集,然后基于轮廓像素点集确定待分类目标的轮廓形态特征、轮廓形状分布特征、轮廓颜色特征和轮廓纹理特征,再拼接轮廓形态特征、轮廓形状分布特征、轮廓颜色特征和轮廓纹理特征得到待分类目标的特征表示,最后基于特征表示进行图像分类任务,可使表示待分类目标的特征同时包含全局、局部、形状、颜色、纹理等特征,提升了图像特征的准确性,同时以待分类目标的轮廓像素为特征提取基础,降低了特征提取的计算量。本申请提供的一种图像处理装置、设备及可读存储介质,也同样具有上述技术效果。

    一种图像识别方法、装置、设备、介质和剪枝方法

    公开(公告)号:CN119152345A

    公开(公告)日:2024-12-17

    申请号:CN202411621634.9

    申请日:2024-11-14

    Abstract: 本发明涉及数据处理技术领域,公开了一种图像识别方法、装置、设备、介质和剪枝方法,根据原始图像识别模型训练过程中不同神经元节点组合的参数更新值以及不同神经元节点组合的数目,确定出不同神经元节点组合的参数平均值。对不同神经元节点组合的参数平均值进行分类统计,以确定出不同剪枝操作下所保留的神经元节点对应的参数平均值。基于原始图像识别模型的初始模型参数以及所保留的神经元节点对应的参数平均值,完成对不同剪枝模型的模型参数初始化。利用不同剪枝模型对图像样本进行分析训练,以得到剪枝优化后的图像识别模型。将待分析图像输入至图像识别模型确定出图像中包含的目标物。降低了图像识别模型的计算和存储成本。

    一种数据容灾方法、装置、设备以及计算机可读存储介质

    公开(公告)号:CN113722046A

    公开(公告)日:2021-11-30

    申请号:CN202110873296.8

    申请日:2021-07-30

    Inventor: 宿栋栋

    Abstract: 本申请公开了一种数据容灾方法,包括:设置本地目标备份子内核与远端目标备份子内核;本地目标备份子内核与远端目标备份子内核具有与待备份子内核同类的应用程序;当待备份子内核所属FPGA加速器的存储器处于阻塞状态时,根据预设分发跳数,将待计算数据与计算结果反馈地址分发到本地目标备份子内核与远端目标备份子内核,以通过本地目标备份子内核与远端目标备份子内核对待计算数据进行计算,并根据计算结果反馈地址反馈计算结果。该数据容灾方法能够解决由于FPGA加速器中存储器堵塞导致的子内核拥塞和锁死问题,确保虚拟化FPGA集群的数据安全。本申请还公开了一种数据容灾装置、设备及计算机可读存储介质,均具有上述技术效果。

    一种加速计算系统
    10.
    发明授权

    公开(公告)号:CN113988307B

    公开(公告)日:2025-05-23

    申请号:CN202111150949.6

    申请日:2021-09-29

    Abstract: 本申请公开了一种加速计算系统。本申请使用机载加速器和FPGA集群的控制端就可以实现对FPGA集群的启动等控制操作,机载加速器的网络加速功能还可以提高控制效率。同时,让FPGA集群的控制端直接将相关数据传输给FPGA集群,从而可以节省传输时间,提高数据传输效率,数据安全也能得到保障。再者,本申请提供的FPGA集群支持算子层面的数据处理,能够对机器学习模型中更细粒度的操作进行单独处理,因此加速计算系统的通用性更好。

Patent Agency Ranking