超分辨率网络模型压缩方法、系统、设备和介质

    公开(公告)号:CN112184557A

    公开(公告)日:2021-01-05

    申请号:CN202011218834.1

    申请日:2020-11-04

    发明人: 冯帅 周姗 李健

    摘要: 本发明公开了一种超分辨率网络模型压缩方法、系统、设备和介质,超分辨率网络模型压缩方法包括:获取超分辨率网络模型的卷积层和全连接层;采用张量分解算法对所述卷积层的卷积核参数进行张量分解并进行扩充,以获取三个四维卷积层矩阵,并且对全连接层进行截断奇异值分解,以获取两个全连接层矩阵;利用三个所述四维卷积层矩阵和两个所述全连接层矩阵分别替换所述卷积层和所述全连接层。本发明能够在不损失超分辨率模型的成像质量情况下,对超分辨率网络模型的卷积层和全连接层进行压缩,减少了模型参数,对于设备来说内存需求下降,其次降低了浮点运算次数,前向推理延迟降低,改善了模型的综合性能。

    高斯误差线性单元的优化方法、系统、设备及介质

    公开(公告)号:CN112433761B

    公开(公告)日:2022-06-10

    申请号:CN202011385025.X

    申请日:2020-12-01

    发明人: 周健倩 周姗 李健

    IPC分类号: G06F9/30 G06F9/448

    摘要: 本发明公开了一种高斯误差线性单元的优化方法、系统、设备和介质,其中优化方法包括:接收自然语言处理的输入数据;以所述输入数据为输入参数,调用第一高斯误差线性单元或者第二高斯误差线性单元;第一高斯误差线性单元的实现方式为:使用mkl数学库中vsErf接口函数和mkl数学库中的四则运算接口函数分别代替BERT模型中的高斯误差线性单元的erf函数和四则运算接口函数;第二高斯误差线性单元的实现方式为:使用Intrinsic指令集中erf接口函数和Intrinsic指令集中的四则运算接口函数分别代替BERT模型中高斯误差线性单元的erf函数和四则运算接口函数。第一、二高斯误差线性单元计算效率明显提高,增强了BERT模型的性能。

    高斯误差线性单元的优化方法、系统、设备及介质

    公开(公告)号:CN112433761A

    公开(公告)日:2021-03-02

    申请号:CN202011385025.X

    申请日:2020-12-01

    发明人: 周健倩 周姗 李健

    IPC分类号: G06F9/30 G06F9/448

    摘要: 本发明公开了一种高斯误差线性单元的优化方法、系统、设备和介质,其中优化方法包括:接收自然语言处理的输入数据;以所述输入数据为输入参数,调用第一高斯误差线性单元或者第二高斯误差线性单元;第一高斯误差线性单元的实现方式为:使用mkl数学库中vsErf接口函数和mkl数学库中的四则运算接口函数分别代替BERT模型中的高斯误差线性单元的erf函数和四则运算接口函数;第二高斯误差线性单元的实现方式为:使用Intrinsic指令集中erf接口函数和Intrinsic指令集中的四则运算接口函数分别代替BERT模型中高斯误差线性单元的erf函数和四则运算接口函数。第一、二高斯误差线性单元计算效率明显提高,增强了BERT模型的性能。

    机器翻译模型的优化方法、系统、电子设备和存储介质

    公开(公告)号:CN113297860A

    公开(公告)日:2021-08-24

    申请号:CN202110702102.8

    申请日:2021-06-24

    发明人: 向玉开 周姗 李健

    IPC分类号: G06F40/58 G06N20/00

    摘要: 本发明公开了一种机器翻译模型的优化方法、系统、电子设备和存储介质,涉及模型优化领域。所述优化方法包括:对模型中涉及的初始算子进行融合,减少模型中的算子数量,进而得到模型的最终算子,融合后的最终算子减少了计算模块算子之间来回调用、启动所带来的时间开销,提高了运算效率;对模型中融合后的部分算子进行计算逻辑顺序调整,减少算子调用的同时,又减少了乘法操作,进一步进行运算融合和计算逻辑优化;对至少两个计算过程矩阵,采用矩阵列变换、矩阵乘法实现内存拼接,进而实现矩阵拼接运算,减少内存拷贝,实现内存拼接优化,提高运算性能。

    BERT模型的优化方法及系统、电子设备及存储介质

    公开(公告)号:CN112506523A

    公开(公告)日:2021-03-16

    申请号:CN202011517527.3

    申请日:2020-12-21

    发明人: 周姗 周健倩 李健

    IPC分类号: G06F8/41 G06F17/16 G06N3/04

    摘要: 本发明公开了一种BERT模型的优化方法及系统、电子设备及存储介质,提供了一种BERT模型的优化方法,所述优化方法包括:将所述BERT模型每个层包含的所有算子分别合并为一个对应的层算子,所述层算子的数量和所述BERT模型的层数相同;每个层算子分别用于所述BERT模型中对应层的运算。本发明通过对BERT模型的各个层进行算子融合处理优化了模型处理处理过程,在不改变模型结构和模型精度的前提下加快了模型的推理速度,提高了BERT模型的处理效率。