-
公开(公告)号:CN115689917A
公开(公告)日:2023-02-03
申请号:CN202211285099.5
申请日:2022-10-20
Applicant: 浙江大学
Abstract: 本发明公开了一种基于深度学习的高效时空超分辨率视频压缩复原方法,提出了一种基于深度学习的“编码‑解码”两阶段视频传输方案,该方案将视频超分辨率任务、视频帧插值任务结合到视频压缩复原任务中,以改进传统的编解码方案。具体来说,在编码阶段,该方法首先对视频依次进行空域下采样和时域抽帧操作,再使用常规编码压缩标准生成传输码流。在解码阶段,一个时空超分辨率重建网络将解压码流得到的视频作为输入,执行超分辨率、插帧和质量增强三项任务,以获得高分辨率、高帧率的质量增强视频帧。实验结果证明,所公开的方法在BD‑Rate和BD‑PSNR两项编码评估指标上的性能度明显优于传统编码方案和已有的深度学习复原方法,且具有低计算开销的优势。
-
公开(公告)号:CN119294448A
公开(公告)日:2025-01-10
申请号:CN202411303537.5
申请日:2024-09-19
Applicant: 浙江大学
IPC: G06N3/0495 , G06N3/063 , G06N5/04 , G06F17/16
Abstract: 本发明公开一种基于二值量化的大语言模型加速系统及方法,包括提取和量化单元、分组打包和拼接单元、运算实现单元、反量化和输出单元,具体步骤为:提取模型中需要进行矩阵/向量乘法运算的参数,对模型矩阵/向量乘法运算的参数进行二值量化处理;采用分组打包算法,将成组二进制量化后参数依照计算矩阵/向量乘法时的次序,按位拼接为单个整型数据;执行与原模型推理时等价且硬件友好的矩阵/向量乘法运算;将结果通过反量化算法转回浮点数据类型,获得大语言模型在矩阵/向量乘法运算中的最终计算结果,并传入后续网络层,完成针对大语言模型中矩阵/向量乘法运算的计算加速。本发明在保证精度的同时,实现了大语言模型推理时速度的提升。
-