-
公开(公告)号:CN105869117B
公开(公告)日:2021-04-02
申请号:CN201610184129.1
申请日:2016-03-28
Applicant: 上海交通大学
Abstract: 本发明公开一种针对深度学习超分辨率技术的GPU加速方法,所述方法将基于深度学习、卷积神经网络的超分辨率技术的所有步骤都并行化,并在GPU运行;所述并行化是对基于深度学习、卷积神经网络的超分辨率技术的卷积进行并行任务划分,将卷积操作划分为数百万个互不相关、能以任意顺序并行执行的微任务,从而使GPU超强并行计算能力得到发挥。进一步的,利用GPU储存器的特性,将卷积核数据和输入图像数据缓存到共享存储器和寄存器,从而大幅优化卷积的计算速度;融合卷积与非线性层;针对不同卷积大小选取最佳优化方法。本发明将一个高质量的超分辨率方法加速到满足视频处理的速度要求,并且不会带来任何图像质量损失。
-
公开(公告)号:CN105869105B
公开(公告)日:2021-02-12
申请号:CN201610184146.5
申请日:2016-03-28
Applicant: 上海交通大学
IPC: G06T1/20
Abstract: 本发明公开一种针对A+超分辨率技术的GPU加速方法,所述A+超分辨率技术步骤包括bicubic插值、差分、收集差分特征、主成分分析、锚特征搜索匹配和回归、低高频特征叠加、高分辨率块重叠映射回高分辨率图像;所述方法将A+超分辨率技术上述的所有步骤并行化,并移植到GPU上运行。进一步的,通过调整图像和特征数据存放格式以满足GPU全局内存的合并访问、GPU内核程序指令级优化以达到尽可能快的GPU运行速度、使用CPU/GPU联合计算加快处理视频的速度。本发明将一个高质量的超分辨率技术加速到满足视频处理需要的速度,并且不会带来任何图像质量损失。
-
公开(公告)号:CN105869105A
公开(公告)日:2016-08-17
申请号:CN201610184146.5
申请日:2016-03-28
Applicant: 上海交通大学
IPC: G06T1/20
Abstract: 本发明公开一种针对A+超分辨率技术的GPU加速方法,所述A+超分辨率技术步骤包括bicubic插值、差分、收集差分特征、主成分分析、锚特征搜索匹配和回归、低高频特征叠加、高分辨率块重叠映射回高分辨率图像;所述方法将A+超分辨率技术上述的所有步骤并行化,并移植到GPU上运行。进一步的,通过调整图像和特征数据存放格式以满足GPU全局内存的合并访问、GPU内核程序指令级优化以达到尽可能快的GPU运行速度、使用CPU/GPU联合计算加快处理视频的速度。本发明将一个高质量的超分辨率技术加速到满足视频处理需要的速度,并且不会带来任何图像质量损失。
-
公开(公告)号:CN105869117A
公开(公告)日:2016-08-17
申请号:CN201610184129.1
申请日:2016-03-28
Applicant: 上海交通大学
CPC classification number: G06T3/4053 , G06T1/20
Abstract: 本发明公开一种针对深度学习超分辨率技术的GPU加速方法,所述方法将基于深度学习、卷积神经网络的超分辨率技术的所有步骤都并行化,并在GPU运行;所述并行化是对基于深度学习、卷积神经网络的超分辨率技术的卷积进行并行任务划分,将卷积操作划分为数百万个互不相关、能以任意顺序并行执行的微任务,从而使GPU超强并行计算能力得到发挥。进一步的,利用GPU储存器的特性,将卷积核数据和输入图像数据缓存到共享存储器和寄存器,从而大幅优化卷积的计算速度;融合卷积与非线性层;针对不同卷积大小选取最佳优化方法。本发明将一个高质量的超分辨率方法加速到满足视频处理的速度要求,并且不会带来任何图像质量损失。
-
-
-