-
公开(公告)号:CN118886452A
公开(公告)日:2024-11-01
申请号:CN202410945711.X
申请日:2024-07-15
Applicant: 广东美晨通讯有限公司
IPC: G06N3/0455 , G06N3/0464 , G06N3/047 , G06N3/0475 , G06N3/0495 , G06N3/048 , G06N3/082 , G06N3/096 , G06T5/60 , G06T5/70 , G06T11/00
Abstract: 本发明公开了一种基于U‑net的轻量化扩散模型、终端和图像处理方法,所述扩散模型包括包括U‑net模型,该U‑net模型包括一个用于特征提取的编码器和一个用于重建输出的解码器,其中编码器和解码器之间通过跳跃连接方式进行连接,并且将上下文感知与U‑net模型结合,使用FID和CLIP公式计算指标,在U‑net模型中添加若干个transformer模块,调整该transformer模块的宽度;构建一个文本到图像的扩散模型;将改进U‑net模型与文本到图像的扩散模型相结合,还引入一个数据蒸馏管道进行蒸馏处理,通过正则化来改进步骤蒸馏过程中的学习目标。本发明不仅具有更高的推理速度和图像质量,还能更好地适应移动设备的资源限制,提高了移动端图像处理应用的实用性和用户体验。