一种分阶段多路径文本生成图像的网络架构方法

    公开(公告)号:CN115775284A

    公开(公告)日:2023-03-10

    申请号:CN202211505806.7

    申请日:2022-11-29

    Abstract: 本发明公开了一种新的基于残差学习和多尺度学习的文本生成图像的分阶段多路径网络架构,用于提高提取图像不同尺度的特征,生成细节更具细粒度的图像,来提高文本生成图像跨模态任务的生成效果。本发明提出的是一种新的改进后的生成对抗神经网络架构,来提高图像生成的清晰度。利用分阶段残差连接将相邻阶段信息的信息和文本信息组成的特征图直接传递到当前阶段的末尾,参与到当前阶段的图像生成中,避免了长时间存储的要求,提高当前阶段的生成效果。多尺度学习利用多个不同卷积核大小的并行路径提取输入图像的特征,适当集成来自不同空间的特征图获取更高质量的特征和细粒度的文本细节。

Patent Agency Ranking