一种基于空间注意力的文本到图像生成方法及系统

    公开(公告)号:CN113140023A

    公开(公告)日:2021-07-20

    申请号:CN202110474295.6

    申请日:2021-04-29

    Inventor: 季薇 罗盛耀 李云

    Abstract: 本发明提供一种基于空间注意力的文本到图像生成方法及系统,将文本描述输入文本编码器输出句子向量;生成服从高斯分布的随机噪声向量;生成器包括三个空间注意力模块和六个依次连接的上模块,其中位于第一个的上模块连接全连接层,位于最后三个的上模块分别连接一个空间注意力模块,三个空间注意力模块共同连接一个特征组通道归并模块,特征组通道归并模块连接卷积层,在生成器中引入了空间注意力机制,对特征图中不同区域分配不同程度的注意力,加强特征图中最有用的特征,抑制无用的特征,避免了产生伪像的问题;引入了特征组通道归并模块,充分融合文本信息,以增强提取得到特征的表达能力,使生成的图像更加清晰,并且符合给定的文本描述。

    一种基于空间注意力的文本到图像生成方法及系统

    公开(公告)号:CN113140023B

    公开(公告)日:2023-09-15

    申请号:CN202110474295.6

    申请日:2021-04-29

    Inventor: 季薇 罗盛耀 李云

    Abstract: 本发明提供一种基于空间注意力的文本到图像生成方法及系统,将文本描述输入文本编码器输出句子向量;生成服从高斯分布的随机噪声向量;生成器包括三个空间注意力模块和六个依次连接的上模块,其中位于第一个的上模块连接全连接层,位于最后三个的上模块分别连接一个空间注意力模块,三个空间注意力模块共同连接一个特征组通道归并模块,特征组通道归并模块连接卷积层,在生成器中引入了空间注意力机制,对特征图中不同区域分配不同程度的注意力,加强特征图中最有用的特征,抑制无用的特征,避免了产生伪像的问题;引入了特征组通道归并模块,充分融合文本信息,以增强提取得到特征的表达能力,使生成的图像更加清晰,并且符合给定的文本描述。

Patent Agency Ranking