基于生成对抗网络的文本生成图像方法

    公开(公告)号:CN115830164A

    公开(公告)日:2023-03-21

    申请号:CN202211474661.9

    申请日:2022-11-23

    Abstract: 本发明公开了基于生成对抗网络的文本生成图像方法,将句子信息通过文本编码器,得到单词特征和句子特征,将噪声向量和句子特征作为初始阶段的输入,在初始阶段经过通道仿射变换,在每一次之后加入激活函数,得到初始中间层输出,将初始中间层输出通过三通道卷积生成出低分辨率的图像,再将图像和句子特征作为初始鉴别器的输入,利用初始鉴别器计算图像是否匹配文本;利用得到的初始中间层输出和单词特征作为第二阶段的输入,步骤同上;最后一个生成器生成的图像还经过图像编码器得到图像特征,和单词特征拥有相同的表示空间,用来计算图像文本相似度,作为生成器的损失;在每阶段鉴别器中加入空间注意力,增强文本图像语义一致性。

    一种基于特征解耦增强的文本生成视频方法

    公开(公告)号:CN118658106B

    公开(公告)日:2024-11-22

    申请号:CN202411132278.4

    申请日:2024-08-19

    Abstract: 本发明公开一种基于特征解耦增强的文本生成视频方法,属于文本生成视频技术领域。其包括,将用户文本输入到预先训练好的文本生成视频网络模型中,得到与所述用户文本描述相符的视频;其中,所述文本生成视频网络模型包括视觉特征解耦网络、跨帧注意力模块及时间注意力模块,所述视觉特征解耦网络用于将视频特征进行解耦分层,所述跨帧注意力模块用于加强解耦分层的视频特征连续三帧的关联,所述时间注意力模块用于加强经过跨帧注意力输出的隐层特征全局帧的关联;本发明适用于文本生成视频,能够有效提升了生成视频细节质量。

    一种基于特征解耦增强的文本生成视频方法

    公开(公告)号:CN118658106A

    公开(公告)日:2024-09-17

    申请号:CN202411132278.4

    申请日:2024-08-19

    Abstract: 本发明公开一种基于特征解耦增强的文本生成视频方法,属于文本生成视频技术领域。其包括,将用户文本输入到预先训练好的文本生成视频网络模型中,得到与所述用户文本描述相符的视频;其中,所述文本生成视频网络模型包括视觉特征解耦网络、跨帧注意力模块及时间注意力模块,所述视觉特征解耦网络用于将视频特征进行解耦分层,所述跨帧注意力模块用于加强解耦分层的视频特征连续三帧的关联,所述时间注意力模块用于加强经过跨帧注意力输出的隐层特征全局帧的关联;本发明适用于文本生成视频,能够有效提升了生成视频细节质量。

    一种智能弹药识别方法
    4.
    发明公开

    公开(公告)号:CN116452795A

    公开(公告)日:2023-07-18

    申请号:CN202310427481.3

    申请日:2023-04-20

    Inventor: 白志远 孙玉宝

    Abstract: 本发明公开了一种智能弹药识别方法,所述方法包括:获取待识别图像;将所述待识别图像输入预设目标识别模型中,得到待识别图像对应的位置信息;根据对应的位置信息计算出检测框,并框出识别目标;其中,所述目标识别模型基于YOLOv5的网络结构训练得到的,所述YOLOv5的网络包括CABlock通道注意力模块,所述CABlock通道注意力模块用于对学习到的特征进行通道方向的整合,本发明针对YOLOv5在小目标检测领域的缺陷,在原始YOLOv5特征提取后加入了通道注意力模块,用来对学习到的特征进行通道方向的整合以便学习到小目标的边界特征,解决了原有YOLOv5使用的Anchor‑based方法生成目标候选框不准确的问题,使目标候选框的大小和位置精确地匹配目标,大大降低检测误差。

Patent Agency Ranking