一种图像描述文本生成方法及装置

    公开(公告)号:CN113468357B

    公开(公告)日:2023-07-11

    申请号:CN202110823822.X

    申请日:2021-07-21

    Abstract: 本发明实施例提供了一种图像描述文本生成方法及装置,涉及图像处理技术领域,上述方法包括:检测目标所在的目标区域;计算平均像素值,得到区域特征;对第一输入信息进行特征提取,得到第一隐藏特征;生成各目标区域的权重系数;对各个目标区域中相同位置的像素点的像素值进行加权计算得到第一输出信息;对第二输入信息进行特征提取,得到第二隐藏特征;获得预设词汇表中输出概率最高的输出单词;将第一输入信息更新为包含第一隐藏特征、已获得的输出单词和区域特征的信息,并返回得到第一隐藏特征的步骤,直至输出文本满足输出结束条件,将输出文本确定为图像描述文本。应用本发明实施例提供的方案能够提高生成图像描述文本的准确度。

    一种图像描述文本生成方法及装置

    公开(公告)号:CN113468357A

    公开(公告)日:2021-10-01

    申请号:CN202110823822.X

    申请日:2021-07-21

    Abstract: 本发明实施例提供了一种图像描述文本生成方法及装置,涉及图像处理技术领域,上述方法包括:检测目标所在的目标区域;计算平均像素值,得到区域特征;对第一输入信息进行特征提取,得到第一隐藏特征;生成各目标区域的权重系数;对各个目标区域中相同位置的像素点的像素值进行加权计算得到第一输出信息;对第二输入信息进行特征提取,得到第二隐藏特征;获得预设词汇表中输出概率最高的输出单词;将第一输入信息更新为包含第一隐藏特征、已获得的输出单词和区域特征的信息,并返回得到第一隐藏特征的步骤,直至输出文本满足输出结束条件,将输出文本确定为图像描述文本。应用本发明实施例提供的方案能够提高生成图像描述文本的准确度。

Patent Agency Ranking