一种视觉叙事文本生成方法及设备

    公开(公告)号:CN117609542A

    公开(公告)日:2024-02-27

    申请号:CN202311642680.2

    申请日:2023-12-04

    Abstract: 本发明公开了一种视觉叙事文本生成方法及设备,该方法包括步骤:S1:使用构建好的视觉叙事模型提取图像序列中的图像特征;S2:建模所述图像序列间的关系并得到隐状态表示向量;S3:将所述图像特征和隐状态向量表示联合表示为图像序列背景信息;S4:所述视觉叙事模型根据所述图像序列背景信息和图像序列语言信息预测视觉叙事词语,生成视觉叙事文本。本发明能够提高视觉叙事词语的预测效果,从而使文本的句子之间具有较好的衔接性,能够构成一个流畅的故事,语言上期望生成的句子有更丰富的用词和更好的可读性。

Patent Agency Ranking