一种基于图卷积的视觉问答增强方法
摘要:
本发明公开了一种基于图卷积的视觉问答增强方法。本发明包括以下步骤:步骤1、分别提取图片和问题的特征表示;步骤2、提取基于问题生成的图片中各目标之间的关系;步骤3、将带有问题信息的图片生成为graph,并且为每个顶点挑选最相关的目标,为每个顶点生成新的特征表示之后,对graph进行最大池化和分类。本发明利用GCN网络和图片中物体之间的关系来探索高层次语义,对视觉问答技术有较大意义。
公开/授权文献
0/0