发明授权
- 专利标题: 一种基于图卷积的视觉问答增强方法
-
申请号: CN201910520136.8申请日: 2019-06-17
-
公开(公告)号: CN110399518B公开(公告)日: 2021-12-10
- 发明人: 颜成钢 , 俞灵慧 , 孙垚棋 , 张继勇 , 张勇东
- 申请人: 杭州电子科技大学
- 申请人地址: 浙江省杭州市下沙高教园区2号大街
- 专利权人: 杭州电子科技大学
- 当前专利权人: 杭州电子科技大学
- 当前专利权人地址: 浙江省杭州市下沙高教园区2号大街
- 代理机构: 杭州君度专利代理事务所
- 代理商 朱月芬
- 主分类号: G06F16/583
- IPC分类号: G06F16/583 ; G06F16/9032 ; G06K9/46 ; G06N3/04 ; G06N3/08
摘要:
本发明公开了一种基于图卷积的视觉问答增强方法。本发明包括以下步骤:步骤1、分别提取图片和问题的特征表示;步骤2、提取基于问题生成的图片中各目标之间的关系;步骤3、将带有问题信息的图片生成为graph,并且为每个顶点挑选最相关的目标,为每个顶点生成新的特征表示之后,对graph进行最大池化和分类。本发明利用GCN网络和图片中物体之间的关系来探索高层次语义,对视觉问答技术有较大意义。
公开/授权文献
- CN110399518A 一种基于图卷积的视觉问答增强方法 公开/授权日:2019-11-01