一种基于图卷积的视觉问答增强方法

发明授权

请登陆查看更多内容

专利标题： 一种基于图卷积的视觉问答增强方法
申请号： CN201910520136.8

申请日： 2019-06-17
公开(公告)号： CN110399518B

公开(公告)日： 2021-12-10
发明人: 颜成钢 , 俞灵慧 , 孙垚棋 , 张继勇 , 张勇东
申请人： 杭州电子科技大学
申请人地址： 浙江省杭州市下沙高教园区2号大街
专利权人： 杭州电子科技大学
当前专利权人： 杭州电子科技大学
当前专利权人地址： 浙江省杭州市下沙高教园区2号大街
代理机构： 杭州君度专利代理事务所
代理商 朱月芬
主分类号： G06F16/583
IPC分类号： G06F16/583 ; G06F16/9032 ; G06K9/46 ; G06N3/04 ; G06N3/08

摘要：

本发明公开了一种基于图卷积的视觉问答增强方法。本发明包括以下步骤：步骤1、分别提取图片和问题的特征表示；步骤2、提取基于问题生成的图片中各目标之间的关系；步骤3、将带有问题信息的图片生成为graph，并且为每个顶点挑选最相关的目标，为每个顶点生成新的特征表示之后，对graph进行最大池化和分类。本发明利用GCN网络和图片中物体之间的关系来探索高层次语义，对视觉问答技术有较大意义。

公开/授权文献

CN110399518A 一种基于图卷积的视觉问答增强方法公开/授权日：2019-11-01

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类:

G	物理
G06	计算；推算或计数
G06F	电数字数据处理（基于特定计算模型的计算机系统入G06N）
G06F16/00	信息检索；数据库结构；文件系统结构
G06F16/50	.•静态图像数据
G06F16/58	..••使用元数据的特征检索,例如,不来自内容或者元数据派生的
G06F16/583	...•••使用从内容中自动派生的元数据