一种基于认知的图像理解方法

    公开(公告)号:CN108229565A

    公开(公告)日:2018-06-29

    申请号:CN201810011570.9

    申请日:2018-01-05

    Applicant: 同济大学

    Inventor: 王瀚漓 王含章

    Abstract: 本发明涉及一种基于认知的图像理解方法,所述方法包括:高认知度的神经网络训练模型建立步骤,将待分类图片数据集与图片标签数据集之间进行关联,根据关联的结果对待分类图片数据集内部进行重新分类,将重新分类后的数据集进行深度卷积神经网络训练,得到高认知度的神经网络训练模型;图像理解步骤,将待理解的图片通过高认知度的神经网络训练模型,得到图片对应的标签。与现有技术相比,本发明具有理解准确程度高、更加符合实际情况以及有效缩短图像理解时间等优点。

    一种基于认知的图像理解方法

    公开(公告)号:CN108229565B

    公开(公告)日:2022-04-05

    申请号:CN201810011570.9

    申请日:2018-01-05

    Applicant: 同济大学

    Inventor: 王瀚漓 王含章

    Abstract: 本发明涉及一种基于认知的图像理解方法,所述方法包括:高认知度的神经网络训练模型建立步骤,将待分类图片数据集与图片标签数据集之间进行关联,根据关联的结果对待分类图片数据集内部进行重新分类,将重新分类后的数据集进行深度卷积神经网络训练,得到高认知度的神经网络训练模型;图像理解步骤,将待理解的图片通过高认知度的神经网络训练模型,得到图片对应的标签。与现有技术相比,本发明具有理解准确程度高、更加符合实际情况以及有效缩短图像理解时间等优点。

    一种基于模态变换与文本归纳的图像描述生成方法

    公开(公告)号:CN110033008B

    公开(公告)日:2023-08-04

    申请号:CN201910357364.8

    申请日:2019-04-29

    Applicant: 同济大学

    Inventor: 王瀚漓 王含章

    Abstract: 本发明涉及一种基于模态变换与文本归纳的图像描述生成方法,该方法包括以下步骤:1)使用基于卷积神经网络的目标识别模型,将待描述图像划分为多个基于感兴趣区域的子块,提取子块的视觉特征;2)使用第一长短时记忆模型对每个子块的视觉特征进行解码,通过将视觉信息转换为语义信息实现模态变换,生成各子块的文本描述;3)使用第二长短时记忆模型对每个子块的文本描述进行再编码,提取各子块的语义特征;4)使用双向层级长短时记忆模型融合各子块的语义特征,获得融合语义特征;5)以所述融合语义特征作为第三长短时记忆模型的输入,生成待描述图像的文本描述。与现有技术相比,本发明具有准确度高等优点。

    一种基于多体进化的图像描述自动生成方法

    公开(公告)号:CN111814946B

    公开(公告)日:2022-11-15

    申请号:CN202010563287.4

    申请日:2020-06-19

    Applicant: 同济大学

    Inventor: 王瀚漓 王含章

    Abstract: 本发明涉及一种基于多体进化的图像描述自动生成方法,该方法构建一图像描述模型种群,对待识别图像进行图像描述的自动生成,所述图像描述模型种群通过以下步骤获得:获得初始模型种群,种群中每个个体均为一图像描述模型;对所述初始模型种群进行迭代变异进化操作,每次迭代中选择个体适应度高的N个个体组成新种群,直至满足进化终止条件,获得最终的图像描述模型种群。与现有技术相比,本发明具有极大地降低了模型设计的人力和时间成本,准确度高等优点。

    一种基于多体进化的图像描述自动生成方法

    公开(公告)号:CN111814946A

    公开(公告)日:2020-10-23

    申请号:CN202010563287.4

    申请日:2020-06-19

    Applicant: 同济大学

    Inventor: 王瀚漓 王含章

    Abstract: 本发明涉及一种基于多体进化的图像描述自动生成方法,该方法构建一图像描述模型种群,对待识别图像进行图像描述的自动生成,所述图像描述模型种群通过以下步骤获得:获得初始模型种群,种群中每个个体均为一图像描述模型;对所述初始模型种群进行迭代变异进化操作,每次迭代中选择个体适应度高的N个个体组成新种群,直至满足进化终止条件,获得最终的图像描述模型种群。与现有技术相比,本发明具有极大地降低了模型设计的人力和时间成本,准确度高等优点。

    一种基于模态变换与文本归纳的图像描述生成方法

    公开(公告)号:CN110033008A

    公开(公告)日:2019-07-19

    申请号:CN201910357364.8

    申请日:2019-04-29

    Applicant: 同济大学

    Inventor: 王瀚漓 王含章

    Abstract: 本发明涉及一种基于模态变换与文本归纳的图像描述生成方法,该方法包括以下步骤:1)使用基于卷积神经网络的目标识别模型,将待描述图像划分为多个基于感兴趣区域的子块,提取子块的视觉特征;2)使用第一长短时记忆模型对每个子块的视觉特征进行解码,通过将视觉信息转换为语义信息实现模态变换,生成各子块的文本描述;3)使用第二长短时记忆模型对每个子块的文本描述进行再编码,提取各子块的语义特征;4)使用双向层级长短时记忆模型融合各子块的语义特征,获得融合语义特征;5)以所述融合语义特征作为第三长短时记忆模型的输入,生成待描述图像的文本描述。与现有技术相比,本发明具有准确度高等优点。

Patent Agency Ranking