-
公开(公告)号:CN108229565A
公开(公告)日:2018-06-29
申请号:CN201810011570.9
申请日:2018-01-05
Applicant: 同济大学
IPC: G06K9/62
Abstract: 本发明涉及一种基于认知的图像理解方法,所述方法包括:高认知度的神经网络训练模型建立步骤,将待分类图片数据集与图片标签数据集之间进行关联,根据关联的结果对待分类图片数据集内部进行重新分类,将重新分类后的数据集进行深度卷积神经网络训练,得到高认知度的神经网络训练模型;图像理解步骤,将待理解的图片通过高认知度的神经网络训练模型,得到图片对应的标签。与现有技术相比,本发明具有理解准确程度高、更加符合实际情况以及有效缩短图像理解时间等优点。
-
公开(公告)号:CN108229565B
公开(公告)日:2022-04-05
申请号:CN201810011570.9
申请日:2018-01-05
Applicant: 同济大学
Abstract: 本发明涉及一种基于认知的图像理解方法,所述方法包括:高认知度的神经网络训练模型建立步骤,将待分类图片数据集与图片标签数据集之间进行关联,根据关联的结果对待分类图片数据集内部进行重新分类,将重新分类后的数据集进行深度卷积神经网络训练,得到高认知度的神经网络训练模型;图像理解步骤,将待理解的图片通过高认知度的神经网络训练模型,得到图片对应的标签。与现有技术相比,本发明具有理解准确程度高、更加符合实际情况以及有效缩短图像理解时间等优点。
-
公开(公告)号:CN110033008B
公开(公告)日:2023-08-04
申请号:CN201910357364.8
申请日:2019-04-29
Applicant: 同济大学
IPC: G06V10/44 , G06V10/774 , G06V10/764 , G06V10/82 , G06N3/0464
Abstract: 本发明涉及一种基于模态变换与文本归纳的图像描述生成方法,该方法包括以下步骤:1)使用基于卷积神经网络的目标识别模型,将待描述图像划分为多个基于感兴趣区域的子块,提取子块的视觉特征;2)使用第一长短时记忆模型对每个子块的视觉特征进行解码,通过将视觉信息转换为语义信息实现模态变换,生成各子块的文本描述;3)使用第二长短时记忆模型对每个子块的文本描述进行再编码,提取各子块的语义特征;4)使用双向层级长短时记忆模型融合各子块的语义特征,获得融合语义特征;5)以所述融合语义特征作为第三长短时记忆模型的输入,生成待描述图像的文本描述。与现有技术相比,本发明具有准确度高等优点。
-
公开(公告)号:CN111814946B
公开(公告)日:2022-11-15
申请号:CN202010563287.4
申请日:2020-06-19
Applicant: 同济大学
IPC: G06V10/82 , G06V10/774 , G06V10/40 , G06N3/00 , G06N3/04
Abstract: 本发明涉及一种基于多体进化的图像描述自动生成方法,该方法构建一图像描述模型种群,对待识别图像进行图像描述的自动生成,所述图像描述模型种群通过以下步骤获得:获得初始模型种群,种群中每个个体均为一图像描述模型;对所述初始模型种群进行迭代变异进化操作,每次迭代中选择个体适应度高的N个个体组成新种群,直至满足进化终止条件,获得最终的图像描述模型种群。与现有技术相比,本发明具有极大地降低了模型设计的人力和时间成本,准确度高等优点。
-
公开(公告)号:CN111814946A
公开(公告)日:2020-10-23
申请号:CN202010563287.4
申请日:2020-06-19
Applicant: 同济大学
Abstract: 本发明涉及一种基于多体进化的图像描述自动生成方法,该方法构建一图像描述模型种群,对待识别图像进行图像描述的自动生成,所述图像描述模型种群通过以下步骤获得:获得初始模型种群,种群中每个个体均为一图像描述模型;对所述初始模型种群进行迭代变异进化操作,每次迭代中选择个体适应度高的N个个体组成新种群,直至满足进化终止条件,获得最终的图像描述模型种群。与现有技术相比,本发明具有极大地降低了模型设计的人力和时间成本,准确度高等优点。
-
公开(公告)号:CN110033008A
公开(公告)日:2019-07-19
申请号:CN201910357364.8
申请日:2019-04-29
Applicant: 同济大学
Abstract: 本发明涉及一种基于模态变换与文本归纳的图像描述生成方法,该方法包括以下步骤:1)使用基于卷积神经网络的目标识别模型,将待描述图像划分为多个基于感兴趣区域的子块,提取子块的视觉特征;2)使用第一长短时记忆模型对每个子块的视觉特征进行解码,通过将视觉信息转换为语义信息实现模态变换,生成各子块的文本描述;3)使用第二长短时记忆模型对每个子块的文本描述进行再编码,提取各子块的语义特征;4)使用双向层级长短时记忆模型融合各子块的语义特征,获得融合语义特征;5)以所述融合语义特征作为第三长短时记忆模型的输入,生成待描述图像的文本描述。与现有技术相比,本发明具有准确度高等优点。
-
-
-
-
-