-
公开(公告)号:CN118966364B
公开(公告)日:2025-02-14
申请号:CN202411448500.1
申请日:2024-10-17
Applicant: 南京信息工程大学
Abstract: 本发明公开了一种自动驾驶视觉推理认知方法及相关装置。本发明采用仿照视觉通路的人脑视觉通路模型进行自动驾驶视觉推理认知,用神经元模型模拟视觉信号从视网膜进入到外侧膝状体再到初级视觉皮层的过程,有利于提取图像的底层特征,为接下来的语义信息认知奠定基础,用神经元模型模拟视觉通路的腹侧通路和背侧通路,有利于对特征图和问题文本进行高级认知,辅助理解图像构成逻辑,用神经元模型模拟人脑前额叶,有利于推理出图像和问题文本对应的答案,实现了基于视觉通路的视觉特征和语义认知的视觉推理,充分开盒神经认知过程,提高可解释性。
-
公开(公告)号:CN119938985A
公开(公告)日:2025-05-06
申请号:CN202510416357.6
申请日:2025-04-03
Applicant: 南京信息工程大学
IPC: G06F16/783 , G06V20/40 , G06F40/30 , G06F18/22
Abstract: 本发明公开了一种基于人脑情景记忆通路启发的文本视频检索方法,方法包括利用内容编码组件对目标文本数据或目标视频数据进行内容表征提取获得多尺度目标表征;利用情境编码组件对目标文本数据或目标视频数据进行情境表征提取获得目标令牌;将多尺度目标表征和目标令牌输入至双曲图神经网络获得目标场景表征;将目标场景表征作为目标索引;计算待检索文本或视频的表征与目标索引的相似度,根据相似度对待检索文本或视频进行筛选获得目标检索结果;本发明通过多粒度信息融合全面捕捉的多层次语义特征,通过双曲图卷积操作融合多模态、多粒度的高阶信息,能够更好地捕捉文本和视频之间的复杂关系,显著提升了文本视频检索的精度与效率。
-
公开(公告)号:CN118966364A
公开(公告)日:2024-11-15
申请号:CN202411448500.1
申请日:2024-10-17
Applicant: 南京信息工程大学
Abstract: 本发明公开了一种自动驾驶视觉推理认知方法及相关装置。本发明采用仿照视觉通路的人脑视觉通路模型进行自动驾驶视觉推理认知,用神经元模型模拟视觉信号从视网膜进入到外侧膝状体再到初级视觉皮层的过程,有利于提取图像的底层特征,为接下来的语义信息认知奠定基础,用神经元模型模拟视觉通路的腹侧通路和背侧通路,有利于对特征图和问题文本进行高级认知,辅助理解图像构成逻辑,用神经元模型模拟人脑前额叶,有利于推理出图像和问题文本对应的答案,实现了基于视觉通路的视觉特征和语义认知的视觉推理,充分开盒神经认知过程,提高可解释性。
-
-