-
公开(公告)号:CN112580777B
公开(公告)日:2025-02-18
申请号:CN202011256575.1
申请日:2020-11-11
Applicant: 暨南大学
IPC: G06V10/82 , G06V10/80 , G06V10/44 , G06V10/46 , G06V10/764 , G06N3/045 , G06N3/0464 , G06N3/0442 , G06N3/084 , G06N3/048
Abstract: 本发明涉及一种基于注意力机制的深度神经网络插件及图像识别方法,该插件由两个相同大小的一层LSTM和一个多层结构的CNN组成;其中,一个所述一层LSTM用于记忆上下文信息并生成具有显著特征的遮罩图像,另一个所述一层LSTM用于实现“瞥”功能并生成分类置信度;所述多层结构的CNN用于下采样、提取图像特征和将上下文信息传输到LSTM单元。通过使用多层结构的CNN,同时应用了注意机制引导多层结构的CNN对图像中目标对象的关键特征进行聚焦,剔除次要特征和背景像素,识别能力高,而且通过多次传播逐步识别目标对象,逐渐记住对象的主要特征,忘记了对象的次要特征,且多次后向反馈,具有纠错功能。
-
公开(公告)号:CN112580777A
公开(公告)日:2021-03-30
申请号:CN202011256575.1
申请日:2020-11-11
Applicant: 暨南大学
Abstract: 本发明涉及一种基于注意力机制的深度神经网络插件及图像识别方法,该插件由两个相同大小的一层LSTM和一个多层结构的CNN组成;其中,一个所述一层LSTM用于记忆上下文信息并生成具有显著特征的遮罩图像,另一个所述一层LSTM用于实现“瞥”功能并生成分类置信度;所述多层结构的CNN用于下采样、提取图像特征和将上下文信息传输到LSTM单元。通过使用多层结构的CNN,同时应用了注意机制引导多层结构的CNN对图像中目标对象的关键特征进行聚焦,剔除次要特征和背景像素,识别能力高,而且通过多次传播逐步识别目标对象,逐渐记住对象的主要特征,忘记了对象的次要特征,且多次后向反馈,具有纠错功能。
-