-
公开(公告)号:CN117351294B
公开(公告)日:2024-02-20
申请号:CN202311657998.8
申请日:2023-12-06
Applicant: 武汉大学
IPC: G06V10/764 , G06N3/0464 , G06V10/74 , G06V10/77 , G06V10/82
Abstract: 本发明公开了一种基于双功能鉴别器的图像检测方法及装置,其中的方法包括如下步骤:对待检测的图像对进行预处理;将预处理后的图像对输入到预先构建的双功能鉴别器网络中,通过多尺度放缩模块利用2D平均池化层将输入的图像对下采样到不同尺度的图像对,得到放缩的图像金字塔数据;通过特征提取模块从放缩的金字塔数据中提取出深层特征;通过双功能鉴别器中的全卷积网络进行图像对的真假检测,多分类网络进行图像对的相似度检测。本发明采用双功能鉴别器网络能适用于图像的快速检测,能够高效准确的检测出两张图像的真假和相似度,从而能够在实际任务发挥重要的作用,在实际应用中得到推广。
-
公开(公告)号:CN118605504A
公开(公告)日:2024-09-06
申请号:CN202410545301.6
申请日:2024-05-06
Applicant: 武汉大学
Abstract: 本公开提供一种用于辅助机器人在室内环境中移动的视觉导航方法和装置,其中方法包括:获取表征机器人在室内环境中搜寻的目标对象的目标信息,以及机器人在当前时刻采集的关于目标对象的室内环境图像;将目标信息以及室内环境图像输入预先训练的神经网络模型,得到预先训练的神经网络模型输出的动作预测值;基于动作预测值,确定机器人在当前时刻将要执行的下一步动作;将表征下一步动作的控制指令,发送给机器人的驱动端,以使得驱动端根据控制指令驱动机器人朝向目标对象移动;其中,预先训练的神经网络模型包括自适应关系图、动作增强单元、长短期记忆网络以及图注意力网络。利用本公开的方法,可提高机器人在室内环境中移动的视觉导航效果。
-
公开(公告)号:CN117392419A
公开(公告)日:2024-01-12
申请号:CN202311694588.0
申请日:2023-12-12
Applicant: 武汉大学
IPC: G06V10/74 , G06V10/44 , G06V10/75 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本发明提供一种基于深度学习的药品图片相似度比对方法,属于图像处理技术领域,包括:待对比的药品图片对进行预处理;将预处理后的药品图片对输入分类网络,判断是否满足比对条件,若满足条件,则进行下一步,否则流程结束;将满足比对条件的药品图片对输入CNN特征提取网络;将提取出的两特征向量输入到全连接二分类网络或两层的全连接网络;根据全连接二分类网络或两层的全连接网络的输出,实现快速判断两张药品图片是否相似,得到比对结果。本发明方法可以实现98.56%的准确率和27.80次/秒的推理速度,既满足准确率的要求,又满足实时性的要求;本发明能够高效准确的判断两张药品图片是否相似,从而能够应用于工业生产流水线中。
-
公开(公告)号:CN117351294A
公开(公告)日:2024-01-05
申请号:CN202311657998.8
申请日:2023-12-06
Applicant: 武汉大学
IPC: G06V10/764 , G06N3/0464 , G06V10/74 , G06V10/77 , G06V10/82
Abstract: 本发明公开了一种基于双功能鉴别器的图像检测方法及装置,其中的方法包括如下步骤:对待检测的图像对进行预处理;将预处理后的图像对输入到预先构建的双功能鉴别器网络中,通过多尺度放缩模块利用2D平均池化层将输入的图像对下采样到不同尺度的图像对,得到放缩的图像金字塔数据;通过特征提取模块从放缩的金字塔数据中提取出深层特征;通过双功能鉴别器中的全卷积网络进行图像对的真假检测,多分类网络进行图像对的相似度检测。本发明采用双功能鉴别器网络能适用于图像的快速检测,能够高效准确的检测出两张图像的真假和相似度,从而能够在实际任务发挥重要的作用,在实际应用中得到推广。
-
公开(公告)号:CN117372786A
公开(公告)日:2024-01-09
申请号:CN202311643711.6
申请日:2023-12-04
Applicant: 武汉大学
IPC: G06V10/764 , G06V20/70 , G06V10/82 , G06N3/045 , G06N3/0464 , G06N3/082 , G06N3/09 , G06N3/084 , A61B5/16 , A61B5/00
Abstract: 本发明提供一种基于房树人草图的心理状态预测方法、系统及存储介质,属于图像处理技术领域,包括:对待识别的HTP草图进行预处理;构建用于捕捉草图语义与空间信息的分类模型FBANet;将FBANet在大规模草图数据集QuickDraw‑414k进行有监督式预训练;利用HTP草图将预训练好的FBANet进行微调,保存微调后的FBANet权重,得到最终的FBANet模型;将待测HTP草图输入到FBANet模型中,输出心理状态预测结果。本发明提出基于深度学习的单阶段房树人心理健康状态识别方法,具备简便的数据预处理与运算流程的同时拥有较高的准确率,优于传统的分类模型,为心理健康状态辅助诊断提供参考建议。
-
-
-
-