-
公开(公告)号:CN119762844A
公开(公告)日:2025-04-04
申请号:CN202411753257.4
申请日:2024-12-02
Applicant: 广东技术师范大学
IPC: G06V10/764 , G06V10/82 , G06N3/0455 , G06V10/80 , G16H50/20 , G16H30/40 , G06N3/0464
Abstract: 本发明提供一种基于多视角混合注意力网络的阿尔茨海默症分类方法,包括:获取sMRI数据集并进行预处理;建立阿尔茨海默症分类模型,包括依次连接的:特征提取骨干网络、Transformer编码器和MMSE分数辅助分类器;将预处理后的sMRI数据集输入阿尔茨海默症分类模型中进行迭代训练;获取待分类的受试者sMRI影像数据并输入到训练好的阿尔茨海默症分类模型中进行分类;本发明使用全影像级的方法,通过将两种优势互补的深度学习网络框架结合,同时使用多视角、注意力机制和多尺度特征融合等策略,引入MMSE临床检查分数作为辅助监督信息,能够有效提高阿尔茨海默症计算机辅助诊断和分类的可靠性。
-
公开(公告)号:CN117523190A
公开(公告)日:2024-02-06
申请号:CN202311335971.7
申请日:2023-10-16
Applicant: 广东技术师范大学
IPC: G06V10/26 , G06V10/774 , G06V20/70 , G06V10/40 , G06V10/764 , G06V10/80 , G06T7/20 , G06V10/82
Abstract: 本发明公开了一种动态场景下基于语义分割的实时鲁棒SLAM算法,通过利用语义分割网络在场景理解中的优势,将视觉SLAM系统与U‑Net语义分割网络相结合,形成分割预测网络,通过运动补偿和运动估计方法对常见物体帧图像进行动态检测,对于特定动态场景可以提取到更丰富的特征,分析运动物体实时可能运动的概率,并标记每个运动的物体及可能运动的概率,结合语义分割和运动估计法进行异常点的剔除,从而得到静态的背景特征点,使用这些特征点进行建图,创建地图点,从而精确地得到只有背景图像的特征,有效地利用语义分割结果进行动态对象检测和异常点去除,并同时保持算法的实时性。
-
公开(公告)号:CN117496223A
公开(公告)日:2024-02-02
申请号:CN202311336252.7
申请日:2023-10-16
Applicant: 广东技术师范大学
IPC: G06V10/764 , G06V10/774 , G06V10/82 , G06V10/80 , G06N3/0464 , G06N3/0495 , G06N3/082 , G06T7/00
Abstract: 本发明公开了一种基于深度学习的轻量化绝缘子缺陷检测方法及装置,包括收集绝缘子的样本图像,对现有图像进行标注,然后扩充样本图像并自动生成对应标签,构建数据集;将数据集随机划分为训练集、验证集和测试集;根据训练集训练得到FA‑YOLOv5模型,根据验证集得到评估模型,将测试集输入评估模型输出绝缘子缺陷检测结果。本发明能够在模糊、光度较暗、遮挡等情况下实现对输电线路缺陷绝缘子的实时检测,并采用模型剪枝加上知识蒸馏的方法大大降低网络模型的复杂度以及参数量。
-
公开(公告)号:CN117152173A
公开(公告)日:2023-12-01
申请号:CN202311143680.8
申请日:2023-09-05
Applicant: 广东技术师范大学
IPC: G06T7/11 , G06N3/045 , G06N3/0455 , G06N3/0464 , G06N3/08 , G06V10/80 , G06V10/82 , G06T5/00
Abstract: 本发明提供一种基于DUNetR模型的冠状动脉分割方法和系统,包括:获取三维的冠状动脉CTA图像数据集并进行预处理;建立由Transformer网络和UNet网络并行结合的DUNetR模型,将预处理后的冠状动脉CTA图像数据集输入DUNetR模型进行训练,将待分割的冠状动脉CTA图像并输入训练后的DUNetR模型中进行分割,获取初步分割结果;利用图像形态学算法对初步分割结果进行平滑处理,获得最终的分割结果,完成冠状动脉的分割;本发明构建Transformer和UNet双网络并行结合的DUNetR模型,使用注意力机制和全卷积神经网络在CTA上进行全局加局部的细致分割,能够显著提高分割精度。
-
公开(公告)号:CN116563646B
公开(公告)日:2023-10-13
申请号:CN202310773717.9
申请日:2023-06-28
Applicant: 广东技术师范大学
IPC: G06V10/764 , G06N3/126 , G06T7/00 , G06V10/774
Abstract: 本发明涉及数据分类处理技术领域,公开了一种基于离散化数据的大脑影像分类方法,包括:将原始大脑影像数据集划分为原始训练集、原始验证集和原始测试集;构建包括数据集离散化前后的信息损失、分类错误率和离散数据复杂程度的多目标函数,对多目标函数的最优解进行搜索,得到离散化方案;根据离散化方案分别对原始训练集、原始验证集和原始测试集进行离散化;对离散训练集和离散验证集进行特征选择,利用特征选择结果,对离散训练集和离散测试集进行特征精简,得到精简离散训练集和精简离散测试集;利用精简离散训练集训练一个分类器对精简离散测试集进行分类,得到大脑影像数据分类结果。本发明能够提高大脑影像分类任务的分类准确率和效率。
-
公开(公告)号:CN115880364B
公开(公告)日:2023-05-16
申请号:CN202310084251.1
申请日:2023-02-09
Applicant: 广东技术师范大学
Abstract: 本发明公开了基于激光点云和视觉SLAM的机器人位姿估计方法,使用摄像机采集图像,再使用视觉里程计提取图像中的ORB特征点,判断关键帧并与ORB特征点进行特征匹配获得匹配点对,进行位姿估计获得摄像机下的机器人位姿;使用激光雷达采集激光点云数据,使用激光雷达里程计提取激光点云数据的特征,与关键帧进行特征匹配并进行位姿估计求得激光雷达下的机器人位姿;根据摄像机的频率,对激光雷达下的机器人位姿进行三次样条插值处理对齐时间戳;进行双线程回环检测得到回环检测结果;将摄像机下的机器人位姿与激光雷达下的机器人位姿输入卡尔曼滤波器中融合得到机器人位姿。本发明补全了与视觉特征点对应的点云缺失,提高了视觉SLAM建图及回环检测精度。
-
公开(公告)号:CN116071405A
公开(公告)日:2023-05-05
申请号:CN202211711321.3
申请日:2022-12-29
Applicant: 广东技术师范大学
Abstract: 本发明公开了一种锂电池表面丝网印刷图像配准的方法及装置,属于锂电池生产技术领域,包括:建立模板图像和实物图像的非线性尺度空间,利用AKAZE算法分别对模板图像和实物图像进行特征检测,并分别提取模板图像和实物图像的特征点;在模板图像和实物图像中划分若干对图像块,利用BEBLID算法构造模板图像和实物图像的特征点的BEBLID特征描述符;结合特征匹配策略,计算所述特征点的汉明距离,结合暴力匹法筛选出候选匹配对,采取图像网格划分的方法,通过统计网格内符合条件的匹配对的数量来确定正确匹配对;提高了图像配准对尺度变化和旋转变化的鲁棒性,特征点能够保留图像的基本特征信息,具有受噪声的影响较小,易于被提取等优点。
-
公开(公告)号:CN116007681A
公开(公告)日:2023-04-25
申请号:CN202211659551.X
申请日:2022-12-22
Applicant: 广东技术师范大学
Abstract: 本发明公开了一种AR眼镜的温湿度气体检测仪,外部环境实时控制系统包括液晶显示屏、红外测温传感器、CO传感器、核心处理器、烟雾传感器、湿度传感器和无线设备;AR眼镜具备无线传输视频数据的功能,与语音通话的功能。外部环境实时控制系统和AR眼镜的所获取的外界环境信息、设备信息与作业人员的操作信息,通过无线传输的方式同时传送到远端PC设备;远端PC设备的操作人员通过三个信息源进行判断,及时对现场作业人员进行指导性工作、预警。本发明能够实时检测外部环境的变化,包括温度、湿度、CO浓度、HCHO浓度;将检测到的指数变化通过无线蓝牙模块实时传输到AR眼镜中,实现无手操作,解放双手,加快电力系统检修过程。
-
公开(公告)号:CN115797412A
公开(公告)日:2023-03-14
申请号:CN202310069765.X
申请日:2023-02-07
Applicant: 广东技术师范大学
IPC: G06T7/246 , G06T7/73 , G06V10/26 , G06V10/762
Abstract: 本发明公开了一种动态对象异常值并行检测方法、装置、系统、设备及介质,所述方法包括:以第一图像为参考,通过跟踪单元估计第二图像的相机位姿信息,即位姿估计过程,进而得到后一关键帧列表;根据前一关键帧列表选择语义关键帧,并通过语义分割单元和聚类算法单元对所述语义关键帧进行语义分割和聚类分析以检测对应的动态对象异常值,即检测过程;以上操作中,位姿估计过程和检测过程并行进行;其中,图像针对环境获取,包括彩色图像和深度图像。本发明可以提高对机器人图像的帧率识别水平,有效地减少语义网络可能出现的分割对象残缺不全、动态对象去除不彻底的现象,解决地图初始化困难及假阳性回环检测的问题,进一步提高建图水平。
-
公开(公告)号:CN115700781A
公开(公告)日:2023-02-07
申请号:CN202211391739.0
申请日:2022-11-08
Applicant: 广东技术师范大学
IPC: G06V10/24 , G06T7/10 , G06V10/40 , G06N3/0464 , G06N3/08
Abstract: 本发明涉及一种动态场景下基于图像补绘的视觉定位方法及系统,方法包括以下步骤:S1、构建语义分割网络,对动态场景中的动态因素进行实时分割,生成掩膜图像;S2、将掩膜图像中包含的语义信息划分为低动态元素和高动态元素;S3、保留低动态元素信息,并将该元素信息添加到实时更新列表;S4、按照体型从小到大的顺序对高动态元素进行图像补绘;S5、使用点线特征方法进行实时定位;S6、若低动态元素发生状态信息变化,则更新定位信息。本发明通过使用实时语义分割技术和图像补绘技术的动态场景下的视觉定位方法,有效提高了定位的精度;通过在实时语义分割网络中引入新的轻量级卷积神经网络和新的注意力融合机制,提高了实时语义分割的效率和精度。
-
-
-
-
-
-
-
-
-