-
公开(公告)号:CN117975173A
公开(公告)日:2024-05-03
申请号:CN202410389340.1
申请日:2024-04-02
Applicant: 华侨大学
IPC: G06V10/764 , G06V10/774 , G06V10/82 , G06N3/0464 , G06N3/048
Abstract: 本发明提供一种基于轻量化视觉转换器的儿童邪典图片识别方法和设备,涉及图像识别技术领域。识别方法包含S1、获取待识别的卡通图像。S2、对卡通图像进行预处理。S3、预处理后的卡通图像输入训练好的基于轻量化视觉转换器的实时儿童邪典图片识别模型,获取预测向量。S4、基于预测阈值对预测向量进行比较判断,以判断卡通图像是否属于儿童邪典图片。基于轻量化视觉转换器的实时儿童邪典图片识别模型的网络结构包括依次连接的第一卷积层网络、第一移动网络、第二移动网络、第三移动网络、第四移动网络、第一轻量化转换器网络、第五移动网络、第二轻量化转换器网络、第六移动网络、第三轻量化转换器网络、第二卷积层网络和多层感知机。
-
公开(公告)号:CN113642420B
公开(公告)日:2024-04-16
申请号:CN202110843573.0
申请日:2021-07-26
Applicant: 华侨大学
Abstract: 本发明提供了一种唇语的识别方法、装置及设备,包括:获取视频数据,并对所述视频数据进行处理,以获得唇部图像序列;对所述图像序列进行双向时序的特征提取,生成所述唇部图像序列的表观特征;调用LSTM模型,对所述表观特征的变化进行镜头转换的边界检测并生成检测结果,根据所述检测结果初始化所述LSTM模型的隐含层和记忆层;提取所述隐含层的编码特征,并根据所述编码特征获取单词预测序列。减少现有的唇语识别算法的复杂度、时间复杂度的同时保持较高的准确率。
-
公开(公告)号:CN117576489A
公开(公告)日:2024-02-20
申请号:CN202410065206.6
申请日:2024-01-17
Applicant: 华侨大学
IPC: G06V10/764 , G06V10/82 , G06N3/0455 , G06N3/0464 , G06N3/084 , G06V10/766 , G06V10/25
Abstract: 本发明提供了智能机器人鲁棒实时目标感知方法、装置、设备及介质,包括获取由采集设备采集到的智能机器人使用场景数据集,并对所述智能机器人使用场景数据集进行标注划分处理,生成训练集和测试集;调用训练好的鲁棒实时目标感知模型对所述智能机器人使用场景数据集进行目标跟踪预处理,生成感知信息;根据所述感知信息,生成感知结果。旨在更加鲁棒、实时且稳定的跟踪感知目标,从而为智能机器人的准确执行任务提供了可靠的基础支持。
-
公开(公告)号:CN117115573B
公开(公告)日:2024-01-05
申请号:CN202311388102.0
申请日:2023-10-25
Applicant: 华侨大学
IPC: G06V10/764 , G06V10/26 , G06V10/80 , G06V10/774 , G06V10/52
Abstract: 本发明提供了一种有毒生物图像分类识别方法、装置、设备及存储介质,先通过获取图像样本,调用基于均衡采样策略和逆向采样策略交叉训练过的分类模型基于所述图像样本的分辨率进行分割成多组切块;接着,基于特征提取的阶段调整所述多组切块的数量以及采样频率进行特征提取,以生成不同阶段的多尺度特征图;最后,对所述不同阶段的多尺度特征图进行融合后通过融合特征分类器进行预测,以生成所述图像样本的预测结果,其中,预测结果为所述图像样本是否为有毒生物,通过使用自适应样本平衡采样训练策略,缓解训练集类别样本数量不均衡造成的影响,有效的提高了在对有毒生物识别时的识别率。
-
公开(公告)号:CN117095244B
公开(公告)日:2024-01-05
申请号:CN202311349539.3
申请日:2023-10-18
Applicant: 华侨大学
IPC: G06V10/764 , G06V10/82 , G06V10/80 , G06N3/0464 , G06N3/084
Abstract: 本发明提供了一种红外目标识别方法、装置、设备及介质,包括获取红外摄像机采集到的红外图片数据集;调用训练好的YOLOv5目标识别模型对红外图片数据集的红外图片进行识别处理,生成输出特征张量和模型识别精度;调用注意力模块对输出特征张量和模型识别精度进行过滤处理,生成三个不同尺寸的过滤特征图;小目标识别头、中目标识别头和大目标识别头分别依照对应的不同尺寸的过滤特征图,对待识别物体进行识别。此外,现有的基于领域自适应的红外目标识别技术存在生成的图像质量不够稳定的问题。
-
公开(公告)号:CN117095244A
公开(公告)日:2023-11-21
申请号:CN202311349539.3
申请日:2023-10-18
Applicant: 华侨大学
IPC: G06V10/764 , G06V10/82 , G06V10/80 , G06N3/0464 , G06N3/084
Abstract: 本发明提供了一种红外目标识别方法、装置、设备及介质,包括获取红外摄像机采集到的红外图片数据集;调用训练好的YOLOv5目标识别模型对红外图片数据集的红外图片进行识别处理,生成输出特征张量和模型识别精度;调用注意力模块对输出特征张量和模型识别精度进行过滤处理,生成三个不同尺寸的过滤特征图;小目标识别头、中目标识别头和大目标识别头分别依照对应的不同尺寸的过滤特征图,对待识别物体进行识别。此外,现有的基于领域自适应的红外目标识别技术存在生成的图像质量不够稳定的问题。
-
公开(公告)号:CN117058472A
公开(公告)日:2023-11-14
申请号:CN202311316106.8
申请日:2023-10-12
Applicant: 华侨大学
IPC: G06V10/764 , G06V10/82 , G06V10/25 , G06V10/766 , G06V10/80 , G06N3/0464 , G06N3/045 , G06N3/08
Abstract: 本发明提供了基于自注意力机制的3D目标检测方法、装置、设备,涉及人工智能和计算机视觉技术领域,针对在两阶段网络模型中第一阶段得到感兴趣区域后点与点之间的信息密度不高问题,提出了一种基于自注意力机制的3D目标检测算法,通过增强点与点之间的交互信息密度,进而提高感受野的覆盖范围。在KITTI数据集上的实验证明,该方法在汽车、行人、自行车类数据集上的平均检测精度有了较大的提升,尤其在小目标稀疏的点中效果显著,这进一步证实了该算法的有效性。
-
公开(公告)号:CN111914803B
公开(公告)日:2023-06-13
申请号:CN202010827853.8
申请日:2020-08-17
Applicant: 华侨大学
IPC: G06V20/40 , G06V10/74 , G06V10/82 , G06V40/20 , G06V10/774 , G06V10/764 , G06N3/0464 , G06F16/732
Abstract: 本发明提供一种唇语关键词检测方法、装置、设备及存储介质,其中方法包括:通过DNN方法训练,得到一个二分类的DNN模型;基于所述DNN模型,判断待检测的唇语视频中的每帧唇部图片的讲话状态,分离出所述唇语视频的讲话片段和非讲话片段;提取所述讲话片段,并通过唇语识别模型提取查询样例和讲话片段的每一帧唇部图片的特征,作为后验概率特征;基于所述后验概率特征构建相似度矩阵图;通过卷积神经网络分类模型对所述相似度矩阵图进行二分类,判断唇语视频中是否存在关键词。本发明通过端点检测、唇语识别器提取特征和构建相似度矩阵图,可降低未讲话片段对唇语关键词检测性能的影响,提高关键词检测的性能。
-
公开(公告)号:CN115457636A
公开(公告)日:2022-12-09
申请号:CN202211151908.3
申请日:2022-09-21
Applicant: 华侨大学
Abstract: 本发明实施例提供一种工地现场的安全帽佩戴检测方法、装置、设备和存储介质,涉及视频识别技术领域。安全帽佩戴检测方法包含步骤S1至步骤S6。S1、获取工人的当日外观信息,并和数据库中已有的外观信息组成施工人员查询数据集。其中,当日外观信息包括的面部信息和服饰信息,S2、获取包含工人的监控视频。S3、将监控视频输入预先训练好的安全帽检测模型,获取多组预测向量。S4、根据多组预测向量,判断监控视频中的工人是否佩戴安全帽。S5、当判断到监控视频中的工人未佩戴安全帽时,将监控视频输入预先训练好的施工人员识别模型,获取未佩戴安全帽的工人的特征向量。S6、根据工人的特征向量和施工人员查询数据集,获取未佩戴安全帽的工人信息。
-
公开(公告)号:CN113642619A
公开(公告)日:2021-11-12
申请号:CN202110861484.9
申请日:2021-07-29
Applicant: 华侨大学
Abstract: 本发明提供了一种文字识别模型的训练方法、装置、设备及可读存储介质,包括:调用合成数据集对初始学习模型进行训练,以获得中间模型;调用真实数据集对所述中间模型进行训练,以获得文字识别模型,其中,所述文字识别模型用于接收图像采集装置采集到的图像,并根据所述图像生成文字对象的识别信息及其对应的位置信息。解决了现有技术无法识别不规则分布或者弯曲的文字。
-
-
-
-
-
-
-
-
-