-
公开(公告)号:CN116343290A
公开(公告)日:2023-06-27
申请号:CN202310167964.4
申请日:2023-02-22
Applicant: 武汉大学
IPC: G06V40/16 , G06V40/18 , G06V10/766 , G06V10/82 , G06F3/01 , G06N3/0464 , G06N3/08
Abstract: 公开了一种基于外观的人眼三维视线方向估计方法、系统、装置。该方法为:获取包含人脸的图像或视频;进行图像或视频帧中人脸检测,引入人脸关键点检测算法实现人脸关键点的检测与定位;根据人脸检测结果及关键点的位置分别裁剪出人脸图像和左右眼图像;使用视线估计模型估计图像中人眼三维视线,所述视线估计模型的训练过程为:使用Base‑CNNs网络对人脸图像进行特征提取以获取全脸图像特征向量,使用EE‑Net网络的两个不对称分支结构分别对左右眼图像进行更细粒度的特征提取以获得双眼图像特征向量,结合人脸关键点检测算法进行头部姿态向量的估算,最后使用全连接层对全脸图像特征向量、双眼图像特征向量及头部姿态向量进行回归,用于最终的视线估计任务。
-
公开(公告)号:CN116071327A
公开(公告)日:2023-05-05
申请号:CN202310093903.8
申请日:2023-01-18
Applicant: 武汉大学
IPC: G06T7/00 , G06T5/00 , G06V10/774 , G06V10/82 , G06V10/80 , G06V10/42 , G06V20/70 , G06N3/0464 , G06N3/0985 , G06N3/084
Abstract: 本发明提供一种基于深度神经网络的工件缺陷检测方法。根据图像的全局特征对训练图像进行图像增强处理,减轻由于不同环境光照引起的图像质量不一的问题,增强缺陷检测算法的环境适应能力;将深度神经网络作为特征提取的主干网络,获取更深层的语义信息;在特征金字塔中进行浅层特征和深层信息的特征融合,充分利用上下文信息,并引入注意力机制,用于抑制融合后的特征对于原有细节特征的干扰,实现了语义信息和细节信息的有效融合,提高对于各尺度缺陷的检测性能。本发明可以较为准确、有效地在工件的部件数据集中不同光照条件下的产品图像检测到各类型各尺度的缺陷。
-