-
公开(公告)号:CN115588230A
公开(公告)日:2023-01-10
申请号:CN202211051519.3
申请日:2022-08-31
申请人: 中国地质大学(武汉) , 中建三局智能技术有限公司 , 中建三局第二建设工程有限责任公司
IPC分类号: G06V40/20 , G06V20/40 , G06V10/764 , G06V10/766 , G06V10/82 , G06T7/73 , G06N3/04 , G06N3/08
摘要: 本发明公开了一个基于高精度边界预测的时序动作检测方法及计算机设备。该方法的任务是对候选提名由粗到细的多阶段修正从而高质量、高效率地完成时序动作定位,主要包含以下步骤:针对起始、中间和结束三个过程进行高斯过程建模,输出每帧为某个动作起始、中间和结束的概率,用于提升边界预测和动作分类的质量;针对从视频中提取到的特征图进行帧级分类;生成高质量的时序候选动作提名和对应的置信度分数;对回归网络结果、帧级动作分类网络结果以及精细动作提名生成网络结果设计总损失函数对时序动作检测架构进行优化。本发明提高了时序动作检测的精度和效率。
-
公开(公告)号:CN115171011A
公开(公告)日:2022-10-11
申请号:CN202210756710.1
申请日:2022-06-30
申请人: 中国地质大学(武汉) , 中建三局智能技术有限公司 , 中建三局第二建设工程有限责任公司
摘要: 本发明提供了一种多类别建材视频计数方法及系统、计数设备,所述计数方法包括:提取机器人拍摄视频的视频帧;将待测视频帧输入到YOLOv4模型中,提取出待测图像的特征;对主干特征提取网络的最后一个特征层进行三次卷积后,利用多尺度的最大池化处理,以分离待测图像中的上下文特征;对获取的特征进行多尺度预测,经解码获取预测框在待测输入图像中的位置;将所有框信息输入到NMS模块中,以得到筛选后的框信息;将目标检测器输出帧序列中前后帧的框坐标序列输入sort跟踪模块中,输出帧间目标id。本发明采用神经网络方法并使用一个多类别多目标跟踪,关联视频的帧间信息,克服目标遮挡,最后通过双过线计数算法计算出整个视频中的建材数量和种类。
-
公开(公告)号:CN116805303A
公开(公告)日:2023-09-26
申请号:CN202310587194.9
申请日:2023-05-23
申请人: 中国地质大学(武汉) , 中建三局智能技术有限公司 , 罗人立
IPC分类号: G06T7/00 , G06V10/764 , G06V10/774 , G06V10/82 , G06N3/0464 , G06N3/048
摘要: 本发明针对工业产品表面缺陷在实际应用中“样本不平衡”问题,以及由于非显著缺陷和不同缺陷之间的相似性,高效定位和分类表面缺陷仍然是一个挑战的问题,提出了一种具有对抗性训练的伪异常样本表面缺陷检测方法及设备,在不需要额外异常样本学习的基础上能够适应检测数据集,从而达到工业产品表面缺陷的有效检测。方法中混合对象检测器,特征编解码器和分类器。对象检测器能够在正式检测之前先筛选一轮异常区域达到整个模型的高效检测能力。特征编解码器具有伪异常样本的对抗性训练,能够使得模型在不需要真实的异常样本的情况下完成数据集正常和异常的学习,减少实际应用中“样本不平衡”对检测结果的影响。
-
公开(公告)号:CN116524533A
公开(公告)日:2023-08-01
申请号:CN202310257567.6
申请日:2023-03-16
申请人: 中国地质大学(武汉) , 中建三局智能技术有限公司
IPC分类号: G06V40/10 , G06V10/774 , G06V10/762 , G06V10/764 , G06V10/82 , G06V10/46 , G06V10/74 , G06V20/70 , G06N3/0464 , G06N3/048 , G06N3/084
摘要: 本发明提出了一种基于混合注意解耦重识别网络的行人重识别方法及设备,以增强领域不变的行人特征的辨别能力,从而形成可靠的类别边界和学习类内语义多样性。方法中混合注意模块的设计是为了从空间和通道的角度,以注意力权重解耦的方式加强领域不变的特征表达,这迫使网络自动利用有利于跨领域重识别的图像区域和属性线索。此外,基于增强的领域不变特征表达,提出了一种多困难样本内存学习策略,以提高目标域样本的类内多样性。本发明通过更新可靠样本内存库和多个困难样本内存库来优化特征学习过程,通过考虑同一类别内各个样本之间的关系,可以用来捕获显著的类内语义变化,同时能够对伪标签的准确性产生积极影响。
-
-
-