-
公开(公告)号:CN118898817B
公开(公告)日:2024-12-03
申请号:CN202411404146.2
申请日:2024-10-09
Applicant: 杭州海康威视数字技术股份有限公司
IPC: G06V20/56 , G06V10/80 , G06V10/40 , G06V10/764
Abstract: 本申请实施例提供了一种基于激光雷达的3D检测方法、装置及电子设备,该方法包括,获取目标帧;分别对各目标帧进行检测,得到各目标帧中存在的第一对象,并获取各第一对象的第一点云特征;分别将各目标帧中各第一对象的中心点的位姿转换为各第一对象对应的目标位姿,得到目标点云,并将各目标点云叠加至目标当前帧,得到目标融合帧;提取目标融合帧的俯视图特征,作为第一俯视图特征;按照第一对象在目标当前帧中所处位姿,将第一对象的第一点云特征投影至俯视图空间,得到第二俯视图特征;将第一俯视图特征和第二俯视图特征输入至第一对象检测模块,得到目标当前帧的对象检测结果。应用本申请实施例提供的技术方案,能够提高3D检测的准确性。
-
公开(公告)号:CN118898817A
公开(公告)日:2024-11-05
申请号:CN202411404146.2
申请日:2024-10-09
Applicant: 杭州海康威视数字技术股份有限公司
IPC: G06V20/56 , G06V10/80 , G06V10/40 , G06V10/764
Abstract: 本申请实施例提供了一种基于激光雷达的3D检测方法、装置及电子设备,该方法包括,获取目标帧;分别对各目标帧进行检测,得到各目标帧中存在的第一对象,并获取各第一对象的第一点云特征;分别将各目标帧中各第一对象的中心点的位姿转换为各第一对象对应的目标位姿,得到目标点云,并将各目标点云叠加至目标当前帧,得到目标融合帧;提取目标融合帧的俯视图特征,作为第一俯视图特征;按照第一对象在目标当前帧中所处位姿,将第一对象的第一点云特征投影至俯视图空间,得到第二俯视图特征;将第一俯视图特征和第二俯视图特征输入至第一对象检测模块,得到目标当前帧的对象检测结果。应用本申请实施例提供的技术方案,能够提高3D检测的准确性。
-
公开(公告)号:CN111259919B
公开(公告)日:2024-01-23
申请号:CN201811457704.6
申请日:2018-11-30
Applicant: 杭州海康威视数字技术股份有限公司
IPC: G06V20/40 , G06V10/44 , G06V10/764 , G06V10/80 , G06V10/82
Abstract: 达,有利于提高视频分类准确度。本发明提供一种视频分类方法、装置及设备、存储介质,视频分类方法,包括:将待分类处理的视频帧序列输入至已训练的神经网络中,以由所述神经网络对所述视频帧序列中每N个视频帧在目标域上进行特征关联得到对应的第一关联特征向量,对所有第一关联特征向量在时间域上进行特征关联得到第二关联特征向量,并对所述第二关联特征向量进行分类得到并输出分类结果;依据所述神经网络输出的分类结果确定所述视频帧序列的类别;其中,所述N为小于所述视(56)对比文件智洪欣;于洪涛;李邵梅.基于时空域深度特征两级编码融合的视频分类.计算机应用研究.2017,(第03期),全文.吴庆甜;郭会文;吴新宇;贺涛.基于巡逻机器人的实时跑动检测系统.集成技术.2017,(第03期),浦世亮;程战战.基于注意力矫正的自然场景文字识别.中国公共安全.2017,(第09期),
-
公开(公告)号:CN111832351A
公开(公告)日:2020-10-27
申请号:CN201910312414.0
申请日:2019-04-18
Applicant: 杭州海康威视数字技术股份有限公司
Abstract: 本申请提供一种事件检测方法、装置和计算机设备。本申请提供的事件检测方法,包括:将待检测视频切分为多个子视频;对每个子视频进行特征提取,得到每个子视频的特征图;针对每个子视频,将该子视频输入到第一神经网络,输出该子视频的权重;其中,每个子视频的权重用于表征该子视频与识别出的事件的相关程度;根据每个子视频的特征图和每个子视频的权重,识别所述待检测视频所属的事件,并将权重最大的子视频对应的时间段确定为该事件发生的时间段。本申请提供的事件检测方法、装置和计算机设备,不需要进行逐帧比对,即可确定待检测视频所属的事件和该事件发生的时间段,效率较高。
-
公开(公告)号:CN111259919A
公开(公告)日:2020-06-09
申请号:CN201811457704.6
申请日:2018-11-30
Applicant: 杭州海康威视数字技术股份有限公司
Abstract: 本发明提供一种视频分类方法、装置及设备、存储介质,视频分类方法,包括:将待分类处理的视频帧序列输入至已训练的神经网络中,以由所述神经网络对所述视频帧序列中每N个视频帧在目标域上进行特征关联得到对应的第一关联特征向量,对所有第一关联特征向量在时间域上进行特征关联得到第二关联特征向量,并对所述第二关联特征向量进行分类得到并输出分类结果;依据所述神经网络输出的分类结果确定所述视频帧序列的类别;其中,所述N为小于所述视频帧序列长度的正整数,所述目标域至少包括空间域。改善对视频在时间域和空间域上的信息表达,有利于提高视频分类准确度。
-
公开(公告)号:CN118918418B
公开(公告)日:2024-12-31
申请号:CN202411407566.6
申请日:2024-10-09
Applicant: 杭州海康威视数字技术股份有限公司
IPC: G06V10/774 , G06V10/40 , G06V10/25 , G06V10/80
Abstract: 本申请实施例提供了一种目标检测模型的训练方法、装置及电子设备,涉及计算机技术领域,包括:获取多个样本数据集;将各样本数据集输入至待训练的目标检测模型中,利用目标检测模型的三维骨干网络提取点云数据的点云特征,利用目标检测模型的图像骨干网络提取图像数据的图像特征;针对每一样本数据集,对点云特征和图像特征进行特征融合,得到样本数据集的待检测特征;对各待检测特征进行目标检测,得到各样本数据集各自的目标检测结果;根据各样本数据集各自的感兴趣区域,对比各目标检测结果与各样本数据集的真值,确定目标检测模型的模型损失;基于模型损失对目标检测模型进行调整。本申请实施例提高了目标检测模型在不同数据集的泛化能力。
-
公开(公告)号:CN111950332B
公开(公告)日:2023-09-05
申请号:CN201910412596.9
申请日:2019-05-17
Applicant: 杭州海康威视数字技术股份有限公司
IPC: G06V20/40 , G06V20/52 , G06V10/774 , G06V10/764 , G06V10/82 , G06N3/045 , G06N3/044 , G06N3/0464 , G06N3/084
Abstract: 本申请公开了一种视频时序定位方法、装置、计算设备和存储介质,属于视频监控领域。本申请实施例提供了一种视频时序定位方法,通过将监控视频裁剪的多个第一视频片段输入事件定位模型中,根据该模型,确定监控视频中的每个第一事件发生的时间范围。该事件定位模型为基于第一样本视频包括的多个第二视频片段和第一样本视频标注的至少一个第二事件训练得到的。该方法中使用的模型为事件定位模型,由于该模型在训练时不需对每帧图像进行标注,因此,在使用该模型进行时序定位时,只需对监控视频中的每个第一视频片段中的事件进行识别定位,不需对监控视频中的每帧图像进行识别定位,从而缩短了视频时序定位时长,提高了视频时序定位效率。
-
公开(公告)号:CN111950332A
公开(公告)日:2020-11-17
申请号:CN201910412596.9
申请日:2019-05-17
Applicant: 杭州海康威视数字技术股份有限公司
Abstract: 本申请公开了一种视频时序定位方法、装置、计算设备和存储介质,属于视频监控领域。本申请实施例提供了一种视频时序定位方法,通过将监控视频裁剪的多个第一视频片段输入事件定位模型中,根据该模型,确定监控视频中的每个第一事件发生的时间范围。该事件定位模型为基于第一样本视频包括的多个第二视频片段和第一样本视频标注的至少一个第二事件训练得到的。该方法中使用的模型为事件定位模型,由于该模型在训练时不需对每帧图像进行标注,因此,在使用该模型进行时序定位时,只需对监控视频中的每个第一视频片段中的事件进行识别定位,不需对监控视频中的每帧图像进行识别定位,从而缩短了视频时序定位时长,提高了视频时序定位效率。
-
公开(公告)号:CN119152505A
公开(公告)日:2024-12-17
申请号:CN202411631394.0
申请日:2024-11-14
Applicant: 杭州海康威视数字技术股份有限公司
IPC: G06V20/70 , G06V20/56 , G06V10/25 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/0495 , G01S17/04 , G01S17/931
Abstract: 本申请提供一种标注方法、装置、设备及存储介质。在一个示例中,该方法包括:获取目标相机采集的N组图像,以及,激光雷达采集的N帧激光点云;对N组图像以及所述N帧激光点云进行特征融合,并依据融合特征对所述N帧激光点云中的激光点进行速度预测;依据N帧激光点云中各激光点的速度,以及,各帧激光点云的采集时间,将N帧激光点云中的各激光点映射到指定时刻的一帧激光点云中;对指定时刻的激光点云进行标注,得到所述指定时刻的激光点云的标注结果;依据N帧激光点云中各激光点与所述指定时刻的激光点云中各激光点之间的映射关系,将指定时刻的激光点云的标注结果映射回所述N帧激光点云。该方法可以提高标注效率。
-
公开(公告)号:CN111898535A
公开(公告)日:2020-11-06
申请号:CN202010753181.0
申请日:2020-07-30
Applicant: 杭州海康威视数字技术股份有限公司
Inventor: 许昀璐
Abstract: 本申请实施例公开了一种目标识别方法、装置及存储介质,属于图像处理技术领域。在本申请实施例中,能够先根据矫正参数预测网络得到的色彩矫正参数对图像进行色彩矫正,再通过目标识别网络对矫正后的图像进行目标识别,得到目标识别结果。由于目标识别网络是根据多个样本图像和标注信息训练得到的,而矫正参数预测网络是根据目标识别网络的训练过程中的反向传播误差训练得到的,也即是,矫正参数预测网络能够随着目标识别网络的训练优化而优化,因此,训练得到的矫正参数预测网络能够满足该目标识别网络,也即得到的矫正后的图像能够提高目标识别的准确率。
-
-
-
-
-
-
-
-
-