-
公开(公告)号:CN104268900A
公开(公告)日:2015-01-07
申请号:CN201410504910.3
申请日:2014-09-26
IPC: G06T7/20
Abstract: 本发明提供一种运动目标检测方法及装置,该方法包括:在视频流的压缩域中,对当前帧图像中帧内编码的像素块进行运动向量预测,得到帧内编码的像素块的运动向量,其中,视频流中的每帧图像预先按照设定规则被分割成设定数目个像素块,每帧图像大小相同;根据当前帧以及当前帧之前连续M帧图像中,位于同一位置的像素块对应的运动向量为非零向量的次数,确定当前帧图像中的所有非零向量;根据确定的所有非零向量,确定当前帧图像中的运动区域;将运动区域映射到像素域,在运动区域中,采用像素域目标检测算法进行预设目标的检测,并将检测到的预设目标进行标记后输出。本发明能够提高目标检测的准确度以及目标检测的速度。
-
公开(公告)号:CN104168482A
公开(公告)日:2014-11-26
申请号:CN201410302970.7
申请日:2014-06-27
Abstract: 本发明公开了一种视频编解码方法及装置,在本方案中,由于在编码过程中,可从像素级对各待编码原始视频图像进行分层,因此会更为灵活地支持视频编码过程中对象的层次表示,并且还可达到提高视频编码过程中对视频图像的轮廓描述的精确性的效果。再有,由于在编码过程中,还可将用于反映原始视频图像中的各像素所对应的视频内容层级的像素属性标识值也编入输出视频位流,以便在解码出原始视频图像的同时也可解码出各像素的像素属性标识信息、进而根据各像素的像素属性标识信息、提取出不同层次的对象,从而还可达到更为灵活地支持视频解码过程中对象的层次表示以及提高视频解码过程中对视频图像的轮廓描述的精确性的目的。
-
公开(公告)号:CN103778642A
公开(公告)日:2014-05-07
申请号:CN201310677149.9
申请日:2013-12-12
IPC: G06T7/20
Abstract: 本发明适用于图像处理技术领域,提供了一种目标跟踪的方法及装置,所述方法包括:当输入第t帧图像时,通过前t-1帧图像学习更新得到的在线模型Ht-1,预计对象所在区域;在预计的对象所在区域进行样本数据采集,并将所述样本数据组成Bag集合,所述Bag集合为无标签数据;通过所述Bag集合以及特定模型对在线模型Ht-1进行半监督学习更新,得到第t帧图像的在线模型Ht;根据第t帧图像的在线模型Ht输出跟踪结果。本发明提出的方法及装置可实现减少样本噪声的引入,获得对遮挡健壮的跟踪效果。
-
公开(公告)号:CN103761529A
公开(公告)日:2014-04-30
申请号:CN201310752394.1
申请日:2013-12-31
Applicant: 北京大学
Abstract: 一种基于多色彩模型和矩形特征的明火检测方法和系统,包括以下步骤:检测当前视频帧的运动区域;提取当前运动区域在多种色彩模型下的颜色特征,将符合明火颜色特征的像素点标记为候选像素,通过对候选像素所在区域处理得到矩形明火候选区域;提取候选区域的矩形特征,并输入分类器判断是否为明火区域。所述的系统包括:信号采集模块明火检测模块以及结果显示模块。本发明通过结合明火运动、颜色及矩形特征对监控视频进行明火检测,提高了检测准确性,降低误检,实现了实时有效的早期明火检测。
-
公开(公告)号:CN103020628A
公开(公告)日:2013-04-03
申请号:CN201210506158.7
申请日:2012-11-30
Abstract: 本发明公开了一种基于RGB对比图像与目标形状的视频烟雾检测方法,其方法包括以下步骤:(1)对输入视频图像进行预处理,并且得到背景帧与前景区域;(2)获得背景帧和当前帧的RGB对比图像,并对其进行二维离散小波变换,得到小波系数图像;(3)从获取的小波系数图像上提取可疑区域的能量特征;(4)提取可疑区域的视觉特征;(5)综合考虑能量特征与视觉特征对可疑区域是否为烟雾区域做出判定。该方法对获取的RGB对比图像进行二维离散小波变化,使得在小波变换中能很好的区分烟雾和一般纯色物体,并且在考虑能量特征时,把可疑区域的形状和可疑区域内高低频的能量比进行综合考虑从而使得检测结果更具有可靠性。
-
公开(公告)号:CN102973253A
公开(公告)日:2013-03-20
申请号:CN201210428827.3
申请日:2012-10-31
Applicant: 北京大学
Abstract: 本发明涉及一种利用视觉信息监测人体生理指标的方法和系统。所述方法包括以下步骤:通过采集装置采集待测对象的视觉信息并存储数据;对所选取的视觉信息进行处理;对上述处理结果进行分析以提取人体生理指标;对所提取的生理指标返回显示。所述的系统包括:用于采集视觉信息的模块;用于对采集的视觉信息进行处理的模块;用于对处理后的信号分析以提取人体生理指标的模块。本发明实现人体生理状况的无创、连续监测以及多项生理指标的同步检测与协同分析,测量准确度高,布线简单,易于作为家庭医疗保健内容推广普及。
-
公开(公告)号:CN108764292B
公开(公告)日:2022-03-18
申请号:CN201810390879.3
申请日:2018-04-27
Applicant: 北京大学
IPC: G06K9/62 , G06N3/04 , G06N3/08 , G06V10/764 , G06V10/82
Abstract: 本发明提供了一种基于弱监督信息的深度学习图像目标映射及定位方法。该方法包括:使用带有类别标签的图像数据分别训练两个深度卷积神经网络框架,得到分类模型M1和分类模型M2,并获取全局带参可学习池化层参数;使用新的分类模型M2对测试图像进行特征提取,得到特征图,根据特征图通过特征类别映射及阈值法得到初步定位框;使用选择性搜索方法对测试图像进行候选区域提取,使用分类模型M1筛选类别出候选框集合;对初步定位框和候选框进行非极大值抑制处理,得到测试图像最终的目标定位框。本发明引入全局带参可学习池化层,能够学习得到关于目标类别j的更好的特征表达,并通过使用选择性特征类别映射的方式,有效得到图像中目标物体的位置信息。
-
公开(公告)号:CN113723552A
公开(公告)日:2021-11-30
申请号:CN202111042840.0
申请日:2021-09-07
Applicant: 北京大学深圳研究生院
Abstract: 本发明属于分布式训练技术领域,公开了一种大规模多机多卡预训练方法、系统、设备及服务器集群,在多个服务器上部署多机多卡,进行同构机型和异构混合机型的多机多卡并行;基于slurm框架进行大规模多机多卡训练及评测,以无监督特征学习BYOL算法为例予以实施;基于Horovod框架进行大规模多机多卡训练及评测,以视频语义无监督学习PRP算法予以实施;所述训练包括环境配置、任务配置、通信配置、任务加速。本发明涉及的多机多卡大规模训练实验,batchsize之高,训练时间压缩之短,验证鹏城云脑I大科学装置的并行能力,拓展并行训练的集群规模,对于利用超大规模集群开展分布式训练具有指导意义。
-
公开(公告)号:CN109919183A
公开(公告)日:2019-06-21
申请号:CN201910069271.5
申请日:2019-01-24
Applicant: 北京大学
IPC: G06K9/62
Abstract: 本发明公开了一种基于小样本的图像识别方法、装置、设备及存储介质,属于图像识别技术领域。所述方法包括:根据第一大样本图像集构建小样本的第一任务序列,每个第一任务包括带类别标签的第一支持集和不带类别标签的第一检索集;采用神经网络提取第一支持集中各图像样本的第一样本特征;根据第一样本特征和样本的类别标签,自适应地学习相应第一任务的度量矩阵;采用度量矩阵对相应第一检索集中的图像样本进行识别。该方法中,提高了小样本场景下的图像识别性能和准确率。
-
公开(公告)号:CN106686352B
公开(公告)日:2019-06-07
申请号:CN201611209342.X
申请日:2016-12-23
Applicant: 北京大学
Abstract: 本发明提供了一种多GPU平台的多路视频数据的实时处理方法。该方法主要包括:步骤1、建立基于任务处理器的层式并行结构;步骤2、对层式并行结构中的各个任务处理器进行初始化,各个任务处理器接收监控视频数据,对监控视频数据进行实时处理;步骤3、进行环境监测,根据环境监测结果计算任务队列健康度、任务缓存区健康度和各GPU健康度;步骤4、根据任务队列健康度、缓存区健康度及各GPU健康度值进行任务处理器调度和作业分发;步骤5、定时重复步骤3、4,使各GPU间保持负载均衡状态。本发明为在多GPU平台上的多路视频多任务实时处理设计了完整的并行、调度、数据管理方案,能够充分利用多GPU处理器强大的计算能力,大大加快计算速度。
-
-
-
-
-
-
-
-
-