一种基于迁移学习的弱监督目标检测方法及系统

    公开(公告)号:CN113239924B

    公开(公告)日:2022-04-26

    申请号:CN202110556712.1

    申请日:2021-05-21

    Abstract: 本发明公开了一种基于迁移学习的弱监督目标检测方法及系统,该方法包括:对输入的强监督及弱监督的图像,使用深度卷积神经网络提取图像的特征,利用区域建议网络提取图像中的候选框,得到不同候选区域的视觉特征;对强监督及弱监督数据集中的类别文本进行特征提取,建立语义图,并利用图卷积网络进行优化,得到所有类别文本的语义特征;使用双监督的平均教师网络结构,包括:强监督分类及边界回归学生网络、弱监督多示例学习学生网络以及分类及边界回归教师网络,利用视觉特征以及优化后的语义特征,聚合强监督及弱监督数据集中的边界框信息和分类信息,从而对候选框进行边界框的回归和分类。通过本发明,提升了弱监督目标检测的效果。

    基于边缘的图像显著性区域检测方法

    公开(公告)号:CN106373131B

    公开(公告)日:2020-11-06

    申请号:CN201610729055.5

    申请日:2016-08-25

    Abstract: 本发明公开了一种基于边缘的图像显著性区域检测方法,包括以下步骤:步骤一:将原始图像通过边缘检测得到超度量等高线图UCM;步骤二:针对UCM通过不同的门限去得到两个不同尺度的超像素划分;步骤三:在细颗粒度的超像素划分层面上同时考虑颜色对比度、空间先验和边界先验去得到初始显著性值;步骤四:在细颗粒度的超像素划分层面上,以每个超像素为节点,边缘强度为边建立一个无方向的图,通过计算图上不同节点的测地距离得到背景先验;步骤五:联合考虑初始显著性值、背景先验和不同尺度的一致性去得到最终的显著性值。本发明能够得到统一高亮的显著性物体或者区域,能够有助于图像缩放和图像分割等应用。

    基于编码单元层次和率失真代价的HEVC复杂度控制方法

    公开(公告)号:CN106231301B

    公开(公告)日:2020-06-12

    申请号:CN201610585100.4

    申请日:2016-07-22

    Abstract: 本发明提供一种基于编码单元层次和率失真代价的HEVC复杂度控制方法,步骤为:用户设定视频编码目标复杂度系数;统计第一个GOP中的各个编码单元层次的复杂度,计算出各个编码单元层次的复杂度的比值,并通过不同的编码单元层次组合得到不同的门限值;把目标复杂度平均分配到待编码GOP内的每一帧,把复杂度平均分配给编码树单元,根据分配到的复杂度选择连续的两个编码单元层次的层数,然后确定每一个编码单元层数的个数和位置。本发明考虑了基于编码单元层次和率失真代价,整个方法避免引入额外的复杂度,且无需专门的训练视频序列,对于任何视频可以直接编码,能够在GOP级别在一定范围内实现复杂度的有效控制。

    一种内容驱动的智能家居控制方法

    公开(公告)号:CN105988369B

    公开(公告)日:2020-05-08

    申请号:CN201510080011.X

    申请日:2015-02-13

    Abstract: 本发明提供了一种以内容驱动的智能家居控制方法,所述方法通过基于视频中关键帧的图像主色调和/或场景情节特征对视频碎片进行标记,或者依据音频数据特征进行标记,添加相应的标签,每次播放这些多媒体内容时,标记的这些标签都会驱动智能家居设备工作。通过本发明的方法进行智能家居的驱动控制可以大大简化人为控制这一繁琐的过程,并且本发明使得控制系统更加灵活。

    基于深度学习的可变码率图像编码、解码系统及方法

    公开(公告)号:CN109996071B

    公开(公告)日:2020-03-27

    申请号:CN201910240535.9

    申请日:2019-03-27

    Abstract: 本发明公开了一种基于深度学习的可变码率图像编码系统及方法,包括:正向多尺度分解变换网络模块,将输入原始图像分解为多个尺度的图像特征;量化模块,将图像特征量化成整数;自适应码率分配模块,根据给定的目标码率对量化成整数的图像特征进行块级别的码率分配;熵编解码模块,将进行码率分配后的图像特征编码为二进制码流;同时提供了一种可变码率图像解码系统及方法,用于解码上述编码系统及方法形成的编码。本发明使用深度卷积神经网络构建正反多尺度分解变换,利用大量数据进行训练得到最优模型参数,结合基于图像复杂度的自适应码率分配方法,在实际应用中可实现可变码率图像编解码。

    基于深度融合网络的视频运动物体检测系统、方法及终端

    公开(公告)号:CN109815911A

    公开(公告)日:2019-05-28

    申请号:CN201910078362.5

    申请日:2019-01-26

    Abstract: 本发明提供过了一种基于深度融合网络的视频运动物体检测系统,包括:视频特征提取模块,接收视频序列输入,对视频内容进行特征提取,得到视频中关于场景信息的特征表达,即视频场景特征表达,并发送至深度融合模块;基础结果检测模块,接收视频序列输入,利用基础检测子对运动物体进行检测,得到相应的基础检测结果,并发送至深度融合模块;深度融合模块,接收视频场景特征表达和基础检测结果,利用深度神经网络进行最优融合,输出最终的检测结果。同时提供了一种视频运动物体检测方法、终端。本发明能够取得高准确度的检测结果。

    基于卡尔曼滤波的帧率上变换运动估计方法及系统

    公开(公告)号:CN104915966B

    公开(公告)日:2018-02-09

    申请号:CN201510233587.5

    申请日:2015-05-08

    Abstract: 本发明公开一种基于卡尔曼滤波的帧率上变换运动估计方法及系统。所述方法包括以下步骤:首先设置卡尔曼滤波模型的参数以及状态初始值,使得模型与实际系统吻合;然后通过先进行单向运动估计、后映射到内插帧的策略得到运动矢量观测值;最后采用一种增益时变的卡尔曼滤波方法对观测矢量进行更新,从而得到更为准确的运动矢量。在此方法基础上,提出一种基于卡尔曼滤波的帧率上变换运动估计硬件架构,通过交替的块扫描顺序以及并行的两路数据通道实现系统的高利用率以及高吞吐率。

    一种基于不规则采样的电影模式检测方法和装置

    公开(公告)号:CN104243887B

    公开(公告)日:2017-08-01

    申请号:CN201410457742.7

    申请日:2014-09-10

    Abstract: 本发明提供了一种基于不规则采样的电影模式检测方法和装置,其将每帧图像划分为多个图像子块;对相邻的图像子块,采用互异的不规则采样选出采样位置的像素;然后分块统计出这些像素的灰度直方图。在对当前帧进行直方图统计的同时,并行计算其与前一帧图像的直方图差值;当前帧图像扫描结束时,得到其直方图以及该直方图与前一帧直方图的差值,此灰度直方图参与到下一帧的计算当中;最终根据直方图差的大小确定电影模式。本发明占用很小的存储器资源;准确性较高,克服了传统基于直方图的方法对包含局部运动或全局平缓运动的序列无法正确检测的缺点。

    基于边缘的图像显著性区域检测方法

    公开(公告)号:CN106373131A

    公开(公告)日:2017-02-01

    申请号:CN201610729055.5

    申请日:2016-08-25

    Abstract: 本发明公开了一种基于边缘的图像显著性区域检测方法,包括以下步骤:步骤一:将原始图像通过边缘检测得到超度量等高线图UCM;步骤二:针对UCM通过不同的门限去得到两个不同尺度的超像素划分;步骤三:在细颗粒度的超像素划分层面上同时考虑颜色对比度、空间先验和边界先验去得到初始显著性值;步骤四:在细颗粒度的超像素划分层面上,以每个超像素为节点,边缘强度为边建立一个无方向的图,通过计算图上不同节点的测地距离得到背景先验;步骤五:联合考虑初始显著性值、背景先验和不同尺度的一致性去得到最终的显著性值。本发明能够得到统一高亮的显著性物体或者区域,能够有助于图像缩放和图像分割等应用。

    基于编码单元层次和率失真代价的HEVC复杂度控制方法

    公开(公告)号:CN106231301A

    公开(公告)日:2016-12-14

    申请号:CN201610585100.4

    申请日:2016-07-22

    Abstract: 本发明提供一种基于编码单元层次和率失真代价的HEVC复杂度控制方法,步骤为:用户设定视频编码目标复杂度系数;统计第一个GOP中的各个编码单元层次的复杂度,计算出各个编码单元层次的复杂度的比值,并通过不同的编码单元层次组合得到不同的门限值;把目标复杂度平均分配到待编码GOP内的每一帧,把复杂度平均分配给编码树单元,根据分配到的复杂度选择连续的两个编码单元层次的层数,然后确定每一个编码单元层数的个数和位置。本发明考虑了基于编码单元层次和率失真代价,整个方法避免引入额外的复杂度,且无需专门的训练视频序列,对于任何视频可以直接编码,能够在GOP级别在一定范围内实现复杂度的有效控制。

Patent Agency Ranking