一种长尾目标检测方法与系统

    公开(公告)号:CN111832406A

    公开(公告)日:2020-10-27

    申请号:CN202010508103.4

    申请日:2020-06-05

    Abstract: 本发明提出的基于平衡分组Softmax的长尾目标检测方法与系统,该方法在网络结构上,改变网络的最后一个全连接层,对拥有不同训练样本数量的类别进行分组,将背景类别单独分为一组,在每组中都加入其它类别;在训练过程中,按照组内普通类别训练样本数量采样一定数量的其它类别样本进行训练,并在每个组内分别用Softmax函数激活并计算交叉熵损失;在测试过程中,在每个组内分别用Softmax函数激活,去掉组内其它类别,仅保留正常类别得分,用背景组的“其它”类别得分为所有正常类别加权,组成最终得分,用于后处理。该发明提升了在大规模长尾目标数据集上的目标检测以及实例分割性能。

    基于特征图恢复的场景分割方法和系统

    公开(公告)号:CN109034198A

    公开(公告)日:2018-12-18

    申请号:CN201810664250.3

    申请日:2018-06-25

    Inventor: 唐胜 张蕊 李锦涛

    Abstract: 本发明涉及一种基于特征图恢复的场景分割方法和系统,包括对原始图像进行降采样,得到降采样图像,通过特征学习网络得到该降采样图像的降采样特征图,将该降采样特征图的尺寸恢复为原始图像尺寸,得到上采样特征图,将该上采样特征图输入场景分割网络,得到该原始图像的场景分割结果。本发明利用降采样输入图像可以获得的较快的分割速度;利用原始大小输入图像可以获得的较高的分割精度。此外,本发明还提出了辅助中间层监督和边境区域重加权的方法辅助场景分割神经网络模型的优化过程,从而在保持模型加速的前提下提升加速后模型的分割精度。

    一种数字图像训练和检测方法

    公开(公告)号:CN101661559B

    公开(公告)日:2013-03-06

    申请号:CN200910092710.0

    申请日:2009-09-16

    Abstract: 本发明提供一种数字图像训练方法以及利用该训练方法的图像检测方法。其中该训练方法包括下列步骤:提取训练样本的图像特征;根据所述图像特征对所述训练样本进行聚类分析,将所述训练样本分为多个子类;对于每个子类,根据所述图像特征进行SVM训练,生成SVM模型。利用该训练方法所获得的多个SVM模型进行图像检测,检测准确率高、且具有较佳推广性和较高时效性。

    一种数字图像训练和检测方法

    公开(公告)号:CN101661559A

    公开(公告)日:2010-03-03

    申请号:CN200910092710.0

    申请日:2009-09-16

    Abstract: 本发明提供一种数字图像训练方法以及利用该训练方法的图像检测方法。其中该训练方法包括下列步骤:提取训练样本的图像特征;根据所述图像特征对所述训练样本进行聚类分析,将所述训练样本分为多个子类;对于每个子类,根据所述图像特征进行SVM训练,生成SVM模型。利用该训练方法所获得的多个SVM模型进行图像检测,检测准确率高、且具有较佳推广性和较高时效性。

    一种基于故事情节发展模型分析的电影动作场景检测方法

    公开(公告)号:CN100559879C

    公开(公告)日:2009-11-11

    申请号:CN200710099727.X

    申请日:2007-05-29

    Abstract: 本发明公开了一种基于故事情节发展模型分析的电影动作场景检测方法,包括:对视频做预处理操作;计算各个镜头的镜头长度;计算镜头的平均运动强度;利用镜头长度和镜头平均运动强度计算电影编辑因子;计算每个音频帧的短时音频能量以及镜头的平均音频能量;计算镜头的平均运动分散度;利用镜头平均音频能量和镜头平均运动分散度,计算人类感知因子;根据电影编辑因子和人类感知因子,建立故事情节发展模型,并按照时间顺序生成故事情节发展流图;根据故事情节发展模型检测电影中的动作场景。本发明的优点在于从电影编辑手法和人类感知两个角度考虑视觉和听觉因素,建立故事情节发展模型,从而模拟情节发展变化,实现了电影中动作场景的准确检测。

    一种基于时空条带模式分析的新闻主播镜头检测方法

    公开(公告)号:CN100548030C

    公开(公告)日:2009-10-07

    申请号:CN200710099726.5

    申请日:2007-05-29

    Abstract: 本发明公开了一种基于时空条带模式分析的新闻主播检测方法,包括:从经过编辑的新闻视频中截取连续的N帧作为一组,并提取水平时空条带和垂直时空条带;提取水平时空条带和垂直时空条带中所对应的图像特征,得到相应的特征向量;通过聚类方法对特征向量分别聚类,并将同一类中时间连续的水平或垂直时空条带分别合并,作为类中的新元素,得到最终的水平聚类结果和垂直聚类结果;将水平聚类结果中包含有最多元素的类和垂直聚类结果中包含有最多元素的类进行融合,根据融合结果检测新闻主播镜头。本发明的优点是对各类新闻视频主播检测准确率高,通用性强,计算复杂度低。避免了现有方法过于依赖准确的镜头分割和其他模态信息的缺点。

    一种基于故事情节发展模型分析的电影动作场景检测方法

    公开(公告)号:CN101316362A

    公开(公告)日:2008-12-03

    申请号:CN200710099727.X

    申请日:2007-05-29

    Abstract: 本发明公开了一种基于故事情节发展模型分析的电影动作场景检测方法,包括:对视频做预处理操作;计算各个镜头的镜头长度;计算镜头的平均运动强度;利用镜头长度和镜头平均运动强度计算电影编辑因子;计算每个音频帧的短时音频能量以及镜头的平均音频能量;计算镜头的平均运动分散度;利用镜头平均音频能量和镜头平均运动分散度,计算人类感知因子;根据电影编辑因子和人类感知因子,建立故事情节发展模型,并按照时间顺序生成故事情节发展流图;根据故事情节发展模型检测电影中的动作场景。本发明的优点在于从电影编辑手法和人类感知两个角度考虑视觉和听觉因素,建立故事情节发展模型,从而模拟情节发展变化,实现了电影中动作场景的准确检测。

Patent Agency Ranking