一种视频运动对象分割方法

    公开(公告)号:CN1691065A

    公开(公告)日:2005-11-02

    申请号:CN200410037501.3

    申请日:2004-04-23

    Abstract: 本发明涉及一种视频运动对象分割方法,该方法包括先对图像进行时序分割,将包含运动对象的初始区域和背景分离,随后的空间分割以及区域的分类、合并都仅在初始区域上进行,从而大大减少了计算开销,提高分割速度;根据区域的空间、时序和邻域相似度在MRF模型中加入空间约束、时序约束和邻域约束,并通过求解MRF的最大后验概率对区域分类,最终准确地分割出运动对象,克服了运动估计易受不规则运动和光照影响的缺点。

    在体育比赛视频中检测精彩片断的方法

    公开(公告)号:CN1510907A

    公开(公告)日:2004-07-07

    申请号:CN02156973.8

    申请日:2002-12-24

    Abstract: 一种在体育比赛视频中检测精彩片断的方法,包括步骤:确定视频中相邻帧的摄像机运动;用所述摄像机运动来校正镜头边界的检测;确定所述镜头是否为重放镜头,如果是重放,则判定为精彩片断;根据所述摄像机运动来计算重放镜头与之前视频中正常镜头的相似度,其中相似度最大的镜头判定为精彩片断。本发明能对精彩片断进行有效的自动提取,且不依赖于特定比赛的领域知识。针对体育视频中存在的大量运动,本发明使用摄像机运动分析的结果来校验所检测的镜头边界,从而提高了镜头分割的准确性。

    压缩域体育视频定位标题文字的方法

    公开(公告)号:CN1504921A

    公开(公告)日:2004-06-16

    申请号:CN02154399.2

    申请日:2002-12-04

    Abstract: 一种压缩域体育视频定位标题文字的方法,包括以下步骤:用8×8DCT块的高频系数能量检测出初步的文字区域;通过快速算法直接由8×8图像块的DCT系数得到其4个2×8子块的反映水平方向频率变化的高频DCT系数;由子块的高频系数的水平和垂直投影图将初检的文字区域分割成每块只含一行且水平方向相对独立的文字块;利用体育视频中文字的时间冗余特性过滤掉误检的文字块。本发明通过少量的运算在压缩域实现了文字的精确定位,具有很快的定位速度和较高的准确性,不仅可以用于体育视频,还可用于其他类视频如新闻视频中文字的定位。

    一种长尾目标检测方法与系统

    公开(公告)号:CN111832406B

    公开(公告)日:2022-12-06

    申请号:CN202010508103.4

    申请日:2020-06-05

    Abstract: 本发明提出的基于平衡分组Softmax的长尾目标检测方法与系统,该方法在网络结构上,改变网络的最后一个全连接层,对拥有不同训练样本数量的类别进行分组,将背景类别单独分为一组,在每组中都加入其它类别;在训练过程中,按照组内普通类别训练样本数量采样一定数量的其它类别样本进行训练,并在每个组内分别用Softmax函数激活并计算交叉熵损失;在测试过程中,在每个组内分别用Softmax函数激活,去掉组内其它类别,仅保留正常类别得分,用背景组的“其它”类别得分为所有正常类别加权,组成最终得分,用于后处理。该发明提升了在大规模长尾目标数据集上的目标检测以及实例分割性能。

    一种用户自生产内容检测方法和系统

    公开(公告)号:CN110019812B

    公开(公告)日:2021-08-20

    申请号:CN201810164771.2

    申请日:2018-02-27

    Abstract: 本发明涉及一种用户自生产内容检测方法和系统,包括:获取社交媒体中用户自生产内容的文本内容、图像内容和社交属性,并从文本内容中抽取词向量特征,从社交属性中抽取社交属性特征以及从图像内容中抽取图像特征;通过递归神经网络融合词向量特征和社交属性特征,得到文本、社交融合特征;根据递归神经网络得到注意力向量,并通过注意力机制将图像特征处理为注意力融合特征,将注意力融合特征与文本、社交融合特征相融合,生成多模态融合特征;利用多模态融合特征训练分类器,以检测社交媒体中指定的用户自生产内容。本发明通过深度神经网络,融合内容检测涉及的多种模态内容,能够全面地进行用户自生产内容检测,得到更加准确的检测结果。

    基于双目光场相机的深度获取方法和系统

    公开(公告)号:CN109840922B

    公开(公告)日:2021-03-02

    申请号:CN201810097816.9

    申请日:2018-01-31

    Abstract: 本发明涉及一种基于双目光场相机的深度获取方法和系统,包括:使用场相机拍摄场景,得到场景的视图和光场深度图;使用另一相机对场景进行拍摄,得到场景的另一视图,并根据视图间的视差,得到场景的双目深度图;使用光场相机拍摄具有深度标尺的标定场景,将光场深度图归一化到真实的空间尺度,得到第一真实深度图;使用光场相机拍摄标定场景,将双目深度图归一化到真实的空间尺度,得到第二真实深度图;使用光场深度变化的梯度值,获取光场深度图中各像素点的可信度;根据可信度和马尔科夫随机场,将第一真实深度图和第二真实深度图相融合,得到融合深度图。本发明通过融合光场深度和双目深度,实现从近到远准确计算场景深度的解决方案。

    基于自动编码器网络的压缩感知测量矩阵优化方法和系统

    公开(公告)号:CN107784676B

    公开(公告)日:2020-06-05

    申请号:CN201710911885.4

    申请日:2017-09-29

    Abstract: 本发明涉及一种基于自动编码器网络的压缩感知测量矩阵优化方法和系统,包括:获取原始图像作为训练数据,通过分割裁剪处理将训练数据分割多个图像块;根据预设的采样率和自动编码器网络对图像块进行采样,生成初步重建图;根据深度残差网络计算初步重建图和原始图像间的残差值;将残差值与初步重建图相融合,生成重建结果,并根据重建图和图像块建立损失函数,通过损失函数对自动编码器网络中的参数矩阵进行训练,最后将训练完成的自动编码器网络参数作为压缩感知测量矩阵。本发明通过自动编码器对数据维度的变换,模拟实现了图像从采集到重建的过程,其中采集过程的参数即为测量矩阵,并且得到的测量矩阵具有很好的重建质量。

    一种有争议性新闻线索自动发现的方法及系统

    公开(公告)号:CN106372083B

    公开(公告)日:2019-10-18

    申请号:CN201510435105.4

    申请日:2015-07-22

    Abstract: 本发明公开了一种有争议性新闻线索自动发现的方法及系统,该方法包括:步骤1,利用预设的初始文本对一文本集进行检索,获得多个检索文本;步骤2,对该多个检索文本进行聚类,对每一类的检索文本分别执行摘要提取算法,以获得该类的线索文本;步骤3,利用每类的该线索文本进行检索,获得每类的多个扩充文本;步骤4,利用每类的该多个扩充文本进行特征提取,基于一预设的打分模型对提取得到的每类的特征进行打分,分数高于一阈值的类所对应的线索文本为有争议的新闻线索。本发明可从大量文本中自动发现有争议新闻线索,实现了海量信息的深层信息挖掘,且可不断完善信息挖掘的准确度、有效性。

Patent Agency Ranking