基于多分支自编码对抗网络的高效目标跟踪方法

    公开(公告)号:CN110189362A

    公开(公告)日:2019-08-30

    申请号:CN201910452361.2

    申请日:2019-05-28

    Applicant: 厦门大学

    Abstract: 基于多分支自编码对抗网络的高效目标跟踪方法。在有标记的离线目标跟踪数据集中收集大量目标模板和包含有目标的搜索区域样本对;使用均方误差损失,通过全监督的方式对所提出的目标概率生成器进行初步训练;引入判别器,加入对抗训练的方式共同优化目标概率生成器和判别器;给定测试视频中的第一帧,采样其标注的目标区域作为初始目标模板;给定测试帧,以当前目标长宽的N倍大小的窗口进行随机的位移来得到搜索区域;将搜索区域和目标模板输入目标概率生成器,输出得到目标概率图,选取目标概率图中最大值点的位置作为目标中心;根据目标概率图分布估计目标在当前帧的尺度;根据当前帧估计的目标区域进行目标模板更新。

    基于局部特征共生性和偏最小二乘法的行人检测方法

    公开(公告)号:CN105975921B

    公开(公告)日:2019-06-07

    申请号:CN201610279313.4

    申请日:2016-04-29

    Applicant: 厦门大学

    Abstract: 基于局部特征共生性和偏最小二乘法的行人检测方法,涉及计算机视觉技术。包括以下步骤:准备训练样本集,将训练样本的特征向量组合作为预测矩阵X,将训练样本的类别组合作为响应矩阵y;利用偏最小二乘法对预测和响应矩阵建立模型,求得权重矩阵W;根据权重矩阵W计算分数较高的特征作为候选特征,用于生成局部特征共生性;对局部图像块中的候选特征进行二值化并组合成局部特征共生性的二值化模式;计算二值化模式的概率分布,将其用于训练基于Boosted决策树的行人检测分类器;输入待检测图像,通过得到的分类器在待检测图像中找出分数较高的目标窗口作为可能的行人物体,完成检测。

    一种基于生成式对抗网络的人脸表情识别方法

    公开(公告)号:CN109508669A

    公开(公告)日:2019-03-22

    申请号:CN201811332661.9

    申请日:2018-11-09

    Applicant: 厦门大学

    Inventor: 严严 黄颖 王菡子

    Abstract: 一种基于生成式对抗网络的人脸表情识别方法,涉及计算机视觉技术。首先设计一个基于生成式对抗网络的人脸表情生成网络并对其预训练,该网络由一个生成器和两个判别器构成,能够生成指定表情的随机身份的人脸图;然后设计一个人脸表情识别网络,该网络在训练时同时接收训练集中的真实人脸表情图以及由人脸表情生成网络产生的随机人脸表情图,使用一种类内损失来减少真实样本和生成样本之间的人脸表情特征差异性;同时还使用一种真实样本导向的梯度更新方法来促进生成样本的特征学习;最后根据训练好的人脸表情识别网络模型,从模型最后的柔性最大分类层得到最终的人脸表情识别结果。

    一种基于多任务卷积神经网络的人脸表情识别方法

    公开(公告)号:CN108764207A

    公开(公告)日:2018-11-06

    申请号:CN201810582457.6

    申请日:2018-06-07

    Applicant: 厦门大学

    Inventor: 严严 黄颖 王菡子

    CPC classification number: G06K9/00315 G06N3/0454

    Abstract: 一种基于多任务卷积神经网络的人脸表情识别方法,首先设计多任务卷积神经网络结构,在网络中依次提取所有表情共享的低层语义特征和多个单表情判别性特征;然后采用多任务学习,同时学习多个单表情判别性特征学习任务以及多表情识别任务,使用一种联合损失来监督网络的所有任务,并且使用两种损失权重来平衡网络的损失;最后根据训练好的网络模型,从模型最后的柔性最大分类层得到最终的人脸表情识别结果。将特征提取与表情分类放在一个端到端的框架中进行学习,从输入图片中提取出判别性特征,对输入图片做出可靠地表情识别。通过实验分析可知,本算法性能卓越,可有效地区分复杂的人脸表情,在多个公开的数据集上都取得了良好的识别性能。

    一种基于超像素的确定性模型拟合方法

    公开(公告)号:CN105913423B

    公开(公告)日:2018-08-07

    申请号:CN201610214978.7

    申请日:2016-04-08

    Applicant: 厦门大学

    Abstract: 种基于超像素的确定性模型拟合方法,涉及计算机视觉技术。包括以下步骤:A.准备数据集;B.对图片进行超像素分割;C.通过分析超像素信息,对输入的数据进行预分组,以降低算法搜索时间复杂度;D.在数据集的分组信息基础上,提出种确定性生成假设方法;E.提出种模型选择方法,每次选取最佳模型假设,同时去除多余模型假设;F.根据选取的每个模型实例,区分内点与野点,完成模型拟合。能提取超像素分割的有效信息,以确定性地生成高质量的模型假设。有效避免当前模型选择方法对内点尺度的敏感性。能确定地处理多结构模型数据,而且不需大量的迭代优化,从而保证方法高效性。

    一种基于贝叶斯概率框架的场景文本识别方法

    公开(公告)号:CN103984943B

    公开(公告)日:2018-06-19

    申请号:CN201410238427.5

    申请日:2014-05-30

    Applicant: 厦门大学

    Inventor: 王菡子 王大寒

    Abstract: 一种基于贝叶斯概率框架的场景文本识别方法,涉及计算机视觉和模式识别。步骤S1:输入场景图像文本;步骤S2:字符检测和识别;步骤S3:构建检测‑识别候选网格,具体方法如下:将候选字符区域和对应的字符类别和识别分数保存在一个检测与识别候选网格里,这样候选网格里每一条检测‑识别路径对应一个文本检测和识别结果;设计路径评价函数,对候选网格里的每一条候选检测‑识别路径进行评价;步骤S4:根据路径评价函数,从候选网格中用动态规划算法搜索得到最优检测‑识别路径,即得到识别结果;步骤S5:输出文本识别结果。解决了集成检测与识别的场景文本识别的概率建模和参数学习问题。

    基于结构决策图的鲁棒多模型拟合方法

    公开(公告)号:CN106296747A

    公开(公告)日:2017-01-04

    申请号:CN201610592964.9

    申请日:2016-07-26

    Applicant: 厦门大学

    Inventor: 严严 刘敏 王菡子

    CPC classification number: G06T7/40

    Abstract: 基于结构决策图的鲁棒多模型拟合方法,涉及鲁棒多模型拟合。包括以下步骤:对输入样本数据随机采样产生大量的假设;基于核密度估计和内点尺度对产生的每个假设计算权重分数;根据权重分数的大小,对所有的假设进行排序;基于连续一致性集和皮尔逊积矩相关系数对排序后的每个假设分别计算最短抵达距离;根据权重分数和最短抵达距离构建结构决策图;在结构决策图上确定所有结构对应的结构原型并计算结构数量;根据结构原型进行内点和异常点的划分,输出每个结构对应的模型参数,完成基于结构决策图的鲁棒多模型拟合。通过利用假设的一致性信息来选择结构原型。不涉及过滤或聚类过程,解决可能删除有代表性的假设和忽略较小的结构的问题。

    基于多任务深度学习的人脸属性识别方法

    公开(公告)号:CN106203395A

    公开(公告)日:2016-12-07

    申请号:CN201610591877.1

    申请日:2016-07-26

    Applicant: 厦门大学

    Abstract: 基于多任务深度学习的人脸属性识别方法,涉及计算机视觉中的人脸属性识别。准备图像数据集;对图像数据集中的每幅图像逐一进行人脸检测;对所有检测到的人脸进行人脸关键点检测;对检测到的人脸关键点将每幅人脸根据人脸对齐方法,对齐到标准的人脸图像上,构成人脸图像训练集;计算出训练集中的平均人脸图像;构建多任务深度卷积神经网络,把人脸图像训练集中的每幅人脸图像减去平均人脸图像后进行网络参数的训练,得卷积神经网络模型;将待识别的测试图像进行人脸检测和人脸关键点检测,并根据人脸关键点将图像中的人脸对齐到标准的人脸图像上;将标准的人脸图像减去平均人脸图像,并放到构建好的卷积神经网络模型中进行前馈运算操作,即得。

    一种基于稀疏编码特征的场景文本识别方法

    公开(公告)号:CN103942550A

    公开(公告)日:2014-07-23

    申请号:CN201410184072.6

    申请日:2014-05-04

    Applicant: 厦门大学

    Abstract: 一种基于稀疏编码特征的场景文本识别方法,涉及计算机视觉和模式识别。输入待识别的自然场景文本图像;采用多尺度滑动窗口的方法,用字符分类器对图像中的窗口区域进行检测和识别,对每一个字符类别,将分类器输出较大的区域判定为候选字符区域,输出较小的区域认为是背景区域,这样找出图像中包含的候选字符区域,再采用非极大值抑制方法,对重叠率较大的区域只保留分类器输出值最大的区域和相应的字符类别,除去重复冗余的候选字符区域,得到字符检测结果;将检测到的字符合并成一个词或文本行;输出场景文本识别结果。能够更加有效地表示和提取字符的结构特征,从而提高场景文本的识别率。

    基于语义Hough变换和偏最小二乘法的目标检测方法

    公开(公告)号:CN102831445A

    公开(公告)日:2012-12-19

    申请号:CN201210272631.X

    申请日:2012-08-01

    Applicant: 厦门大学

    Inventor: 王菡子 唐建宇

    Abstract: 基于语义Hough变换和偏最小二乘法的目标检测方法,涉及计算机视觉技术。首先利用训练集建立图像块的特征向量、语义特征向量与图像块类别和投票偏移向量之间的回归模型,然后将待检测图像中的每个图像块的特征向量和语义特征向量代入回归模型,找出类别为正的图像块并产生投票、形成Hough图像,最后在Hough图像中找出投票密度的局部极大值点作为检测结果,完成目标检测。

Patent Agency Ranking