协变局部特征聚集的图像特征表示法

    公开(公告)号:CN105335500A

    公开(公告)日:2016-02-17

    申请号:CN201510710221.2

    申请日:2015-10-28

    Applicant: 厦门大学

    Inventor: 赵万磊 王菡子

    Abstract: 协变局部特征聚集的图像特征表示法,涉及计算机视觉与多媒体信息检索。提取图像局部特征;离线训练一个小的视觉词汇集合;将每幅图的局部特征用简化的费舍尔核方法进行聚集;聚集时,同时考虑每个局部特征的主方向信息,将主方向分为8个量化区间,根据量化后的主方向值,聚集到不同的费舍尔子向量,8个子向量拼接为一个长向量,作为图像的特征表示;将8个费舍尔子向量重组得一系列8维的子向量。对每个子向量进行一维离散余弦变换,变换到该特征的频率域;再对频率域的特征重组,得不同频段的8个子向量,对每个子向量做主成分分析,再对降维后的8个子向量重组得一系列8维的子向量;在子向量上定义相似度度量,以计算图像两两间的相似度。

    基于超图模式搜索的鲁棒模型拟合方法

    公开(公告)号:CN104835174A

    公开(公告)日:2015-08-12

    申请号:CN201510269932.0

    申请日:2015-05-25

    Applicant: 厦门大学

    CPC classification number: G06T7/162 G06T7/174 G06T2207/20072

    Abstract: 基于超图模式搜索的鲁棒模型拟合方法,涉及计算机视觉技术。准备数据集;建立超图模型G=(V,E),一个模型假设对应于超图中的一个顶点v,数据点则对应一条超边e:让每个顶点连接相应模型假设的内点,即超边;采用无参核密度估计方法评估每个顶点v的权重分数w(v),自此,模型拟合问题便转化为在超图中模式搜索问题;提出通过在超图中搜索权重波峰进行模式搜索;通过搜索到的模式和超图模型,确定每个结构的内点和参数;根据每个结构的参数和内点,对图像进行分割,完成模型拟合。能够缓解对数据分布的敏感性,建立的超图不需要任何的转化,可以直接被应用于模式搜索。

    基于拉格朗日对偶的半正定谱聚类方法

    公开(公告)号:CN102982342B

    公开(公告)日:2015-07-15

    申请号:CN201210445602.9

    申请日:2012-11-08

    Applicant: 厦门大学

    Abstract: 基于拉格朗日对偶的半正定谱聚类方法,涉及一种谱聚类方法。A.对给定样本数据集采用主成分分析进行降维;B.基于全向连接图的方法构造样本数据集的相似度矩阵,并采用基于高斯核函数和多项式核函数的加权和方法来计算样本数据对之间的相似度;C.基于拉格朗日对偶性质对相似度矩阵进行半正定归一化求解;D.对归一化矩阵进行奇异值分解,得到前k个最大特征值对应的特征向量组成的矩阵;E.利用传统的k均值聚类或者其他聚类方法对特征向量矩阵进行聚类分析得到最终的聚类结果。可对各类数据进行有效地聚类,通过对算法分析可知,相对于常规的半正定谱聚类求解算法,不仅可提高谱聚类的精度,而且可极大降低谱聚类所需的时间。

    一种基于贝叶斯概率框架的场景文本识别方法

    公开(公告)号:CN103984943A

    公开(公告)日:2014-08-13

    申请号:CN201410238427.5

    申请日:2014-05-30

    Applicant: 厦门大学

    Inventor: 王菡子 王大寒

    Abstract: 一种基于贝叶斯概率框架的场景文本识别方法,涉及计算机视觉和模式识别。步骤S1:输入场景图像文本;步骤S2:字符检测和识别;步骤S3:构建检测-识别候选网格,具体方法如下:将候选字符区域和对应的字符类别和识别分数保存在一个检测与识别候选网格里,这样候选网格里每一条检测-识别路径对应一个文本检测和识别结果;设计路径评价函数,对候选网格里的每一条候选检测-识别路径进行评价;步骤S4:根据路径评价函数,从候选网格中用动态规划算法搜索得到最优检测-识别路径,即得到识别结果;步骤S5:输出文本识别结果。解决了集成检测与识别的场景文本识别的概率建模和参数学习问题。

    基于拉格朗日对偶的半正定谱聚类方法

    公开(公告)号:CN102982342A

    公开(公告)日:2013-03-20

    申请号:CN201210445602.9

    申请日:2012-11-08

    Applicant: 厦门大学

    Abstract: 基于拉格朗日对偶的半正定谱聚类方法,涉及一种谱聚类方法。A.对给定样本数据集采用主成分分析进行降维;B.基于全向连接图的方法构造样本数据集的相似度矩阵,并采用基于高斯核函数和多项式核函数的加权和方法来计算样本数据对之间的相似度;C.基于拉格朗日对偶性质对相似度矩阵进行半正定归一化求解;D.对归一化矩阵进行奇异值分解,得到前k个最大特征值对应的特征向量组成的矩阵;E.利用传统的k均值聚类或者其他聚类方法对特征向量矩阵进行聚类分析得到最终的聚类结果。可对各类数据进行有效地聚类,通过对算法分析可知,相对于常规的半正定谱聚类求解算法,不仅可提高谱聚类的精度,而且可极大降低谱聚类所需的时间。

    一种基于双重净化动态图网络的鲁棒模型拟合方法

    公开(公告)号:CN119963847A

    公开(公告)日:2025-05-09

    申请号:CN202510150715.3

    申请日:2025-02-11

    Applicant: 厦门大学

    Abstract: 一种基于双重净化动态图网络的鲁棒模型拟合方法,涉及计算机视觉技术领域。针对含噪声与离群点的数据集,通过尺度不变特征变换生成初始对应集,并引入动态图网络进行处理。提出一种双重动态净化模块,包括区域通道偏好块和整体空间一致块,分别从局部与全局视角实现逐步采样和离群点剔除,获取净化后的候选对应集及内点概率集。区域通道偏好块通过偏好注意力机制强化局部特征,整体空间一致块通过一致注意力机制捕获长程依赖关系。利用净化后的候选对应集拟合模型参数,并结合内点概率集计算模型估计损失与点分类损失。充分利用动态图网络特性与偏好一致策略,在抗噪性和拟合精度方面显著优于现有技术。

    一种基于时空场景连通图的开放词汇多目标跟踪方法

    公开(公告)号:CN119963605A

    公开(公告)日:2025-05-09

    申请号:CN202510150262.4

    申请日:2025-02-11

    Applicant: 厦门大学

    Abstract: 一种基于时空场景连通图的开放词汇多目标跟踪方法,涉及计算机视觉技术。A.给定训练数据集,包含视频序列和对象的相关状态信息。B.将视频帧序列输入预训练的检测器,提取视频帧的特征,并生成每帧中的对象候选框。C.根据生成的候选框,从全局特征图中利用ROI池化操作提取每个候选框对应的局部特征。D.将提取的ROI区域特征输入解码器,通过多头自注意力提取目标间的各种关系。E.将获得的关键帧与参考帧的关系输入连接头,得到关联预测结果,产生图关联损失。F.将关键帧与参考帧中经过解码器处理的ROI特征计算外观相似度,得到关联预测,得到外观关联损失与步骤E产生的图关联损失共同组成网络的损失函数。提升跟踪性能。

    点监督X射线违禁品检测的域内-域间对象性学习方法

    公开(公告)号:CN119090818A

    公开(公告)日:2024-12-06

    申请号:CN202411089623.0

    申请日:2024-08-09

    Applicant: 厦门大学

    Abstract: 本发明公开了点监督X射线违禁品检测的域内‑域间对象性学习方法,本方案通过域内‑域间对象性模块在点监督下进行X射线违禁物品检测,该方案由域内对象性学习模块和域间对象性性学习模块两个关键模块组成;域内对象性学习模块设计了局部焦点高斯掩蔽块和全局随机高斯掩蔽块,共同学习X射线图片中的对象性。域间对象性学习模块引入了基于小波分解的对抗学习块和对象性块,有效减少了模态差异,并将从带有实例级标注的自然图片中学到的对象性知识迁移到了X射线图片中。本方案缓解了X射线图片中由严重类内变化引起的局部主导的问题。在四个X射线数据集上的实验结果显示,本发明在显著降低注释成本的同时实现了卓越性能,提高了其实用性。

    基于自步协同学习框架的小样本人脸表情识别方法及介质

    公开(公告)号:CN118968580A

    公开(公告)日:2024-11-15

    申请号:CN202410920453.X

    申请日:2024-07-10

    Abstract: 本发明公开了基于自步协同学习框架的小样本人脸表情识别方法及介质,包括:获取基本类表情数据集和复合类表情数据集;建立自步协同学习网络,包括混合专家卷积层和分类模型;对不同混合专家卷积层的通道数进行缩放;混合专家卷积层在欧式空间中进行表情特征嵌入学习;基于专家模型构建教师模型和学生模型,得到对应的表情特征;将教师模型和学生模型获取的表情特征从欧式空间映射到双曲空间,对自步协同学习网络进行表情特征嵌入学习;使用分类模型对表情特征进行分类,完成最终的训练;将复合类表情数据集输入训练好的自步协同学习网络进行表情分类计算,输出分类结果,识别不同表情。本发明有效提高了表情识别准确度。

    一种基于边缘指导运动信息提升网络的小样本行为识别方法

    公开(公告)号:CN118658199A

    公开(公告)日:2024-09-17

    申请号:CN202410686731.X

    申请日:2024-05-30

    Abstract: 一种基于边缘指导运动信息提升网络的小样本行为识别方法,涉及计算机视觉技术。A.给定视频数据集,将每个视频随机抽取T帧构成新的视频帧序列。B.视频帧序列输入特征提取器获得视频帧特征。同时,将采样后的视频帧序列输入边缘信息提取器获得边缘信息特征。C.将步骤B生成的视频帧特征和边缘信息特征分别输入运动信息提升模块,获得提升后的视频帧特征和提升后的边缘信息特征。D.将步骤C提升后的两种特征融合,输入预测器得到类别预测结果,产生类别损失。E.将步骤C提升后的边缘信息特征输入预测器,得边缘损失,与步骤D产生的类别损失共同组成网络的损失函数。与当前主流的小样本行为识别方法相比,分类性能有所提升。

Patent Agency Ranking