基于卷积神经网络和空间金字塔匹配的图像排序模型

    公开(公告)号:CN105718960B

    公开(公告)日:2019-01-04

    申请号:CN201610057640.5

    申请日:2016-01-27

    Inventor: 刘波 陆雅

    Abstract: 基于卷积神经网络和空间金字塔匹配的图像排序模型,结合近似最近邻匹配算法和类似的SPM算法作为图像之间相似性的度量。该模型包括卷积神经网络、近似最近邻匹配算法、类似空间金字塔匹配算法的应用。图像块的特征没有类别的划分,而是对利用快速最近邻查找算法找到的匹配的图像块的数量进行计数作为不同分辨率下的不同匹配数的度量,最后对这些不同分辨率下的不同匹配数加权求和作为两幅图像相似性的度量。将训练好的卷积神经网络提取的图像块的特征在同一个训练集上用三种相似性度量方法进行了测试;利用卷积神经网络提取图像块的特征得到特征向量集,利用最近邻匹配算法同时考虑空间信息的方法对图像之间相似性的度量有一定的研究价值。

    一种基于卷积神经网络的动作检测模型

    公开(公告)号:CN106650655A

    公开(公告)日:2017-05-10

    申请号:CN201611168185.2

    申请日:2016-12-16

    Inventor: 刘波 贾川川

    Abstract: 一种基于卷积神经网络的动作检测模型,属于计算机视觉研究领域,通过运用深度学习中卷积神经网络的方法构建一个高效的动作检测模型,实现从视频中识别动作并对动作进行检测定位。动作检测模型由Faster RCNN、SVM分类器和动作管道组成。动作检测模型的每个部分分别完成相应工作。Faster RCNN对每帧图片获取多个兴趣区域,并对每个兴趣区域提取特征。本检测模型提取特征采用双通道模型,即基于帧图的Faster RCNN通道和基于光流图的Faster RCNN通道,他们分别提取表观特征和动作特征。然后将这两种特征融合形成时空域特征,把时空域特征输入到SVM分类器中,经SVM分类给出相应区域的动作类别预测值。最后由动作管道从视频角度出发给出最终的动作检测结果。

    一种用线性判别函数设计凸可分分类器的方法

    公开(公告)号:CN101655926A

    公开(公告)日:2010-02-24

    申请号:CN200910092168.9

    申请日:2009-09-01

    Abstract: 本发明公开了一种用线性判别函数设计凸可分分类器的方法,依次包括以下步骤:输入两类数据向量样本集合X和Y;计算X中的每个点到Y的凸包的最近点,Y中的每个点到X的凸包的最近点,X关于Y的凸距离,Y关于X的凸距离,X和Y的凸距离以及X和Y的最佳凸可分方向;在区间(0,1]中选择参数γ,并根据X和Y的最佳凸可分方向,构造一组线性判别函数设计X和Y的凸可分分类器;本发明在解决凸可分分类问题时,不需要选择核函数,也不需要求解二次规划问题,编程实现容易,运行效率较高,泛化能力较强,而且能够明确判定两类数据向量样本集合是凸可分。

    一种基于网络增长和逼近论的图像分类方法

    公开(公告)号:CN114565796B

    公开(公告)日:2024-06-14

    申请号:CN202210202362.3

    申请日:2022-03-03

    Inventor: 刘波 张翔宇

    Abstract: 本发明涉及一种基于网络增长和逼近论的图像分类方法,属于深度学习领域。使用神经网络对图像分类时,由于网络学习能力和数据集噪声等影响,在图像数据集的样本空间某些区域必然存在误差。本发明从该问题出发,利用逼近论的思想,对每个存在误差的区域使用本发明设计的自适应网络补偿误差,通过增加整体网络规模将样本空间所有误差区域的误差均下降到0。每个增加的自适应网络根据输入图像大小、通道数和样本空间划分数按照预先设计的神经元单元堆叠形成。本方法和逼近论结合,适用于动态变化的数据集,通过网络增长不断学习图像数据集特征,迭代减小分类误差,提高图像数据集分类正确率,减少参数训练次数,加快图像分类速度。

    一种单隐层ReLU神经网络局部极小值的求解方法

    公开(公告)号:CN112926727B

    公开(公告)日:2024-02-27

    申请号:CN202110187212.5

    申请日:2021-02-10

    Inventor: 刘波 孙雄飞

    Abstract: 一种单隐层ReLU神经网络局部极小值求解方法,属于深度学习理论领域,用于解决ReLU神经网络优化的不确定性的问题,包括构建单隐层ReLU神经网络;利用输入样本和ReLU激活函数的特性进行权值空间区域度划分,并计算每个区域权值和每个样本的点积是否大于0;根据每个区域的权值和样本点积的情况计算每个区域的局部极小值;根据局部极小值的解的情况判断局部极小值的真实性,对于唯一的局部极小值可以直接判断是否与初始化定义区域内的任何点都在每个输入样本的同一侧,对于连续的解可以判断这个连续的解是否在它所定义的区间内,判定的方法是求半平面的交是否为空,对于半平面求交的问题可以转化成凸包问题方便求解。

    一种基于泛化界的神经网络架构搜索方法

    公开(公告)号:CN116721327A

    公开(公告)日:2023-09-08

    申请号:CN202310171264.2

    申请日:2023-02-28

    Inventor: 刘波 张思成

    Abstract: 本发明公开了一种基于泛化界的神经网络架构搜索方法,属于人工智能领域,具体属于深度神经网络架构搜索领域。现有的神经网络架构搜索技术搜索过程代价巨大,需要过多的计算资源并且搜索时间过长,本发明从预测的角度出发,提出了一种将候选网络架构的泛化误差上界作为评价值对网络架构进行比较的方法。方法包括:确定图像处理任务,并确定对图像处理任务选定图像处理的神经网络搜索空间;采样目标候选空间中的网络架构,验证选取评价值的正确性;根据评价指标进行网络架构搜索,得到最优架构;针对最优架构构建完整神经网络架构模型并进行训练,完成图像分类任务。本发明可以在满足一定分类准确度的前提下降低神经网络架构搜索的耗时。

    基于网络剪枝和知识蒸馏的垃圾分类识别方法

    公开(公告)号:CN116310526A

    公开(公告)日:2023-06-23

    申请号:CN202310199855.0

    申请日:2023-03-05

    Abstract: 基于网络剪枝和知识蒸馏的垃圾分类图像识别方法属于计算机视觉领域,研究针对日常光照下固定角度摄像头采用定时截取视频帧的垃圾分类识别方法。首先利用卷积神经网络构建直连型的图像分类模型。其次使用剪枝标准对网络进行剪枝。该剪枝标准关注通道预剪枝后的特征图与原特征图的相似度,并使用二范式规范化特征图尺寸的影响,从而能够实现基于剪枝标准的跨层自动化剪枝。最后使用知识蒸馏弥补过剪枝导致的精度下降,将原网络的知识迁移到剪枝后的网络。采用本发明构建的分类器在不损失网络精度的情况下,模型计算资源消耗减少77%,硬盘空间占比减少50%,识别精度可达94.4%。

    现场指纹的特征点提取和匹配的方法

    公开(公告)号:CN114332960A

    公开(公告)日:2022-04-12

    申请号:CN202111683766.0

    申请日:2021-12-29

    Inventor: 刘波 郝婧煜

    Abstract: 本发明涉及一种现场指纹的特征点提取和匹配的方法,用于提高指纹识别率和减少人工劳动成本。主要包括使用深度神经网络进行指纹图像预处理、在提取指纹特征时提出使用Split Bregman算法求解滤波器组构建要满足的约束问题,将用于训练的指纹数据库作为该算法输入来训练具有稀疏性的滤波器组,把预处理后的指纹图像应用在该滤波器组上能够得到该指纹图像的特征点、将指纹图像与已知指纹图像的数据库进行匹配。将本发明提出的方法在不同的指纹数据集上进行实验验证,实验结果显示本发明所提出的方法对于低质量的现场指纹图片有一定效果。

    通过划分网络空间计算单隐层ReLU神经网络全局最优解的图像分类方法

    公开(公告)号:CN112819086A

    公开(公告)日:2021-05-18

    申请号:CN202110184449.8

    申请日:2021-02-10

    Inventor: 刘波 包文强

    Abstract: 通过划分网络空间计算单隐层ReLU神经网络全局最优解的图像分类方法属于深度学习领域。对神经网络最优解的计算,考虑梯度下降等方法在优化神经网络时容易陷入到局部最优,存在优化失败可能性的问题,本发明使用一种由ReLU函数非光滑的性质使得通过该函数是否激活的若干个样本点可以将神经网络的神经元权值空间划分为若干个可微区间的方法来精准地求解神经网络的全局最优解。通过计算每个区间中的损失函数值,来确定权值空间的全局最优解。随着样本的增多,由样本划分的权值空间的数量也随之增加,加重了实验的复杂度。发明引入了局部敏感哈希原理对数据集进行优化筛选,从而降低了神经网络空间中区间的数量,提高了算法的执行效率。

    一种基于卷积神经网络的Kinect深度图修复方法

    公开(公告)号:CN109978786B

    公开(公告)日:2020-09-25

    申请号:CN201910220680.0

    申请日:2019-03-22

    Inventor: 刘波 赵建英

    Abstract: 本发明涉及一种基于卷积神经网络的Kinect深度图修复方法,用于解决Kinect的深度图存在大面积空洞的问题,包括模型训练和深度图修复两个阶段。模型训练阶段构建了一个输入RGB图,输出深度图的单目深度估计模型,使用屏蔽掉空洞的Kinect深度图作为监督信息,训练出一个单目深度估计模型。修复阶段是把深度图对应的RGB图输入模型得到估计的深度图,并使用它填充原始深度图中的空洞,最后进行中值滤波得到最终修复结果。本方法在修复大面积的空洞的时候优势明显,本方法用“深度”补“深度”的解决思路决定了修复精度主要取决于深度估计模型本身的精度,这里如果换用其它效果更好的深度估计模型会达到更好的效果。

Patent Agency Ranking