-
公开(公告)号:CN108647595B
公开(公告)日:2021-08-03
申请号:CN201810389331.7
申请日:2018-04-26
Applicant: 华中科技大学
Abstract: 本发明公开了一种基于多属性深度特征的车辆重识别方法,包括:利用特征提取模型提取第A个池化层的测试图片集的深度特征,利用测试图片集的深度特征和W矩阵,得到查找集中的测试图片的深度特征与候选集中的目标图片的深度特征之间的马氏距离,按照马氏距离从小到大排序,得到测试图片与目标图片的相似度排序结果;所述测试图片集包括查找集与搜索集,所述测试图片集为包含车辆的图片;所述特征提取模型的训练包括:在GoogLeNet的第A个池化层后接入车辆多属性分类器,得到改进GoogLeNet,利用训练图片训练改进GoogLeNet,得到特征提取模型。本发明简化了模型训练过程,大大提高了重识别准确率,模型泛化性能很强。
-
公开(公告)号:CN110826424B
公开(公告)日:2021-07-27
申请号:CN201910998178.2
申请日:2019-10-21
Applicant: 华中科技大学
Abstract: 本发明公开了一种基于行人重识别驱动定位调整的行人搜索方法,属于计算机视觉技术领域,本发明通过设计感兴趣转换模块有效实现行人检测网络和行人重识别的联合优化;一方面,感兴趣转换模块将原始输入图像转换为感兴趣区域对应的小图,避免行人重识别网络和检测网络共享部分特征存在的矛盾;另一方面,行人重识别网络的损失可通过感兴趣区域转换模块梯度回传至检测网络,实现行人重识别网络损失对检测网络输出检测框的监督,调整后的检测框可以有效去除背景干扰,并且会包含更多有用的属性信息,更适合用于行人搜索,从而大大提升了行人搜索的准确率。
-
公开(公告)号:CN108647577B
公开(公告)日:2021-04-20
申请号:CN201810323425.4
申请日:2018-04-10
Applicant: 华中科技大学
Abstract: 本发明公开了一种自适应难例挖掘的行人重识别模型、方法与系统,其中,识别方法包括:将样本图片随机分成每次迭代使用的训练集合,将训练集合输入卷积神经网络,利用softmax函数得到每个样本对属于正、负样本对的概率,进而利用多项逻辑斯蒂函数得到每个样本对的损失;利用每个样本对的损失获取难例样本对;利用难例样本对训练卷积神经网络,直到当前迭代次数达到迭代次数上限,得到行人重识别模型。利用行人重识别模型提取待识别图片集的中每个图片的特征,进而得到待识别图片集中样本对的相似度排序。本发明不存在过拟合、欠拟合、且识别准确率高。
-
公开(公告)号:CN109671070B
公开(公告)日:2021-02-09
申请号:CN201811538214.9
申请日:2018-12-16
Applicant: 华中科技大学
Abstract: 本发明公开了一种基于特征加权和特征相关性融合的目标检测方法,该方法包括:从特征金字塔网络中较高层的感受野的特征中提取融合权重;将融合权重作用于高层感受野特征后再与低层感受野特征融合;计算特征金字塔网络中前三层特征图的特征相关性;将特征金字塔网络中相邻特征层中较高层感受野特征的相关性与较低层感受野特征的相关性进行进一步融合;将融合得到的相关性作用于特征金字塔网络中相应层级的特征图,以由改进后的特征金字塔网络进行目标检测。通过本发明可以提高特征金字塔网络对不同尺度的物体的检测和识别精度。
-
公开(公告)号:CN110175615B
公开(公告)日:2021-01-01
申请号:CN201910350741.5
申请日:2019-04-28
Applicant: 华中科技大学
Abstract: 本发明公开了一种模型训练方法、域自适应的视觉位置识别方法及装置,属于计算机视觉技术领域,包括:建立基于深度神经网络的图像特征提取模型;根据标准数据集构建训练集,训练集中每个训练样本包括目标图像及其正样本和s个负样本;利用训练集对图像特征提取模型进行训练;图像特征提取模型中,特征提取网络包括级联的多个第一网络;第一网络由一个或多个第二网络以及一个极大池化层依次连接而成,极大池化层用于特征选择;第二网络包括依次连接的卷积层,用于特征提取;批标准化层,用于进行零均值标准化处理;激活函数层,用于进行激活处理;局部特征聚合网络用于聚合局部特征以得到图像的特征向量。本发明能够提高视觉位置识别的鲁棒性。
-
公开(公告)号:CN110009665B
公开(公告)日:2020-12-29
申请号:CN201910182645.4
申请日:2019-03-12
Applicant: 华中科技大学
Abstract: 本发明公开了一种遮挡环境下的目标检测跟踪方法,包括:获取跟踪视频序列,并在搜索区域内提取所述跟踪视频序列中当前帧图像的前景区域;当前帧图像为第一帧图像时根据第一帧图像获得目标的滤波检测系数和搜索区域内前景区域与背景区域的灰度,当前帧图像不是第一帧图像时,根据前景区域与背景区域的灰度计算搜索区域中各个像素点作为目标的概率,以及滤波检测系数获得目标的最终位置;本发明使用灰度特征与梯度方向直方图的特征共同确定目标所在位置,控制检测模板的更新频率从而解决部分遮挡和严重遮挡情况下的跟踪问题,提高目标跟踪的准确性和鲁棒性。可以改善严重遮挡情况下目标跟踪效果,提高跟踪可靠性。
-
公开(公告)号:CN110175670B
公开(公告)日:2020-12-08
申请号:CN201910280748.4
申请日:2019-04-09
Applicant: 华中科技大学
Abstract: 本发明公开了一种基于FPGA实现YOLOv2检测网络的方法及系统,属于智能硬件领域。本发明对检测网络每一层的输入特征图和权重参数进行分块处理,根据FPGA的计算资源和片上存储的大小来选择分块大小。通过分批读取参数并进行计算,将中间结果缓存在片上存储上,等该层的最终结果计算完之后,将其写回到DRAM中,解决片上资源和内存带宽限制不能对整层进行计算的缺陷。针对FPGA片上内存不足以存储模型参数,本发明使用了双缓冲机制并且在不同的层之间引入了流水线操作,减少每次从DRAM读取模型参数带来的时延,在大大节省所需的缓存空间的同时也可以提高算法的前向推断速度,实现输入数据流的无缝缓冲以及处理,最大程度上利用内存空间的同时充分利用率逻辑资源。
-
公开(公告)号:CN111985542A
公开(公告)日:2020-11-24
申请号:CN202010778717.4
申请日:2020-08-05
Applicant: 华中科技大学
Abstract: 本发明公开了一种代表性图结构模型、视觉理解模型的建立方法及应用,属于视觉理解领域,包括:建立代表性图结构模型;代表性图结构模型包括:特征映射模块,用于从输入特征图像中提取值分支、键值分支和序列分支,并生成偏移矩阵;采样模块,用于根据偏移矩阵对值分支和键值分支中的节点(像素或图像栅格)采样,得到代表性特征;长距离依赖信息捕获模块,用于对键值分支的代表性特征与序列分支进行矩阵乘法后进行Softmax操作,得到关系矩阵,并对值分支的代表性特征与关系矩阵进行矩阵乘法,得到长距离依赖矩阵;以及特征反映射模块,用于将长距离依赖信息编码到输入特征图像中。本发明能够学习到更精炼的长距离依赖信息,提高视觉理解任务的准确度。
-
公开(公告)号:CN110738146B
公开(公告)日:2020-11-17
申请号:CN201910925813.4
申请日:2019-09-27
Applicant: 华中科技大学
Abstract: 本发明提供一种目标重识别深度神经网络及其构建方法和应用,方法包括:构建深度神经网络,其包括多分支注意力机制网络;采用深度神经网络,提取训练集中每个图像样本的融合特征并采集各分支提取的该图像样本的分支特征;基于所有融合特征和分支特征,采用多种损失函数和正则项约束,调整深度神经网络参数并重复提取特征,完成网络构建;其中,正则项约束用于约束各分支间的空间注意力互补性和特征空间互补性。本发明在卷积神经网络中引入多分支的注意力机制,并通过正则项约束,用于约束各分支间的空间注意力互补性和特征空间互补性,增强各分支之间特征提取的互补性和多样性,有效提高目标重识别的精确度。
-
公开(公告)号:CN109101930B
公开(公告)日:2020-08-18
申请号:CN201810943881.9
申请日:2018-08-18
Applicant: 华中科技大学
Abstract: 本发明公开了一种基于尺度金字塔神经网络的人群计数方法及系统,其中的尺度金字塔神经网络结构以VGG‑16为基本骨架,在高层嵌入尺度金字塔模块提取多尺度高层特征,其中的尺度金字塔模块由四个扩张率不同的空洞卷积平行组成。输入图片到网络,经过一系列卷积后得到高层特征并传递给尺度金字塔模块,产生四种特征图,这四种特征图与输入该模块的特征图在“通道”维度串联,传递给接下来的卷积层,最终通过1×1的卷积得到密度图。本发明方式相比于现有技术具有更高效、更准确、更简单的网络结构,并能将处理多尺度问题的模块应用于深网络中。
-
-
-
-
-
-
-
-
-