-
公开(公告)号:CN114663880A
公开(公告)日:2022-06-24
申请号:CN202210253116.0
申请日:2022-03-15
Applicant: 北京交通大学
Abstract: 本发明提供了一种基于多层级跨模态自注意力机制的三维目标检测方法。该方法包括利用RGB图像数据构建训练集与测试集;构建三维目标检测模型,该三维目标检测模型包含RGB主干网络、深度主干网络、分类器与回归器;利用训练集与测试集数据训练所述三维目标检测模型,并利用测试集验证训练效果,得到训练好的三维目标检测模型;利用训练得到的模型对RGB图像中的三维目标进行检测。本发明方法从深度特征图中获取全局场景范围内的深度结构信息,与外观信息有机结合以提升三维目标检测算法的准确性,从而有效地对二维RGB图像中的三维物体进行类别、位置、尺寸和姿态等信息的检测。
-
公开(公告)号:CN114140826A
公开(公告)日:2022-03-04
申请号:CN202111468443.X
申请日:2021-12-03
Applicant: 北京交通大学
Abstract: 本发明提供了一种基于相机特征分离的目标重识别方法,包括如下步骤:步骤1:对数据进行预处理;步骤2:通过编码器提取样本特征,基于特征聚类生成伪标签;步骤3:基于注意力模块分离Feature Map;步骤4:向前传播得到目标和相机分类结果;步骤5:计算损失函数;步骤6:对模型进行优化计算;步骤7:得到测试模型的效果;步骤8:得到无监督目标重识别的解决方案;本申请相比于现有的消除相机影响的无监督目标重识别方法,用注意力模块直接分离相机特征更加直接,比二阶段方法更加简单;基于类别下相机中心的四元中心损失可以避免基于样本的度量损失的训练过程不稳定的现象。
-
公开(公告)号:CN114140469A
公开(公告)日:2022-03-04
申请号:CN202111462219.X
申请日:2021-12-02
Applicant: 北京交通大学
Abstract: 本发明提供了一种基于多层注意力的深度分层图像语义分割方法。该方法包括:构建图像语义分割模型,对训练图像进行预处理,得到包括训练图像的特征图的分割图像;通过图像语义分割模型使用多个不同大小的池化核对特征图进行池化处理,使用注意力函数对每一池化核层处理后得到的特征图进行注意力的计算,利用添加权重的交叉熵损失函数计算损失,使用损失进行梯度反向传播,得到训练好的图像语义分割模型;利用训练好的图像语义分割模型进行待分割的图像的语义分割处理。本发明图像语义分割模型在分层网络中添加了注意力机制,获得了全局的上下文信息,抑制无用的噪声。使用加权的交叉熵损失函数,使每个神经元获得到全局的上下文信息。
-
公开(公告)号:CN112396027A
公开(公告)日:2021-02-23
申请号:CN202011384258.8
申请日:2020-12-01
Applicant: 北京交通大学
Abstract: 本发明提供了一种基于图卷积神经网络的车辆重识别方法。包括:构建用于车辆重识别的网络模型,使用卷积神经网络提取待重识别的车辆图像的全局和局部特征,利用图卷积神经网络得到结构化特征,利用结构化特征计算网络模型的损失函数;根据损失函数训练网络模型,将待重识别的车辆图像和测试集的所有图像输入到训练好的网络模型中,分别得到待测图片和测试集的所有图像的图片特征,根据图片特征计算出待测图片和测试集的各个图像之间的相似性,根据相似性得到待重识别的车辆图像的重识别结果。本发明通过使用图卷积神经网络挖掘局部特征与局部特征、局部特征与全局特征之间的结构化信息,从而获得更优更全面的特征表达,提高了车辆重识别的精度。
-
公开(公告)号:CN112116626A
公开(公告)日:2020-12-22
申请号:CN202010773674.0
申请日:2020-08-04
Applicant: 北京交通大学
Abstract: 本发明实施例提供了一种基于柔性卷积的单目标跟踪方法,构建柔性卷积网络模型,所述柔性卷积网络模型包括共享层和特定域层,利用数据集对所述柔性卷积网络模型进行训练,所述方法包括:S1、获取原始视频序列,进行预处理;S2、将预处理后的视频序列输入柔性卷积网络模型,所述共享层通过卷积操作获取目标的共享特征,将共享特征输入特定域层进行目标与背景的二分类,然后再进行柔性RoI池化选择候选目标区域,并利用损失函数提高候选目标区域的精度,从而实现单目标跟踪。本发明实施例利用了基于柔性卷积的单目标跟踪方法,有效的改善了单目标跟踪中物体容易发生形变的问题,同时RoI池化提高候选目标区域的精度。
-
公开(公告)号:CN105912524A
公开(公告)日:2016-08-31
申请号:CN201610218407.0
申请日:2016-04-09
Applicant: 北京交通大学 , 中国移动通信集团设计院有限公司
Abstract: 本发明实施例提供了一种基于低秩矩阵分解的文章话题关键词提取方法和装置。该方法主要包括:使用将词表征为实数值向量的工具训练数据预处理后的文章文本,得到词向量化文件,使用基于文本图模型的关键词抽取算法抽取数据预处理后的文章文本中的特定话题下每个事件的关键词,根据抽取的关键词查询词向量化文件,建立特定话题下的关键词矩阵;采用增广拉格朗日乘子算法求解关键词矩阵的低秩分解问题,得到关键词低秩矩阵,最终生成所述数据预处理后的文章文本中所述特定话题下的关键词。本发明采用低秩矩阵分解的方法生成微博等文章话题的关键词,有效的解决了微博等文章话题关键词的稀疏性问题,大大降低了非关键词数据噪声的干扰。
-
公开(公告)号:CN114663880B
公开(公告)日:2025-03-25
申请号:CN202210253116.0
申请日:2022-03-15
Applicant: 北京交通大学
IPC: G06V20/64 , G06V10/25 , G06V10/44 , G06V10/56 , G06V10/764 , G06V10/766 , G06V10/82 , G06N3/0464 , G06N3/045 , G06N3/084
Abstract: 本发明提供了一种基于多层级跨模态自注意力机制的三维目标检测方法。该方法包括利用RGB图像数据构建训练集与测试集;构建三维目标检测模型,该三维目标检测模型包含RGB主干网络、深度主干网络、分类器与回归器;利用训练集与测试集数据训练所述三维目标检测模型,并利用测试集验证训练效果,得到训练好的三维目标检测模型;利用训练得到的模型对RGB图像中的三维目标进行检测。本发明方法从深度特征图中获取全局场景范围内的深度结构信息,与外观信息有机结合以提升三维目标检测算法的准确性,从而有效地对二维RGB图像中的三维物体进行类别、位置、尺寸和姿态等信息的检测。
-
公开(公告)号:CN118014036A
公开(公告)日:2024-05-10
申请号:CN202410051646.6
申请日:2024-01-12
Applicant: 北京交通大学
IPC: G06N3/08 , G06N3/084 , G06N3/0464
Abstract: 本发明提供了一种基于数据并行的少量梯度传输神经网络训练方法。该方法包括:主卡发送给每个工作卡一份神经网络模型参数M;工作卡Di利用神经网络模型参数M对小批次数据bi采用基于非线性变换的方法生成特征图,利用特征图计算出梯度Gi,工作卡Di将梯度Gi发送给主卡;主卡将各个工作卡Di发送过来的梯度Gi进行聚合处理,得到平均梯度#imgabs0#根据平均梯度#imgabs1#更新其神经网络模型参数,将更新后的神经网络模型参数M’发送给各个工作卡Di,各个工作卡Di根据接收到的神经网络模型参数M’对其神经网络模型参数进行更新。本发明使用基于非线性变换生成特征图的方式对模型进行改进,减少模型训练过程中卡与卡之间的参数传输。
-
公开(公告)号:CN112116626B
公开(公告)日:2024-04-26
申请号:CN202010773674.0
申请日:2020-08-04
Applicant: 北京交通大学
IPC: G06T7/20 , G06T7/11 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/047 , G06N3/09
Abstract: 本发明实施例提供了一种基于柔性卷积的单目标跟踪方法,构建柔性卷积网络模型,所述柔性卷积网络模型包括共享层和特定域层,利用数据集对所述柔性卷积网络模型进行训练,所述方法包括:S1、获取原始视频序列,进行预处理;S2、将预处理后的视频序列输入柔性卷积网络模型,所述共享层通过卷积操作获取目标的共享特征,将共享特征输入特定域层进行目标与背景的二分类,然后再进行柔性RoI池化选择候选目标区域,并利用损失函数提高候选目标区域的精度,从而实现单目标跟踪。本发明实施例利用了基于柔性卷积的单目标跟踪方法,有效的改善了单目标跟踪中物体容易发生形变的问题,同时RoI池化提高候选目标区域的精度。
-
公开(公告)号:CN111899284B
公开(公告)日:2024-04-09
申请号:CN202010816457.5
申请日:2020-08-14
Applicant: 北京交通大学
IPC: G06T7/246 , G06N3/0464
Abstract: 本发明实施例提供了一种基于参数化ESM网络的平面目标跟踪方法,包括:S1、获取目标模板T、第t帧的输入图像以及第t帧中的初始运动参数,由初始运动参数确定输入图像的目标区域It,对目标模板T和目标区域It进行预处理,包括图片缩放和归一化操作,使用特征提取网络对预处理后的目标模板T和第t帧的输入图像的目标区域It进行特征的提取,得到特征映射FT和FtI;S2、利用相似性度量模块计算两个特征映射FT和FtI之间的差异;S3、通过遮挡检测机制确定并排除目标在当前帧中被遮挡的部分,通过最小化当前帧中未被遮挡部分的差异求解目标的运动参数。本发明的方法更适用于目标跟踪任务,而且大大提高跟踪的准确性。
-
-
-
-
-
-
-
-
-