-
公开(公告)号:CN116740124A
公开(公告)日:2023-09-12
申请号:CN202310655750.1
申请日:2023-06-05
Applicant: 桂林电子科技大学 , 南宁桂电电子科技研究院有限公司
Abstract: 本发明涉及小目标检测与多目标跟踪技术领域,具体涉及一种基于改进YOLOv8的车辆跟踪与车牌识别联合检测方法,将车辆检测跟踪与车牌识别融合在一个统一的系统中,通过以下步骤实现联合检测,首先采用改进YOLOv8算法对车辆与车牌进行检测,再使用基于匈牙利算法的BOT‑SORT跟踪算法进行车辆目标跟踪,同时使用LPRNet进行车牌识别,通过使用了可变形卷积操作代替标准卷积,可根据图像改变感受野大小,同时添加了MHSA注意力网络,在保证轻量化的同时,大大提升了物体检测精度,同时本发明将车辆多目标跟踪和车牌识别集成在一个系统中,使用方便,容易部署在边缘设备中。
-
公开(公告)号:CN117851659A
公开(公告)日:2024-04-09
申请号:CN202410021902.7
申请日:2024-01-08
Applicant: 桂林电子科技大学 , 南宁桂电电子科技研究院有限公司
IPC: G06F16/953 , G06F16/903 , G06N3/094 , G06N3/0455 , G06N3/047
Abstract: 本发明涉及无监督跨模态哈希检索技术领域,具体涉及一种自适应增强对抗哈希无监督跨模态检索方法,包括分别对图像和文本数据进行特征提取,得到原始图像特征和原始文本特征;设计文本生成器来拟合原始文本特征的文本数据分布,随机生成和图像特征维度一致的假数据,最后使用假数据训练图像鉴别器,并生成特征矩阵;设计特征矩阵映射为哈希码矩阵,并量化映射过程信息的损失,得到信息量损失矩阵;将信息量损失矩阵嵌入多模态相似性矩阵的构造中,得到相似性度量矩阵,再利用相似性度量矩阵实现图像和文本原始特征空间与汉明空间的语义对齐,经过多轮训练,得到最优的跨模态检索模型,使用其进行检索,得到检索结果。
-
公开(公告)号:CN116740493A
公开(公告)日:2023-09-12
申请号:CN202310653375.7
申请日:2023-06-05
Applicant: 桂林电子科技大学 , 南宁桂电电子科技研究院有限公司
IPC: G06V10/774 , G06V10/82 , G06V10/40 , G06V10/25 , G06V10/764 , G06N3/0464 , G06N3/048 , G06N3/08
Abstract: 本发明涉及目标检测技术领域,具体涉及一种基于语义关系的多尺度无锚框目标检测方法,包括以下步骤:首先进行原始图片目标特征提取,再目标间语义关系构建,最后通过目标分类、中心度计算和位置回归,输出检测结果;本发明不同于现有方法由于锚框数量大而需要大量的计算资源,摒弃了传统anchor‑based方法需要预先根据目标尺寸设计各种超参数的复杂过程,减轻了计算资源的开销,更加易于算法模型的落地,且训练时间更短。进一步的,由于关系模块的引入,借鉴了自注意力机制,提高了小目标乃至是受遮挡物体的检测精度,一定程度上提高了方法的泛化能力。
-
公开(公告)号:CN116756363A
公开(公告)日:2023-09-15
申请号:CN202310657100.0
申请日:2023-06-05
Applicant: 桂林电子科技大学 , 南宁桂电电子科技研究院有限公司
IPC: G06F16/583 , G06F16/383 , G06F18/213 , G06F18/22 , G06F18/25 , G06F18/214
Abstract: 本发明涉及跨模态检索技术领域,具体涉及一种由信息量引导的强相关性无监督跨模态检索方法,通过以下步骤实现:首先提取图像局部特征和全局特征,以及文本特征;对图像局部特征和全局特征进行增强;再对增强后的局部特征进行正则化处理;然后使用图像特征融合网络对图像全局特征和局部特征进行正交融合;接着使用多模态融合网络对图像特征和文本特征根据不同模态特征信息量转换比例原则进行融合;最后将不同模态特征映射成哈希码,利用汉明距离进行相似性排序,从而得出检索结果。本发明侧重于对数据特征的增强和融合,能获取更多的语义信息,提高了检索效率。
-
公开(公告)号:CN116739075A
公开(公告)日:2023-09-12
申请号:CN202310656829.6
申请日:2023-06-05
Applicant: 桂林电子科技大学 , 南宁桂电电子科技研究院有限公司
IPC: G06N3/088 , G06N3/048 , G06N3/0499 , G06V10/40 , G06V10/764 , G06V10/82
Abstract: 本发明涉及神经网络无监督学习技术领域,具体涉及一种用于图像处理的神经网络的无监督预训练方法,包括如下步骤:首先将图像分成图像块,再进行掩膜操作,接着计算感知损失,计算对比损失与重建损失,最后利用损失进行训练。训练完毕以后,使用训练后的模型对输入图像处理,获得类别特征向量和重建的图像向量。本发明通过使用感知损失能够衡量掩膜操作对于神经网络的影响,同时使用对比损失使其特征更加明显,最后通过重建损失令网络学习如何将图像抽象为特征同时减少抽象过程中信息的丢失,提高了神经网络对于图像的特征提取能力。
-
公开(公告)号:CN117877118A
公开(公告)日:2024-04-12
申请号:CN202410055270.6
申请日:2024-01-15
Applicant: 桂林电子科技大学
IPC: G06V40/20 , G06V20/52 , G06V10/25 , G06V10/764 , G06V10/766 , G06V10/774 , G06V10/80 , G06V10/82 , G06N3/045 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种针对塔吊驾驶员危险行为的目标检测方法。首先收集塔吊驾驶员行为图像样本数据制作数据集,并对图像样本进行预处理;并通过主干网络,对输入图像进行特征提取;其次通过改进增强网络,融合主干网络提取的图像特征;最后通过预测网络,对塔吊驾驶场景下危险行为小目标(烟和电话)进行分类和边界框回归,输出检测结果。该方法通过改进YOLOv7目标检测算法,结合多种成熟的方法,从而达到更好的检测效果。本发明方法能够有效提高检测效果,方法简单易用,应用性强,尤其在工地安全领域检测塔吊驾驶员危险行为的方面将会有很大的应用。
-
公开(公告)号:CN117876858A
公开(公告)日:2024-04-12
申请号:CN202410055010.9
申请日:2024-01-15
Applicant: 桂林电子科技大学
IPC: G06V20/05 , G06V10/25 , G06V10/82 , G06V10/774 , G06N3/045 , G06N3/0455 , G06N3/0464 , G06N3/0499 , G06N3/082
Abstract: 本发明公开了一种基于改进yolov7算法的水下目标检测方法,该方法的步骤为:1)获取水下图像数据集,并按照一定的比例分为训练集、验证集和测试集;2)以yolov7模型为基础模型进行改进得到一种新的目标检测方法,改进方法包括对主干网络进行改进、设计一种新的模块、结合Transformer模型和使用新的损失函数;3)对改进后的模型进行剪枝;4)使用训练集对剪枝后的模型进行训练;5)使用测试集对模型进行评估。本发明方法具有较好的检测效果且减少了参数量和计算量,方法简单易部署,适用性广泛,尤其在水下机器人、海洋捕捞等领域将会被广泛应用。
-
公开(公告)号:CN111882554B
公开(公告)日:2022-05-03
申请号:CN202010783841.X
申请日:2020-08-06
Applicant: 桂林电子科技大学 , 广西景航无人机有限公司
IPC: G06T7/00 , G06V10/44 , G06V10/762 , G06V10/764 , G06K9/62
Abstract: 本发明公开了一种基于SK‑YOLOv3的电力线故障智能检测方法,包括如下步骤:1)采集电力线故障数据集:2)提高特征图得分;3)生成预测框。这种方法提高了检测精度,检测更细致。
-
公开(公告)号:CN118154641A
公开(公告)日:2024-06-07
申请号:CN202410240263.3
申请日:2024-03-04
Applicant: 桂林电子科技大学
IPC: G06T7/246 , G06T7/277 , G06V40/20 , G06V10/82 , G06N3/0442
Abstract: 本发明公开了一种基于改进ByteTrack算法的多目标跟踪方法,主要针对塔吊驾驶员危险行为进行跟踪。首先收集塔吊驾驶员行为视频序列,制作数据集;并针对塔吊驾驶员危险行为的目标之间存在的严重遮挡,添加BYTE数据关联的轨迹插值后处理策略;其次,引入无迹卡尔曼滤波器替换算法本身的卡尔曼滤波器;最后,引入长短记忆网络LSTM进行塔吊驾驶员行为轨迹预测,输出跟踪结果。本发明通过改进ByteTrack多目标跟踪算法,添加轨迹插值后处理策略,并结合多种成熟的方法,构建新的多目标跟踪算法,该模型达到更好的跟踪效果。本发明方法能够有效提高跟踪效果,方法简单易用,应用性强,尤其在工地安全领域跟踪塔吊驾驶员危险行为的方面将会有很大的应用。
-
公开(公告)号:CN117236331A
公开(公告)日:2023-12-15
申请号:CN202311198934.6
申请日:2023-09-18
Applicant: 桂林电子科技大学
IPC: G06F40/295 , G06F18/25 , G06F18/214 , G06F18/24 , G06F40/289 , G06N3/0442 , G06N3/048 , G06N3/08
Abstract: 本发明公开了一种融合多种外部语义特征的中文司法领域命名实体识别方法,包括如下步骤:1)构建司法语料库;2)在数据集的全局层面构建无向字形图,利用字形图对模型嵌入层的输入数据进行字形增强;3)对模型嵌入层的输入数据进行多词汇增强;4)将步骤2)和步骤3)得到的两种外部语义特征增强后的输入通过门控机制进行特征融合,然后输入到BiLSTM‑CRF网络对司法领域的命名实体进行识别。该方法能对司法文本中的案发地点、地名、人名、组织机构名、罪名、法条以及刑期七类实体进行有效的识别,通过多种外部语义特征增强,减少了对司法标注语料的依赖,针对有限的司法标注语料,提高了对司法领域命名实体的识别准确率和F1指标。
-
-
-
-
-
-
-
-
-