-
公开(公告)号:CN119942592A
公开(公告)日:2025-05-06
申请号:CN202510011144.5
申请日:2025-01-03
Applicant: 北方工业大学
Abstract: 本发明提出一种基于双路注意力机制的行人重识别方法及系统,属于图像处理领域,包括:S1:采集社区行人数据进行数据预处理,构建社区行人数据集;S2:构建ResNetRFA网络,将社区行人数据集输入ResNetRFA网络,提取行人目标关键特征并生成感受野特征图#imgabs0#;S3:将#imgabs1#划分为若干局部特征图后与#imgabs2#一起输入双路注意力机制模块,通过全局上下文注意力机制模块和局部关系注意力机制模块获取局部‑全局关系特征图;S4:将局部‑全局关系特征图转换为特征向量用于表示行人,通过向量间的角度差值优化欧氏距离的计算方式,判断两个行人是否为同一人。本发明方法提高了行人重识别的准确度、鲁棒性和泛化性。
-
公开(公告)号:CN118756254A
公开(公告)日:2024-10-11
申请号:CN202411146426.8
申请日:2024-08-20
Applicant: 北方工业大学
Abstract: 本发明公开了一种铝电解槽电压偏差预测方法与装置,通过引入位置嵌入与时间戳,为模型提供序列中每个元素的位置信息,增强时间序列输入的局部上下文信息,使得模型能更好地理解序列中的模式和关系,从而提高了模型在处理序列数据时的性能和泛化能力,提升预测性能;利用自注意力提取机制,使级联层的输入减半,以突出主导注意力,实现了模型的压缩和加速,本发明,一方面在保持模型性能的同时,显著降低了模型的计算复杂度,提高了模型的训练速度;另一方面,可以提升铝电解槽电压偏差预测性能,从而协助生产过程中及时调整工艺参数,确保电压稳定,避免出现能耗过高的情况,从而有效控制电耗,提高生产效率和质量。
-
公开(公告)号:CN114399816A
公开(公告)日:2022-04-26
申请号:CN202111630727.4
申请日:2021-12-28
Applicant: 北方工业大学
Abstract: 本发明提供一种社区火灾风险感知方法及装置,该方法包括:实时获取当前时刻的社区图片;将所述社区图片输入改进的FIRE‑VLBERT模型,输出所述社区图片对应的火灾预警信息和社区火灾风险等级信息;其中,所述改进的FIRE‑VLBERT模型具体是经过携带有火灾风险描述标签和火灾风险术语标签的社区样本图像训练得到的。改进的FIRE‑VLBERT模型,通过多模态数据交替学习完成训练,能够在较小的数据集上完成较高进度的训练,从而可以有效处理和融合多模态数据,并且通过将R‑FCN算法融入到BERT模型中,能够有效的提高检测速度,从而充分保证了对社区图片进行社区火灾风险感知的速度和准确度。
-
公开(公告)号:CN114398464A
公开(公告)日:2022-04-26
申请号:CN202111627289.6
申请日:2021-12-28
Applicant: 北方工业大学
Abstract: 本发明提供一种基于知识图谱的研讨数据展示方法及系统,该方法包括:获取专家研讨语音数据,并对专家研讨语音数据进行语音识别处理,得到专家研讨文本数据;将专家研讨文本数据输入至训练好的向量提取模型,得到专家研讨文本数据对应的知识表示向量;将知识表示向量与预设的历史知识图谱进行匹配,在匹配成功的情况下,将匹配到的历史知识图谱进行展示;在匹配失败的情况下,基于专家研讨文本数据构建新知识图谱,将新知识图谱与历史知识图谱进行融合,并对新知识图谱进行展示。本发明能够根据专家研讨内容提供全面的知识展示,并根据专家的研讨过程形成新的知识,为专家快速准确地得到研判结果提供了数据基础。
-
公开(公告)号:CN117197540A
公开(公告)日:2023-12-08
申请号:CN202311041047.8
申请日:2023-08-17
Applicant: 北方工业大学
IPC: G06V10/764 , G06V10/82 , G06N3/045 , G06V10/80
Abstract: 本发明涉及人工智能技术领域,提供一种高空抛物目标检测方法、装置、设备和存储介质,方法包括:获取第一高空抛物目标的待测图像,输入第一神经网络,得到多个第一特征图,各个第一特征图的尺度不同;利用第二神经网络对多个第一特征图进行特征融合,得到多个第二特征图;利用第三神经网络根据预设的目标背景前景分类信息,对多个第二特征图进行分类处理,得到包含第一高空抛物目标的候选锚框;利用第四神经网络根据候选锚框预测得到第一高空抛物目标的目标类别信息和目标边界信息。本发明能满足高空抛物小目标检测的精度要求,检测精度较高。
-
公开(公告)号:CN119649464A
公开(公告)日:2025-03-18
申请号:CN202411871328.0
申请日:2024-12-18
Applicant: 北方工业大学
IPC: G06V40/20 , G06V10/40 , G06V40/10 , G06V10/80 , G06V10/82 , G06N3/045 , G06N3/042 , G06N3/0464 , G06N3/0455
Abstract: 本发明提出一种姿态驱动的人物交互行为多层感知方法及系统,属于计算机视觉、行为识别领域,包括:S1:输入图片通过AFE模块进行特征提取,再通过扁平化操作得到图像特征嵌入R;S2:通过人体姿态检测方法获取输入图片的骨骼关键点,经过AGCN模块将骨骼关键点生成姿态嵌入P;S3:将R和P输入跨域特征融合模块进行融合嵌入,获得融合特征F;S4:将融合特征F、图像位置编码和HOI查询输入Transformer模型,得到输出嵌入D;采用多个多层感知机(MLP)分支将D解码为五元组HOI实例,并预测人物之间的交互行为。本发明方法旨在解决现有技术人体姿态信息缺乏,人物交互动作识别精确度较低的问题。
-
公开(公告)号:CN114399816B
公开(公告)日:2023-04-07
申请号:CN202111630727.4
申请日:2021-12-28
Applicant: 北方工业大学
IPC: G06V40/16 , G06V20/52 , G06Q50/26 , G06Q10/0635 , G06N3/02 , G06F18/214 , G06V10/774
Abstract: 本发明提供一种社区火灾风险感知方法及装置,该方法包括:实时获取当前时刻的社区图片;将所述社区图片输入改进的FIRE‑VLBERT模型,输出所述社区图片对应的火灾预警信息和社区火灾风险等级信息;其中,所述改进的FIRE‑VLBERT模型具体是经过携带有火灾风险描述标签和火灾风险术语标签的社区样本图像训练得到的。改进的FIRE‑VLBERT模型,通过多模态数据交替学习完成训练,能够在较小的数据集上完成较高进度的训练,从而可以有效处理和融合多模态数据,并且通过将R‑FCN算法融入到BERT模型中,能够有效的提高检测速度,从而充分保证了对社区图片进行社区火灾风险感知的速度和准确度。
-
公开(公告)号:CN114398464B
公开(公告)日:2023-01-24
申请号:CN202111627289.6
申请日:2021-12-28
Applicant: 北方工业大学
IPC: G06F16/33 , G06F16/36 , G06F18/214 , G06F18/22 , G06N3/02
Abstract: 本发明提供一种基于知识图谱的研讨数据展示方法及系统,该方法包括:获取专家研讨语音数据,并对专家研讨语音数据进行语音识别处理,得到专家研讨文本数据;将专家研讨文本数据输入至训练好的向量提取模型,得到专家研讨文本数据对应的知识表示向量;将知识表示向量与预设的历史知识图谱进行匹配,在匹配成功的情况下,将匹配到的历史知识图谱进行展示;在匹配失败的情况下,基于专家研讨文本数据构建新知识图谱,将新知识图谱与历史知识图谱进行融合,并对新知识图谱进行展示。本发明能够根据专家研讨内容提供全面的知识展示,并根据专家的研讨过程形成新的知识,为专家快速准确地得到研判结果提供了数据基础。
-
-
-
-
-
-
-