-
公开(公告)号:CN119295886B
公开(公告)日:2025-04-18
申请号:CN202411844794.X
申请日:2024-12-16
Applicant: 齐鲁工业大学(山东省科学院) , 山东省人工智能研究院 , 山东省计算中心(国家超级计算济南中心) , 山东大学 , 浙江大华技术股份有限公司 , 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院) , 合肥工业大学
IPC: G06V10/80 , G06V10/44 , G06V10/774 , G06V10/82 , G06V20/62 , G06N3/0464 , G06N3/08
Abstract: 本发明涉及一种基于多尺度特征融合的X‑ray图像违禁品检测方法,属于图像处理技术领域。其包括以下步骤:获取X‑ray违禁品数据集,并将数据集划分为训练集和测试集;构建基于多尺度特征融合的X‑ray图像违禁品目标检测模型,所述模型包括图像分支、自适应高低通滤波器模块、文本分支、Neck层和Head头;训练集中图像输入到模型中对模型进行训练;采用损失函数对模型进行优化,得到训练好的模型;测试集中图像输入到训练好的模型中,得到违禁品检测结果。本发明通过图像文本的联合训练,在实时监测任务中提升性能的同时更加高效,减少计算量和内存占用,解决了复杂场景中图像边界细节模糊问题。
-
公开(公告)号:CN118942017B
公开(公告)日:2024-12-31
申请号:CN202411418791.X
申请日:2024-10-12
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院) , 山东大学 , 浙江大华技术股份有限公司 , 山东省计算中心(国家超级计算济南中心) , 山东师范大学
IPC: G06V20/40 , G06V10/74 , G06V10/82 , G06N3/0464 , G06N3/096 , G06N3/0442
Abstract: 本发明属于多媒体检索技术领域,提供了面向实时任务的视频片段定位方法、系统、介质及设备,其技术方案为:获取视频和查询语句后,通过图像特征处理模型和自然语言特征处理模型来得出对应特征表示;通过跨模态动态哈希编码,将视频和查询语句两种不同模态的特征表示映射到同一汉明空间,而且动态哈希能够根据数据输入调整哈希编码;利用知识蒸馏技术从大参数量、高性能的教师模型中提取知识,并迁移至小参数量、低复杂度的学生模型中,从而构建轻量化的视频片段定位模型。本发明通过将动态哈希编码技术和蒸馏学习技术融合来构建轻量级模型,实现了高效捕捉视频内容的深层语义,同时确保实时任务的快速响应和准确性,解决了视频片段定位的困难。
-
公开(公告)号:CN118898797B
公开(公告)日:2024-12-27
申请号:CN202411404288.9
申请日:2024-10-10
Applicant: 山东大学 , 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院) , 浙江大华技术股份有限公司 , 山东省计算中心(国家超级计算济南中心)
IPC: G06V20/40 , G06V10/774 , G06V10/24 , G06V10/80
Abstract: 本发明属于视频行为片段检索技术领域。提供了一种基于常识增强的视频行为片段候选集生成方法及系统,获取查询语句和待检索视频的语义特征表示;通过跨模态交互模块对视觉特征语义表示和文本特征语义表示进行交互,融合多模态信息;预测每个视频单元被保留的概率,并依据概率保留高信息有效性的视频单元;通过视觉适配层将保留的视频帧的特征映射到图文预训练大模型的输入空间;通过插入适配层对图文预训练大模型进行微调,并构造指令指示模型完成视频行为片段候选集生成任务。本发明引入图文预训练大模型以利用其中丰富的外部知识提高对视觉内容的理解,同时兼顾了视频行为片段候选集的生成速度和精度。
-
公开(公告)号:CN118942017A
公开(公告)日:2024-11-12
申请号:CN202411418791.X
申请日:2024-10-12
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院) , 山东大学 , 浙江大华技术股份有限公司 , 山东省计算中心(国家超级计算济南中心) , 山东师范大学
IPC: G06V20/40 , G06V10/74 , G06V10/82 , G06N3/0464 , G06N3/096 , G06N3/0442
Abstract: 本发明属于多媒体检索技术领域,提供了面向实时任务的视频片段定位方法、系统、介质及设备,其技术方案为:获取视频和查询语句后,通过图像特征处理模型和自然语言特征处理模型来得出对应特征表示;通过跨模态动态哈希编码,将视频和查询语句两种不同模态的特征表示映射到同一汉明空间,而且动态哈希能够根据数据输入调整哈希编码;利用知识蒸馏技术从大参数量、高性能的教师模型中提取知识,并迁移至小参数量、低复杂度的学生模型中,从而构建轻量化的视频片段定位模型。本发明通过将动态哈希编码技术和蒸馏学习技术融合来构建轻量级模型,实现了高效捕捉视频内容的深层语义,同时确保实时任务的快速响应和准确性,解决了视频片段定位的困难。
-
公开(公告)号:CN115272777B
公开(公告)日:2022-12-23
申请号:CN202211169230.1
申请日:2022-09-26
Applicant: 山东大学 , 智洋创新科技股份有限公司 , 国网浙江省电力有限公司温州供电公司 , 浙江大华技术股份有限公司 , 华北电力大学(保定) , 山东省计算中心(国家超级计算济南中心)
IPC: G06V10/764 , G06V10/772 , G06V10/774 , G06V10/82 , G06N3/08
Abstract: 本发明涉及输电线路巡检技术领域,具体涉及一种面向输电场景的半监督图像解析方法,包括以下步骤:S1:数据预处理:人工标注部分输电线路场景的分类数据集和目标检测数据集;S2:数据集的增广和模型优化训练:使用动态参数混合数据增广框架对有标注数据集进行数据增广和模型优化训练,将参数化后的混合数据增广策略融入到判别模型中;S3:半监督训练方法改良:基于S2中经过动态参数混合数据增广优化的模型,使用基于队列优化的鲁棒半监督训练方法,以最优队列的标签筛选策略替换传统的固定高阈值策略,来筛选高置信度伪标签以计算无监督损失;S4:获取S3中预训练好的模型参数,在输电线路图像解析的下游任务中测试效果。
-
公开(公告)号:CN115223049B
公开(公告)日:2022-12-13
申请号:CN202211140194.6
申请日:2022-09-20
Applicant: 山东大学 , 国网浙江省电力有限公司温州供电公司 , 华北电力大学(保定) , 智洋创新科技股份有限公司 , 南瑞集团有限公司 , 山东省计算中心(国家超级计算济南中心)
IPC: G06V20/10 , G06V10/74 , G06V10/774 , G06V10/82 , G06N3/08
Abstract: 本发明属于压缩技术领域,具体提供了一种面向电力场景边缘计算大模型压缩的知识蒸馏与量化方法。其包括以下步骤:电力场景任务抽象;双层知识蒸馏网络单元构建;教师模型修饰处理;主从教师监督框架:基于教师‑学生蒸馏网络,使用多个数据集训练不同的教师模型,包括与目标任务类似的场景数据集和实际落地场景的数据集,将这些数据集进行划分,训练多个教师模型,按照数据集与落地场景相似度分配指导权重,分为主教师模型和若干个从教师模型,从而对学生模型进行不同层面的知识引导,提高学生模型在复杂场景下的泛化能力;学生模型压缩感知训练。
-
公开(公告)号:CN115220479A
公开(公告)日:2022-10-21
申请号:CN202211140267.1
申请日:2022-09-20
Applicant: 山东大学 , 南瑞集团有限公司 , 智洋创新科技股份有限公司 , 国网浙江省电力有限公司温州供电公司 , 华北电力大学(保定) , 山东省计算中心(国家超级计算济南中心)
IPC: G05D1/10
Abstract: 本发明属于巡检技术领域,本发明提供了一种动静协同的输电线路精细化巡检方法与系统,通过动静态检测协同配合,实现电力系统大范围覆盖的精细化巡检,采用静态与动态数据的分段式检测提高检测精细化的同时,节省不必要的人力及算力资源。其包括以下步骤:固定采集设备采集回传静态信息;多层感知机融合多类别静态信息评估故障程度;巡检无人机对输电线路进行精细化巡检并上传多角度图像信息:若发生非紧急故障,则调用巡检无人机进行精细化巡检,获取所述巡检无人机的巡检信息,并通过通讯模块将所述巡检信息传输至目标数据控制中心;融合无人机多视角和固定视角图像信息的故障分类模型。
-
公开(公告)号:CN111737569B
公开(公告)日:2022-05-03
申请号:CN202010498841.5
申请日:2020-06-04
Applicant: 山东省人工智能研究院 , 山东省计算中心(国家超级计算济南中心)
IPC: G06F16/9535 , G06N3/04 , G06N3/08 , G06Q30/06
Abstract: 一种基于属性感知注意图卷积神经网络的个性化推荐方法,利用属性信息缓解了稀疏性问题;提出了基于用户‑商品‑属性交互图的图卷积神经网络推荐算法缓解了属性缺失问题;通过属性感知的注意力机制对用户偏好建模,提升了模型的推荐效果,并可以通过对用户的偏好建模进行推荐。
-
公开(公告)号:CN111737569A
公开(公告)日:2020-10-02
申请号:CN202010498841.5
申请日:2020-06-04
Applicant: 山东省人工智能研究院 , 山东省计算中心(国家超级计算济南中心)
IPC: G06F16/9535 , G06N3/04 , G06N3/08 , G06Q30/06
Abstract: 一种基于属性感知注意图卷积神经网络的个性化推荐方法,利用属性信息缓解了稀疏性问题;提出了基于用户-商品-属性交互图的图卷积神经网络推荐算法缓解了属性缺失问题;通过属性感知的注意力机制对用户偏好建模,提升了模型的推荐效果,并可以通过对用户的偏好建模进行推荐。
-
公开(公告)号:CN110555060A
公开(公告)日:2019-12-10
申请号:CN201910849336.8
申请日:2019-09-09
Applicant: 山东省计算中心(国家超级计算济南中心)
IPC: G06F16/2458 , G06K9/62 , G06N3/04
Abstract: 本发明属于图像分类和迁移学习技术领域,公开了一种基于成对样本匹配的迁移学习方法,实现了对基于不同域的样本内在关系的挖掘。具体包含以下步骤:(1)数据预处理,(2)基于迁移学习的双链模型构建,(3)实例归一化和批量归一化,(4)计算对比损失和最大均值距离损失。本发明的优点是通过结合实例归一化和批归一化同时进行学习,充分挖掘不同图像的风格和语义关联特性,实现在源域辅助下对少量目标域样本的高效识别。
-
-
-
-
-
-
-
-
-