-
公开(公告)号:CN118898797A
公开(公告)日:2024-11-05
申请号:CN202411404288.9
申请日:2024-10-10
IPC分类号: G06V20/40 , G06V10/774 , G06V10/24 , G06V10/80
摘要: 本发明属于视频行为片段检索技术领域。提供了一种基于常识增强的视频行为片段候选集生成方法及系统,获取查询语句和待检索视频的语义特征表示;通过跨模态交互模块对视觉特征语义表示和文本特征语义表示进行交互,融合多模态信息;预测每个视频单元被保留的概率,并依据概率保留高信息有效性的视频单元;通过视觉适配层将保留的视频帧的特征映射到图文预训练大模型的输入空间;通过插入适配层对图文预训练大模型进行微调,并构造指令指示模型完成视频行为片段候选集生成任务。本发明引入图文预训练大模型以利用其中丰富的外部知识提高对视觉内容的理解,同时兼顾了视频行为片段候选集的生成速度和精度。
-
公开(公告)号:CN115063373B
公开(公告)日:2024-06-28
申请号:CN202210730860.5
申请日:2022-06-24
申请人: 山东省人工智能研究院 , 山东大学 , 青岛海尔智能技术研发有限公司 , 泰华智慧产业集团股份有限公司
IPC分类号: G06T7/00 , G06T7/13 , G06T7/181 , G06T7/73 , G06V10/80 , G06T3/4007 , G06T3/04 , G06T5/70 , G06T5/90 , G06N3/0464 , G06N3/048 , G06N3/09
摘要: 本发明公开了一种基于多尺度特征智能感知的社交网络的图像篡改定位方法,实现了基于对所有的图像篡改定位数据集的高效篡改定位;方法的具体步骤如下:对篡改图像预处理,提取边缘Groundtrhth图像,利用由sobel算子引导提取边缘特征然后采用多尺度边缘导向的注意力机制,在边缘伪影不一致的基础上挖掘篡改的粗略定位信息;构建多尺度上下文感知融合模块,利用此模块在不同的由边缘监督的尺度上进行局部和全局的搜寻,突出篡改和非篡改之间的差异;进行篡改信息的融合,输出的特征图通过样本不平衡损失来实现篡改区域的定位。本发明基于已知数据集可对其他数据集进行高效的篡改定位,能够有效地在不同篡改数据集上获得改善,并且获得极高的精度。
-
公开(公告)号:CN115238880B
公开(公告)日:2022-12-23
申请号:CN202211146873.4
申请日:2022-09-21
申请人: 山东大学 , 华北电力大学(保定) , 智洋创新科技股份有限公司 , 南瑞集团有限公司 , 国网浙江省电力有限公司温州供电公司 , 山东省计算中心(国家超级计算济南中心)
摘要: 本发明提供一种输电巡检终端的自适应部署方法、系统、设备以及存储介质,属于人工智能技术领域,通过搭建适配于所有输电巡检终端的超级网络;选择各变化维度中的参数最小值的子网络作为超级网络的基础模型,并对基础模型进行训练;选择单一变化维度作为变量,根据渐进策略获取采样扩展候选集,在采样扩展候选集中搜索设定数量的扩展子网络进行训练,并更新新增的网络参数;直至遍历所有子网络;通过神经网络搜索筛选最佳子网络,并基于最佳子网络对目标输电巡检终端进行部署。本发明在实现了节省计算资源的基础上,达到了确保子网络的精确度,有效缓解子网络之间相互干扰的显著效果。
-
公开(公告)号:CN115220479B
公开(公告)日:2022-12-13
申请号:CN202211140267.1
申请日:2022-09-20
申请人: 山东大学 , 南瑞集团有限公司 , 智洋创新科技股份有限公司 , 国网浙江省电力有限公司温州供电公司 , 华北电力大学(保定) , 山东省计算中心(国家超级计算济南中心)
IPC分类号: G05D1/10
摘要: 本发明属于巡检技术领域,本发明提供了一种动静协同的输电线路精细化巡检方法与系统,通过动静态检测协同配合,实现电力系统大范围覆盖的精细化巡检,采用静态与动态数据的分段式检测提高检测精细化的同时,节省不必要的人力及算力资源。其包括以下步骤:固定采集设备采集回传静态信息;多层感知机融合多类别静态信息评估故障程度;巡检无人机对输电线路进行精细化巡检并上传多角度图像信息:若发生非紧急故障,则调用巡检无人机进行精细化巡检,获取所述巡检无人机的巡检信息,并通过通讯模块将所述巡检信息传输至目标数据控制中心;融合无人机多视角和固定视角图像信息的故障分类模型。
-
公开(公告)号:CN114842512B
公开(公告)日:2022-10-14
申请号:CN202210763141.3
申请日:2022-07-01
申请人: 山东省人工智能研究院 , 山东大学 , 苏州天瞳威视电子科技有限公司 , 泰华智慧产业集团股份有限公司
摘要: 本发明公开了基于多特征协同和语义感知的遮挡行人重识别和检索方法,属于计算机视觉和模式识别技术领域,实现了对有遮挡的行人重识别数据集的高效识别和检索;方法的具体步骤如下:图像预处理;双链网络模型搭建;双链网络的目标函数构建;基于多特征协同和人体语义感知的有遮挡行人重识别和检索方法;本发明可对现有公开有遮挡的行人重识别数据集进行高效识别和检索,能够有效地解决目标数据集由于遮挡、姿态变化造成的行人信息缺失、特征对齐困难等问题,并且方法收敛速度快。
-
公开(公告)号:CN114758285B
公开(公告)日:2022-10-14
申请号:CN202210663949.4
申请日:2022-06-14
申请人: 山东省人工智能研究院 , 山东大学 , 青岛海尔智能技术研发有限公司 , 泰华智慧产业集团股份有限公司
IPC分类号: G06V20/40 , G06K9/62 , G06V10/774
摘要: 本发明方法公开了基于锚自由和长时注意力感知的视频交互动作检测方法,属于计算机视觉和模式识别技术领域,实现了对长视频中动作部分的高效定位以及动作识别。方法的具体步骤如下:视频特征提取;搭建基于锚自由和长时注意力感知的视频交互双流网络模型;构建基于锚自由和长时注意力感知的视频交互动作检测方法的目标函数;基于锚自由和长时注意力感知的视频交互动作检测方法。本发明基于已知数据集训练后可对长视频的动作进行有效定位并进行动作识别,有效地解决了传统动作分类方法无法在长视频中进行有效分类的问题,并且提升收敛速度,提升了工作效率。
-
公开(公告)号:CN110337016B
公开(公告)日:2020-08-14
申请号:CN201910606172.6
申请日:2019-07-05
申请人: 山东大学
IPC分类号: H04N21/258 , H04N21/25 , H04N21/466 , H04N21/45 , G06F16/735 , G06F16/738 , G06F16/78 , G06N3/04
摘要: 本公开提供了一种基于多模态图卷积网络的短视频个性化推荐方法及系统。其中,基于多模态图卷积网络的短视频个性化推荐方法包括:基于短视频的图像模态、音频模态和文本模态分别构建用户‑短视频图结构;用户‑短视频图结构中的点表示用户和短视频,点之间的连线表示两者之间的交互;将各个模态的用户‑短视频图结构输入至相应图卷积神经网络中,通过相应图卷积神经网络的聚合层分别计算表达各个模态的用户及短视频,利用相应图卷积神经网络的融合层合并用户及短视频的各个模态的表达,得到用户和短视频的最终表达;利用贝叶斯个性化排序算法依次推荐出用户和短视频的最终表达的成对序列。
-
公开(公告)号:CN118942017A
公开(公告)日:2024-11-12
申请号:CN202411418791.X
申请日:2024-10-12
IPC分类号: G06V20/40 , G06V10/74 , G06V10/82 , G06N3/0464 , G06N3/096 , G06N3/0442
摘要: 本发明属于多媒体检索技术领域,提供了面向实时任务的视频片段定位方法、系统、介质及设备,其技术方案为:获取视频和查询语句后,通过图像特征处理模型和自然语言特征处理模型来得出对应特征表示;通过跨模态动态哈希编码,将视频和查询语句两种不同模态的特征表示映射到同一汉明空间,而且动态哈希能够根据数据输入调整哈希编码;利用知识蒸馏技术从大参数量、高性能的教师模型中提取知识,并迁移至小参数量、低复杂度的学生模型中,从而构建轻量化的视频片段定位模型。本发明通过将动态哈希编码技术和蒸馏学习技术融合来构建轻量级模型,实现了高效捕捉视频内容的深层语义,同时确保实时任务的快速响应和准确性,解决了视频片段定位的困难。
-
公开(公告)号:CN115272777B
公开(公告)日:2022-12-23
申请号:CN202211169230.1
申请日:2022-09-26
申请人: 山东大学 , 智洋创新科技股份有限公司 , 国网浙江省电力有限公司温州供电公司 , 浙江大华技术股份有限公司 , 华北电力大学(保定) , 山东省计算中心(国家超级计算济南中心)
IPC分类号: G06V10/764 , G06V10/772 , G06V10/774 , G06V10/82 , G06N3/08
摘要: 本发明涉及输电线路巡检技术领域,具体涉及一种面向输电场景的半监督图像解析方法,包括以下步骤:S1:数据预处理:人工标注部分输电线路场景的分类数据集和目标检测数据集;S2:数据集的增广和模型优化训练:使用动态参数混合数据增广框架对有标注数据集进行数据增广和模型优化训练,将参数化后的混合数据增广策略融入到判别模型中;S3:半监督训练方法改良:基于S2中经过动态参数混合数据增广优化的模型,使用基于队列优化的鲁棒半监督训练方法,以最优队列的标签筛选策略替换传统的固定高阈值策略,来筛选高置信度伪标签以计算无监督损失;S4:获取S3中预训练好的模型参数,在输电线路图像解析的下游任务中测试效果。
-
公开(公告)号:CN115223049B
公开(公告)日:2022-12-13
申请号:CN202211140194.6
申请日:2022-09-20
申请人: 山东大学 , 国网浙江省电力有限公司温州供电公司 , 华北电力大学(保定) , 智洋创新科技股份有限公司 , 南瑞集团有限公司 , 山东省计算中心(国家超级计算济南中心)
IPC分类号: G06V20/10 , G06V10/74 , G06V10/774 , G06V10/82 , G06N3/08
摘要: 本发明属于压缩技术领域,具体提供了一种面向电力场景边缘计算大模型压缩的知识蒸馏与量化方法。其包括以下步骤:电力场景任务抽象;双层知识蒸馏网络单元构建;教师模型修饰处理;主从教师监督框架:基于教师‑学生蒸馏网络,使用多个数据集训练不同的教师模型,包括与目标任务类似的场景数据集和实际落地场景的数据集,将这些数据集进行划分,训练多个教师模型,按照数据集与落地场景相似度分配指导权重,分为主教师模型和若干个从教师模型,从而对学生模型进行不同层面的知识引导,提高学生模型在复杂场景下的泛化能力;学生模型压缩感知训练。
-
-
-
-
-
-
-
-
-