基于类别余弦映射的绝缘子故障检测方法及装置

    公开(公告)号:CN119228788A

    公开(公告)日:2024-12-31

    申请号:CN202411725027.7

    申请日:2024-11-28

    Applicant: 华侨大学

    Abstract: 本发明公开了一种基于类别余弦映射的绝缘子故障检测方法及装置,涉及人工智能、机器视觉领域,包括:从真实数据集合与合成数据集合中获取图像数据、故障标签以及类别标签;利用类别余弦偏置编码将类别偏置编码进图像数据,利用特征提取网络提取编码结果中的空间特征;利用类别余弦偏置解码缓解空间特征中的偏置信息以获得类别特征,利用多标签分类器获取类别特征与类别标签的分类损失;利用分割解码器获取空间特征与故障标签的掩码损失;基于分类损失与掩码损失完成模型训练。本发明将正常、故障绝缘子以及合成图像的类别差异通过余弦偏置编码至图像数据中,引导模型理解合成图像与真实场景中的分布差异,最终提升合成数据在实践中的有效性。

    一种无人机森林火灾风险区块检测方法及系统

    公开(公告)号:CN119027845A

    公开(公告)日:2024-11-26

    申请号:CN202411514321.3

    申请日:2024-10-29

    Abstract: 本发明涉及图像处理与人工智能技术领域,公开了一种无人机森林火灾风险区块检测方法及系统,方法包括:构建基于区块分类的目标检测模型并进行训练,利用训练好的基于区块分类的目标检测模型实现无人机森林火灾风险区块检测;所述基于区块分类的目标检测模型利用区块映射器无人机图像中的不同区块映射为区块特征;利用多阶段采样网络对区块特征进行多种尺度的采样,并利用降维映射层进行尺度对齐,获得多尺度区块特征;通过哈达玛积融合多尺度区块特征,利用区块分类器将融合后的多尺度区块特征映射至区块类别概率。本发明以区域分类方式实现风险区块的定位,避免了现有技术因精确定位导致的庞大计算量,延长无人机可用时间。

    融合空频域显著性特征的SCV编码感知码率控制方法及装置

    公开(公告)号:CN118450127A

    公开(公告)日:2024-08-06

    申请号:CN202410885047.4

    申请日:2024-07-03

    Applicant: 华侨大学

    Abstract: 本发明公开了一种融合空频域显著性特征的SCV编码感知码率控制方法及装置,涉及视频编码领域,方法包括:获取屏幕内容视频,通过卷积、相似度计算,对屏幕内容视频在空域上进行显著性建模,获得空域的显著性特征;其次利用DCT变换,对屏幕内容视频在频域上进行显著性建模,获得频域的显著性特征;然后利用显著性因子指导CTU级的目标比特分配;最后通过显著性因子构建显著性启发的感知码率控制模型,调节参数,实现码率控制。本发明通过提取空域和频域的显著性特征并加以融合求得显著性因子,使用显著性因子指导码率控制,能够提高编码率失真性能,提升码率分配精度。

    基于多模态融合的压缩视频质量增强方法及装置

    公开(公告)号:CN117237259B

    公开(公告)日:2024-02-27

    申请号:CN202311510614.X

    申请日:2023-11-14

    Applicant: 华侨大学

    Abstract: 本发明公开了一种基于多模态融合的压缩视频质量增强方法及装置,涉及图像处理领域,该方法包括:获取图像帧及其对应的光流图和纹理图并分别进行特征提取,得到图像特征、光流特征和纹理特征;构建压缩视频质量增强模型并训练,得到经训练的压缩视频质量增强模型;将图像特征、光流特征和纹理特征输入经训练的压缩视频质量增强模型,图像特征、光流特征和纹理特征输入多模态一致性单元,自适应调整三种模态信息的分布,得到第一特征、第二特征和第三特征并输入多模态融合单元以进行特征融合,得到融合特征并输入多模态重构单元,得到重构信息,将重构信息与图像帧相加,得到增强的视频帧,解决单模态图像难以有效改善最终重建视频的质量的问题。

    一种基于多源信息融合的轻量化车辆再辨识方法

    公开(公告)号:CN117456480A

    公开(公告)日:2024-01-26

    申请号:CN202311769679.6

    申请日:2023-12-21

    Abstract: 本发明公开了一种基于多源信息融合的轻量化车辆再辨识方法,涉及计算机视觉与机器学习技术领域,包括:构建神经网络;所述神经网络包括依次连接的ResNet50网络、局部特征融合网络和混合注意力模块;使用监督对比损失和多源信息识别损失对神经网络进行联合训练,直至收敛,得到教师网络;选取计算量和参数量比教师网络均小的模型作为学生网络;通过知识蒸馏,对学生网络进行监督,训练直至收敛,得到轻量化的车辆再辨识模型;基于轻量化的车辆再辨识模型,输出再辨识结果。本发明利用多源信息融合的方式协调不同传感器数据以提高再辨识性能,并辅以知识蒸馏,实现在有限的计算资源下,实现高质量的再辨识,从而为各种应用场景提供了更多的灵活性。

    基于三维几何失真的MIV沉浸式视频编码率失真优化方法

    公开(公告)号:CN117440158A

    公开(公告)日:2024-01-23

    申请号:CN202311759886.3

    申请日:2023-12-20

    Applicant: 华侨大学

    Abstract: 本发明公开了一种基于三维几何失真的MIV沉浸式视频编码率失真优化方法,涉及视频编码领域,包括:S1,基于MIV编码平台编码沉浸式视频序列,生成图集后,计算与深度映射范围系数;S2,使用支持MIV标准的二维视频编码器编码沉浸式视频几何图集时,构建三维几何失真与均方误差的关系模型;S3,根据三维几何失真与均方误差的关系模型,计算三维几何失真系数;S4,根据三维几何失真系数,计算率失真优化模型中新的拉格朗日乘子,基于调整后的率失真优化模型编码当前CTU,以改善沉浸式视频渲染质量的率失真性能。本发明最终渲染的沉浸式视频质量与码率的率失真性能更好。

    一种视频目标编辑方法、终端设备及存储介质

    公开(公告)号:CN117294894A

    公开(公告)日:2023-12-26

    申请号:CN202311150398.2

    申请日:2023-09-07

    Applicant: 华侨大学

    Abstract: 本发明提供一种视频目标编辑方法、终端设备及存储介质,方法包括:获取视频信息、目标编辑操作、目标编号和视频目标参数;使用视频实例分割算法对视频中的帧图像进行目标分割,得到目标的像素级信息;输出对应操作和编号的相应图片列表,根据目标编辑操作,输出原帧列表、目标二值掩码列表、平移目标帧列表、平移目标二值掩码列表、缩放目标帧列表或缩放目标二值掩码列表;使用视频图像修复算法对视频画面进行修复,根据目标编辑操作,输出删除修复视频、平移修复视频列表或缩放修复视频。本发明能够更方便、高效及精确地实现视频目标编辑。

Patent Agency Ranking