基于多色域选择性形态学处理的视频图像肤色检测方法

    公开(公告)号:CN101251890A

    公开(公告)日:2008-08-27

    申请号:CN200810017703.X

    申请日:2008-03-13

    Abstract: 本发明公开了一种基于多色域选择性形态学处理的视频图像肤色检测方法,其特征在于,引入数学形态学处理技术,输入视频图像数据经两个并行的基于RGB色域和基于YUV色域肤色检测模块,在寄存器操作管理模块MCU的控制下,分别在RGB和YUV彩色空间对图像中的像素进行分析、选择和粗判断是否为人体肤色像素,检测结果由肤色检测综合判断模块进行综合判断分析,然后在选择性形态学滤波模块中对判决得到的二值图像进行基于内容信息的选择性形态学滤波,最后根据用户需要在寄存器操作管理模块MCU的控制下对检测到的肤色进行保护或处理,得到符合人眼视觉习惯的图像。

    一种稀疏片上训练硬件加速器架构及其实现方法

    公开(公告)号:CN118760651A

    公开(公告)日:2024-10-11

    申请号:CN202410984295.4

    申请日:2024-07-22

    Abstract: 本发明公开了一种稀疏片上训练硬件加速器架构及其实现方法,该加速器架构包括:片外DRAM、片上存储系统、计算控制器FSM Ctrl、前向传播和反向误差传播计算单元阵列FP/EPPE、权重梯度生成计算单元阵列WG PE、批归一化层计算模块ACBN、稀疏矩阵数据压缩模块flag‑CSR以及激活与池化计算模块;该方法包括:利用奇异值分解SVD对深度卷积神经网络DCNN模型中的权值矩阵进行低秩分解,并采用2n量化和保留高位宽精度相结合的混合精度数据量化方案,并设计前向传播和反向误差传播计算单元阵列FP/EP PE以及权重梯度生成计算单元阵列WG PE硬件逻辑电路,最后设计外围控制与存储电路并组合得到稀疏片上训练硬件加速器。本发明能够有效减少系统的硬件耗费,改善能量效率。

    一种用于图像盲超分辨率增强网络的退化核提取方法

    公开(公告)号:CN114998666B

    公开(公告)日:2024-08-06

    申请号:CN202210467732.6

    申请日:2022-04-29

    Abstract: 本发明公开了一种用于图像盲超分辨率增强网络的退化核提取方法,包括以下步骤:S1:使用随机参数各向异性高斯核作为真实退化核对高分辨率图像进行模糊处理并下采样得到低分辨率图像;S2:将低分辨率图像输入至退化表征学习网络中提取其退化核;S3:使用提取的退化核和对应的真实退化核分别对低分辨率图像模糊处理并下采样得到重下采样图像对;S4:计算重下采样图像对之间的误差值和退化核之间的误差值,使用二者加权之和作为总误差值对退化表征学习网络进行约束训练。本发明提供的用于图像盲超分辨率增强网络的退化核提取方法,能有效地提取低分辨率图像中的退化核,将其应用于图像盲超分辨率增强技术中可得到更好的重建效果。

    一种半在线机置的多目标跟踪方法

    公开(公告)号:CN112116634B

    公开(公告)日:2024-05-07

    申请号:CN202010754142.2

    申请日:2020-07-30

    Abstract: 一种半在线机置的多目标跟踪方法,根据行人或运动目标视频,得到行人或运动目标的检测框,在一段时间窗口内,根据检测框之间的位置变化信息,得到卡尔曼序列谱,根据卡尔曼序列谱找到一对卡尔曼头,通过外观模型、运动模型与尺寸变化模型的相似度,得到下一帧中要追踪的目标或运动物体的检测框,并使得该目标或运动物体处于该帧内的检查框中,否则表示该目标被跟丢;对相似度高于阈值的检测框,拼接到卡尔曼序列谱中,并更新卡尔曼序列谱中的运动模型和外观模型,追踪下一帧内的行人或运动物体目标。适用于任何轨迹拼接式的多目标跟踪算法,即不受限与多个目标如行人、运动物体等产生的不同轨迹的约束,可以有效提升跟踪精度,降低身份转换值。

    基于注意力机制的多尺度神经网络红外图像彩色化方法

    公开(公告)号:CN114581560B

    公开(公告)日:2024-04-16

    申请号:CN202210199669.2

    申请日:2022-03-01

    Abstract: 本发明公开了一种基于注意力机制的多尺度神经网络红外图像彩色化方法,该方法首先利用二维卷积神经网络在不同分辨率尺度下对输入的红外图像对进行特征提取,然后通过注意力机制对提取出的高维特征信息进行提炼处理,最终将多尺度信息进行融合处理得到预测的彩色化红外图像。与现有的红外图像彩色化网络相比,本发明基于注意力机制与多尺度层次化结构构建神经网络算法模型,通过采用改进的空间注意力与多维特征连结机制,能够提高网络模型特征提取能力的同时有效降低模型复杂度,通过设计像素损失、边缘损失和感知损失的复合损失函数,进一步提高彩色化红外图像的质量。

    一种基于改进顶帽变换的红外小目标增强方法

    公开(公告)号:CN117808719A

    公开(公告)日:2024-04-02

    申请号:CN202311808586.X

    申请日:2023-12-26

    Abstract: 本发明公开了一种基于改进顶帽变换的红外小目标增强方法,旨在为目标检测和识别任务提供清晰且精确的图像基础。该方法创新性地引入了自适应结构元调整机制,允许根据图像特性对结构元大小进行优化,从而提升对不同目标和背景条件的适应能力。顶帽变换进一步被用于有效分离图像的前景和背景,以显著突出目标区域。此外,本发明采用分段伽马变换来调整灰度级别,通过细致的增强提高目标的可视性。算法还智能地根据背景特性选择合适的增益系数,确保在各类复杂环境下都能实现最佳的图像增强效果。通过这些技术的综合应用,本发明能够有效提升增强图像的质量,为后续的视觉处理任务奠定了坚实的基础。

    一种基于嵌入式平台的全景视频实时拼接方法

    公开(公告)号:CN116912147A

    公开(公告)日:2023-10-20

    申请号:CN202310973631.0

    申请日:2023-08-03

    Abstract: 本发明一种基于嵌入式平台的全景视频实时拼接方法,该方法基于的全景拼接设备包括可见光相机、视频处理板和结构件,可见光相机均匀分布于结构件侧立面,视频处理板用于接收可见光相机视频,对视频进行实时拼接,输出实时全景视频;该方法包括步骤:1)相机图像配准:采集可见光相机图像,通过对图像进行特征匹配,建立图像之间的几何对应关系;2)多相机参数全局优化:采用Levenberg‑Marquardt算法进行全局优化,最小化重投影误差;得到准确的单应矩阵和相机参数;3)图像融合:在拼接之前对图像进行投影变换,将所有像素映射到一个统一平面;之后采用基于拉普拉斯金字塔变换的图像融合方法,得到最终的融合图像。本发明实现了在嵌入式平台输出实时全景视频。

    基于自适应权重与目标感知的像素级实时多光谱图像融合方法

    公开(公告)号:CN116596822A

    公开(公告)日:2023-08-15

    申请号:CN202310601401.1

    申请日:2023-05-25

    Abstract: 本发明公开了基于自适应权重与目标感知的像素级实时多光谱图像融合方法,该方法包括如下过程:像素级实时多光谱图像融合:将红外图像与可见光图像在通道上进行拼接,得到拼接图像;对所述拼接图像进行自适应像素级权重生成,得到红外图像的融合权重图和可见光图像的融合权重图;将红外图像的融合权重图和红外图像进行逐元素乘法,得到第一图像;将可见光图像的融合权重图和可见光图像进行逐元素乘法,得到第二图像;将所述第一图像和第二图像进行逐元素加法,得到第三图像;将所述第三图像进行归一化,得到融合图像。本发明能够显著提升图像融合任务的处理速度,使其能够在资源受限的移动平台上实时部署。

    基于高斯-拉普拉斯金字塔的无监督学习X光图像增强方法

    公开(公告)号:CN112819716B

    公开(公告)日:2023-06-09

    申请号:CN202110130545.4

    申请日:2021-01-29

    Abstract: 基于高斯‑拉普拉斯金字塔的无监督学习X光图像增强方法,该方法首先使用高斯‑拉普拉斯金字塔算法生成高对比度高噪声图像XGL;然后,将原始图像Xori输入至X光图像增强网络中,得到网络输出图像Xnet;在整个过程中,使用对比度相似度损失函数计算图像Xnet与图像XGL之间的对比度相似度值,使用结构相似度损失函数计算图像Xnet与原始图像Xori之间的结构相似度值,将两者乘以相应的系数后相加得到总相似度值,不断迭代优化使之收敛至最小。最终完成优化,满足要求的生成图像Xnet即为最终的输出图像Xoutput。与现有X光图像增强方法相比,本发明处理后的图像对比度增强幅度合适、图像局部和整体的语义信息完整,同时处理后的图像结构平滑,噪声少,整体图像质量高。

Patent Agency Ranking