多层次跨模态协同特征编码器结构

    公开(公告)号:CN118967468A

    公开(公告)日:2024-11-15

    申请号:CN202410964160.1

    申请日:2024-07-17

    Inventor: 刘明珠 孟祥博

    Abstract: 本发明聚焦于多模态图像融合领域,提出一种多层次跨模态协同特征编码器结构。步骤1:将红外数据集与可见光数据集进行尺寸归一化处理;步骤2:将红外图像和可见光图像分别输入到Transformer进行初步融合及提取特征;步骤3:将红外图像和可见光图像输入到CNN网络进行融合及提取特征;步骤4:将两种网络提取出的特征通过CBAM模块进行空间和通道注意力加权后融合。在本发明中,针对多模态特征融合效果不佳的问题,将两种网络分别提取特征后通过CBAM模块进行空间和通道注意力加权,有效保留红外图像在低光、夜间等恶劣情况下的热辐射信息和可见光图像的细节和颜色信息,可用于军事侦察、安防系统、医学诊断等领域。

    一种低照度环境交通标志检测与识别方法

    公开(公告)号:CN115880663A

    公开(公告)日:2023-03-31

    申请号:CN202211187053.X

    申请日:2022-09-28

    Inventor: 刘明珠 陈俊羽

    Abstract: 一种低照度环境交通标志检测与识别方法,属于图像识别算法领域。现有的图像增强算法大多都依赖手工精心设计约束条件和参数,应用在不同场景可能会受到模型容量的限制,并且在处理单张图像会比较耗时,无法较快地批量处理低光照图像。一种低照度环境交通标志检测与识别方法,搭建Tensorflow框架,选取Retinex‑Net的分解‑增强网络作为基本架构,将标准卷积层替换为深度可分离卷积层,设计改进的Retinex‑Net低照度图像增强算法;在Retinex‑Net中引入注意力机制及其深层连接;重构Retinex‑Net网络模型;对获得的重构的Retinex‑Net分解‑增强网络损失函数进行改进。本发明设计的改进后的Retinex‑Net明显提升了低照度图像的增强效果,有利于进一步提升弱光照环境下的交通标志的识别准确率。

    一种建立基于改进U-Net网络的颈部超声图像分割方法

    公开(公告)号:CN114943721A

    公开(公告)日:2022-08-26

    申请号:CN202210638084.6

    申请日:2022-06-07

    Abstract: 一种建立基于改进U‑Net网络的颈部超声图像分割方法,属于图像分割算法领域。现有的图像分割方法在医疗图像上应用不足的问题。一种建立基于改进U‑Net网络的颈部超声图像分割方法,构建颈部超声图像数据集,数据集包括train部分和test部分;对数据集进行预处理;所述的预处理包括对图像进行滤波、图像增强和去噪;引入三个SE模型扩展结构,改进U‑Net网络结构;引入三个SE模型扩展结构从信道和空间两个维度提升网络的分割性能,利用可变形卷积块作为U‑Net网络的编码器和编码器分别进行图像的上采样和下采样,加入Droupout层,防止过拟合;并进行改进损失函数的操作。本发明方法建立的图像分割方法提升了图像分割效果。

    一种基于深度学习的口罩遮挡条件下人脸识别方法

    公开(公告)号:CN114821745A

    公开(公告)日:2022-07-29

    申请号:CN202210568492.9

    申请日:2022-05-23

    Inventor: 刘明珠 邱志强

    Abstract: 一种基于深度学习的口罩遮挡条件下人脸识别方法,属于人脸识别技术领域。所述方法为:采集人脸图片,并获得该图片的特征向量,对获取的图片中的人脸数据进行预处理,消除由于采取的原始图像受到各方面的干扰;对预处理后获取的人脸数据进行划分作为训练集和测试集,而通过MobileNet作为特征提取网络对采集的人脸数据进行特征提取;在GPU1080下,搭建CAFFE深度学习框架,训练口罩人脸识别深度学习模型;利用训练好的口罩人脸识别深度学习模型对步骤二的人脸数据进行识别。本方法中使用了轻量级的MobileNet作为深度学习的特征提取网络,MobileNet的网络拥有更小的体积,更少的计算量,更高的精度,更快的速度在神经网络中拥有极大的优势。

    一种用于图像识别的自适应算法
    5.
    发明公开

    公开(公告)号:CN114818977A

    公开(公告)日:2022-07-29

    申请号:CN202210571522.1

    申请日:2022-05-24

    Inventor: 邱志强 刘明珠

    Abstract: 本发明一种用于图像识别的自适应算法属于智能图像识别领域。包括以下步骤:采集三基色模型图像;将使用多尺度引导滤波算法估计出对应分量的照度分量;引入反射分量,将所述照度分量和反射分量进行调整,进行融合调整后,输出最新图像;在本发明一种用于图像识别的自适应算法作用下,本算法利用主成分分析对图像进行数据分析,寻找最优特征,将多余有瑕疵特征去除;然后利用算法生成初始种群,算法使种群均匀分布在求解区域,为提升整体搜寻速度,采用对遗传算法进行改进;依据适应度值自适应变化的交叉与变异概率确保种群多样性,提升寻优效率和识别率;最后进行人工分析和大数据分析对比计算,进行图像目标分类。

    基于车辆安全通信的自适应速率选择算法

    公开(公告)号:CN108900276A

    公开(公告)日:2018-11-27

    申请号:CN201711427622.2

    申请日:2017-12-26

    Inventor: 刘明珠 陈洪恒

    Abstract: 基于车辆安全通信的自适应速率选择算法。但是运用模糊决策根据衰落丢包和干扰丢包来进行数据传输速率的选择时,需要设计大量的模糊规则和参数集,对于设计者来说是非常繁杂甚至是无法完成的工作。本发明的基于车辆安全通信的自适应速率选择算法,初始化所有参数,将PLRAVG、PLRINT,和PLRFAD都赋为0,最优速率设为基础速率(3Mbps);根据信道对称性原理,各个节点在本地采用Sym2PLR进行平均丢包PLRAVG的估算;根据应用层计算的各个节点相对距离,采用Dis2PLR进行衰落丢包PLRFAD的估算;根据前两步计算的丢包率,得到干扰对丢包造成的影响PLRINT;采用模糊决策FuzzyRateSelection,根据PLRFAD和PLRINT得到当前环境下最优的速率BestBitRate并返回。本发明简化了模糊系统的设计复杂度。

    一种多维远程依赖捕捉与位置感知的腹部多器官分割方法

    公开(公告)号:CN118968054A

    公开(公告)日:2024-11-15

    申请号:CN202410964148.0

    申请日:2024-07-17

    Inventor: 刘明珠 杨春燕

    Abstract: 本发明属于医学图像分割领域,特别涉及一种多维远程依赖捕捉与位置感知的腹部多器官分割方法。步骤1:腹部CT图像预处理;步骤2:采用三维交互TDI‑UNet网络进行语义特征的提取;步骤3:编解码对应层特征融合与细化;步骤4:输出分割结果。提出一种多维远程依赖捕捉与位置感知模块,将每次上采样后的特征图送入该模块,分别沿三个空间维度独立聚合特征,生成方向感知和位置敏感的注意映射,每个注意映射既可捕获输入特征其一空间方向上的远程依赖,又可保留其它两个空间方向上的位置信息。利用这种多维交互作用,模型可以更好地捕捉三维图像在空间中的位置和结构信息,增强对器官边界和小尺寸器官的识别能力,从而提高腹部多器官分割任务的整体性能。

    基于无锚框的鱼眼图像行人检测方法

    公开(公告)号:CN117542081A

    公开(公告)日:2024-02-09

    申请号:CN202311602389.2

    申请日:2023-11-28

    Inventor: 刘明珠 宋诗杰

    Abstract: 本发明涉及视频图像中的行人检测的技术领域,且公开了一种无锚框结构的旋转框行人检测算法,包括步骤:输入图像,主干网络YOLOv8负责提取输入帧中的特征,骨干网络采用残差结构,能更好地捕捉输入图像的细节和特征,并输出3个不同尺度的特征图。FishEyeASF模块负责自适应多尺度特征融合,多尺度特征融合网络部分采用特征金字塔网络,通过自适应学习特征融合,过滤其他层次相关性较弱的特征。最终,将特征图传入检测头网络生成热图,能更好地捕捉输入图像的细节和特征,增强了融合特征的判别能力,提高了特征的尺度不变性,能够更好地处理特征的不确定性和变化。

    一种基于B-spline的图像拼接特征点提取算法

    公开(公告)号:CN112884649A

    公开(公告)日:2021-06-01

    申请号:CN202110165739.8

    申请日:2021-02-06

    Inventor: 刘明珠 陈瑞

    Abstract: 一种基于B‑spline的图像拼接特征点提取算法,属于图像处理领域。在进行图像融合时,图像中的物体会产生尺度上的变化,会使得特征点匹配的正确率低。一种基于B‑spline的图像拼接特征点提取算法,对采集到的不同图像进行预处理;利用B样条函数构造B‑spline图像金字塔尺度空间;基于构造的尺度空间,在尺度空间每层金字塔上采用Fast算法提取图像中特征点,采用Shi‑Tomasi角点响应函数按角点响应值排序,选取前N个特征点,使用BRIEF描述法对特征点进行描述;通过描述子对图像进行不同图像的特征点匹配;采用基于最佳接缝线的拉普拉斯融合技术,将不同图像进行融合。本发明方法在图片融合时,图片尺度不变性的前提下,比传统ORB算法的匹配准确率提升40%,具有良好的匹配性能。

    基于Gabor滤波器的文字信息特征提取与识别方法

    公开(公告)号:CN106778732A

    公开(公告)日:2017-05-31

    申请号:CN201710027704.1

    申请日:2017-01-16

    CPC classification number: G06K9/2054 G06K9/3266 G06K9/4609

    Abstract: 基于Gabor滤波器的文字信息特征提取与识别方法。现有的视频和图像中文本信息的提取技术效率较低的问题。本发明通过以下步骤实现:设计Gabor滤波器,设计并训练DBN分类网络,运用形态学的方法,对定位后的图像进行去噪、空洞区域的填充以及孤立点的剔除操作,使定位的文本图像更加精确,并将最终去噪后的文本定位二值图像映射到原始视频帧图像上,得到准确的文本定位区域;对定位并且处理后的准确的文本定位区域,进行文本增强、二值化处理、归一化与特征提取操作;运用OCR识别技术对经步骤四处理后的文本进行识别。本发明能更加精准的提取视频和图像中文本信息。

Patent Agency Ranking