一种基于视觉和文本提示的零部件异常检测方法

    公开(公告)号:CN119719957A

    公开(公告)日:2025-03-28

    申请号:CN202411940050.8

    申请日:2024-12-26

    Applicant: 重庆大学

    Abstract: 本发明公开了一种基于视觉和文本提示的零部件异常检测方法,属于零部件检测技术领域,包括S1、获取零部件的视觉和文本提示数据;S2、将步骤S1中的视觉和文本提示数据,利用视觉‑文本预训练模型计算零部件的视觉特征和文本特征;S3、采用多模态融合模块将零部件的视觉特征和文本特征进行融合得到多模态融合特征;S4、根据多模态融合特征计算异常检测结果;S5、将多模态融合特征信息蒸馏到视觉分支;S6、将零部件的图像输入至视觉分支计算异常检测结果;本发明提供的一种基于视觉和文本提示的零部件异常检测方法,利用视觉‑语言预训练模型的鲁棒性和泛化性,可以在有限的零部件图像样本和文本描述作为训练数据时达到良好的异常检测效果。

    基于源域与频域结合的多尺度CNNs肺结节假阳性剔除方法

    公开(公告)号:CN112529870B

    公开(公告)日:2024-04-12

    申请号:CN202011457953.2

    申请日:2020-12-10

    Applicant: 重庆大学

    Abstract: 本发明涉及一种基于源域与频域结合的多尺度CNNs肺结节假阳性剔除方法,属于图像处理领域。包括以下步骤:S1:为减小网络训练时间和占用空间使用基于多视角二维CT图像作为输入;S2:将肺结节图像从源域转换到频域以捕获结节微小变化;S3:提出基于多视角二维CT图像的3D多尺度CNNs框架;S4:肺结节假阳性剔除模型训练损失函数设计。通过基于空域‑频域信息结合的多尺度神经网络框架来增强低像素二维CT图像的表示能力,同时减轻网络的训练负担。

    一种基于改进谱减法的语音去噪方法

    公开(公告)号:CN116959475A

    公开(公告)日:2023-10-27

    申请号:CN202310837044.9

    申请日:2023-07-10

    Applicant: 重庆大学

    Abstract: 本发明公开了一种基于改进谱减法的语音去噪方法,包括以下步骤:输入带噪语音,对带噪语音的信号进行预处理,将信号从时域维度转换到帧维度;采用傅里叶变换,获取信号全段频谱;逐帧计算人声所在子频带的频谱能量占比;生成语音屏蔽掩码,估计噪声;根据调节因子划分语音浊音、语音清音和噪声;对语音浊音、语音清音、噪声进行谱减后权重修正。本发明一种基于改进谱减法的语音去噪方法,能够实时的、有效的抑制平稳和非平稳噪声,显著提升语音信噪比,同时能够保证语音信号有效部分不受前端去噪带来的失真影响,适用于各语音任务下系统的前端去噪,提升系统处理速率及性能。

    一种基于三维CT影像的肺结节检测方法

    公开(公告)号:CN112634210A

    公开(公告)日:2021-04-09

    申请号:CN202011455228.1

    申请日:2020-12-10

    Applicant: 重庆大学

    Abstract: 本发明涉及一种基于三维CT影像的肺结节检测方法,属于图像处理领域。该方法包括以下步骤:S1:构建数据集及其预处理;S2:搭建肺结节检测训练模型;S3:使用经过强化的CT图像数据集训练网络模型;S4:使用训练完成的网络模型在测试集上进行预测。采用多种CT图像数据增强方法和新型深度卷积神经网络结构,充分利用三维肺部CT影像的空间信息,优化神经网络参数规模,既保证了各尺寸等级肺结节检测的查准率和查全率,也明显提升了检测效率,使得算法的实用性有了巨大提升。

    一种基于多尺度特征融合的肺结节识别分类方法

    公开(公告)号:CN112633336A

    公开(公告)日:2021-04-09

    申请号:CN202011455251.0

    申请日:2020-12-10

    Applicant: 重庆大学

    Abstract: 本发明涉及一种基于多尺度特征融合的肺结节识别分类方法,属于图像处理领域。该方法包括以下步骤:S1:建立训练样本;S2:建立多尺度特征融合的肺结节良恶性分类模型;该分类模型由有三个尺度的深度卷积神经网络分类模型组成,每个模型分为特征提取部分、良恶性分类部分和特征融合部分;S3:训练肺结节分割模型。该方法能够自动提取结节的高层次特征,更加准确、快速地识别和分类肺结节。

    基于流形映射与字典学习的高维图像数据降维方法

    公开(公告)号:CN110648276A

    公开(公告)日:2020-01-03

    申请号:CN201910913668.8

    申请日:2019-09-25

    Applicant: 重庆大学

    Abstract: 本发明涉及一种基于流形映射与字典学习的高维图像数据降维方法,包括以下步骤:S1:定义并说明待处理的高维图像数据集和对应的低维映射;随机抽取部分数据作为新的训练数据集X1;S2:用基于稀疏表示约束的拉普拉斯特征映射LE方法计算训练数据集X1的低维映射Y1;S3:从X1中随机选取M个点,初始化标签字典,记为DH;S4:用X1和Y1作为训练数据集计算DH和C;S5:根据局部约束字典学习LCDL的前提假设计算得到DL,采用局部约束与标签映射的字典学习方法来提高字典的判别性并完善字典的局部和标签信息;S6:基于以上步骤得到的DH、DL和C,计算新进入的高维图像数据x的低维映射y。

    一种基于字典学习的滚动轴承故障特征提取方法

    公开(公告)号:CN109060350A

    公开(公告)日:2018-12-21

    申请号:CN201811027613.9

    申请日:2018-09-04

    Applicant: 重庆大学

    Abstract: 本发明公开了一种基于字典学习的滚动轴承故障特征提取方法,为信号处理领域。包括:从安装在轴承上的传感器获取振动信号,表示为s,记采样频率为fs;采用谐波分离滤波器,将s中含有的其他机构振动产生的谐波分量除去,得到处理信号y;对信号y进行Shift‑Invariant K‑SVD字典学习,得到稀疏表示和最佳字典,根据稀疏表示和字典重建恢复纯净故障信号x。对信号x进行包络谱变换,得到轴承故障振动信号的频率特征。本方法采用了稀疏表示方法能及时准确提取出早期的微弱故障特征,相比于传统的信噪分离方法有更好的鲁棒性和准确性,对滚动轴承故障判断及维修决策提供强有力支撑。

    一种基于SAE和稀疏表示的图像超分辨率方法

    公开(公告)号:CN104778671B

    公开(公告)日:2017-09-22

    申请号:CN201510191149.7

    申请日:2015-04-21

    Applicant: 重庆大学

    Abstract: 本发明公开了一种基于SAE和稀疏表示的图像超分辨率方法,属于图像处理领域。该方法主要包含离线训练与测试重构两个阶段,前者主要通过对稀疏自编码SAE模型提取的图像特征进行字典训练,建立反映高低分辨率图像特征对应关系的字典对,后者则利用获得的字典以及稀疏表示方法对用户输入的低分辨率图像进行超分辨率重建。该方法使用SAE模型对原始图像采样数据进行无监督学习训练,避免了传统人工设计特征提取算子时费时费力以及提取特征单一的弊端,同时将SAE压缩表示的图像特征直接用于高低字典对的训练,有利于字典训练的进行,而使用稀疏表示方法可以估计图像中丢失的细节成分,方便从低分辨率图像中恢复更高质量的高分辨率图像。

Patent Agency Ranking