一种基于事件级检测技术的呼吸音识别方法

    公开(公告)号:CN119601036A

    公开(公告)日:2025-03-11

    申请号:CN202510122041.6

    申请日:2025-01-26

    Applicant: 南昌大学

    Abstract: 本发明提供了一种基于事件级检测技术的呼吸音识别方法,属于音频信号识别技术领域。针对现有方法对呼吸音事件检测不准确的问题,本发明提供的一种基于事件级检测技术的呼吸音识别方法,基于分层令牌语义音频Transformer构建呼吸音识别模型检测异常呼吸音事件,提高了呼吸音事件的检测准确度和速度,从而提高临床呼吸疾病的诊断效率。

    一种基于低秩适配的呼吸音分类方法及系统

    公开(公告)号:CN119337190A

    公开(公告)日:2025-01-21

    申请号:CN202411885266.9

    申请日:2024-12-20

    Applicant: 南昌大学

    Abstract: 本发明提供了一种基于低秩适配的呼吸音分类方法及系统,涉及人工智能和语音信号处理技术领域,包括:获取并预处理呼吸音数据,将预处理后的呼吸音数据进行截断,对低于预设时长的数据进行循环填充;对固定长度的呼吸音数据依次进行分帧、加窗、快速傅里叶变换并加入梅尔滤波器获取梅尔频谱;在预训练的AST模型内的每一层编码器层都注入可训练的低秩分解矩阵获取更新后的注意力权重;对初始低秩分解矩阵分别进行高斯分布初始化和零矩阵初始化,对应获得高斯分布矩阵和零矩阵,并为查询、键和值注入高斯分布矩阵和零矩阵,对预训练的AST模型进行训练,获取训练好的AST模型;将固定长度的呼吸音数据输入至训练好的AST模型中,基于评价指标获取分类结果。

    一种基于改进的Swin-Transformer的呼吸音自动分类方法

    公开(公告)号:CN116246654A

    公开(公告)日:2023-06-09

    申请号:CN202310104612.4

    申请日:2023-02-13

    Applicant: 南昌大学

    Abstract: 本发明公开了一种基于改进的Swin‑Transformer的呼吸音自动分类方法,属于音频信号识别领域,包括三个步骤。步骤A:准备ICBHI 2017数据集,分为四类呼吸音:正常呼吸音、哮鸣音、爆裂音、哮鸣音和爆裂音。步骤B:音频信号预处理。首先对音频信号进行下采样并采用五阶巴特沃斯带通滤波器滤除心音等干扰。其次,对音频信号进行智能填充。最后采用短时傅里叶变换生成声谱图同时剪切黑色区域生成数据集。步骤C:采用训练数据对改进的Swin‑Transformer网络进行训练。利用混淆矩阵显示Swin‑Transformer网络四分类呼吸音的预测结果。本发明为呼吸音自动分类提供了一种新的改进方案,有利于促进呼吸音识别设备的发展。

Patent Agency Ranking