-
公开(公告)号:CN116935118A
公开(公告)日:2023-10-24
申请号:CN202310889773.9
申请日:2023-07-19
Applicant: 南京林业大学
IPC: G06V10/764 , G06V10/774 , G06V10/80 , G06V10/82 , G06V10/42 , G06V10/44 , G06V40/10 , G06V20/52 , G06N3/0464 , G06N3/084
Abstract: 本发明公开了一种轻量级鸟类分类模型的设计方法和系统,通过鸟类分类,可以有效地预测某地区鸟类种群变化,对当地生态评估具有一定作用。具体包括以下步骤:收集各鸟类图片进行预处理,转化为模型的训练数据;采用多尺度特征融合模块处理图片的不同特征信息;引入SE模块,提高模型对图像信道信息的感知能力;引入CA模块来考虑图像的信道和空间特性;进行迭代训练,生成轻量级鸟类分类模型;将模型部署到嵌入式智能设备中,实现对自然环境中鸟类的监测与识别。本发明设计的模型泛化能力强、准确性高、复杂度低。此外,采用多通道特征融合结构来提高网络对多通道尺度信息提取的适应性,引入SE和CA模块,增强了模型对全局特征的提炼能力。
-
公开(公告)号:CN120032122A
公开(公告)日:2025-05-23
申请号:CN202411914323.1
申请日:2024-12-24
Applicant: 南京林业大学
Abstract: 本发明公开了一种适用于低光环境的盾构隧道漏水图像分割方法、存储介质及设备,适用于低光环境的盾构隧道漏水图像分割方法包括:获取低光环境下盾构隧道的实时sRGB图像;对获取到的实时sRGB图像进行逆操作,得到伪RAW格式图像;将得到的伪RAW格式图像输入预先训练的实例分割模型,分割得到盾构隧道的漏水病害区域图像。本发明能够在极低光环境下快速分割出盾构隧道的漏水病害区域的图像,实现漏水病害检测。
-
公开(公告)号:CN116955989A
公开(公告)日:2023-10-27
申请号:CN202310889983.8
申请日:2023-07-19
Applicant: 南京林业大学
IPC: G06F18/213 , G06F18/214 , G06F18/24 , G06N3/0464 , G06N3/048 , G06N3/047 , G06N3/08 , G10L17/26 , G10L25/30
Abstract: 本发明公开了基于神经网络结构搜索的鸟鸣特征提取与识别模型设计,通过对该模型的训练可以准确地识别鸟类种类,在生物多样性的调查和保护中起着促进作用。本发明提出的深度学习模型,通过利用改良的可微架构搜索,神经网络可以进行自我优化,并以低计算成本选择最佳模型。此外,将推理时间纳入算法中,作为损失函数的一部分,以确定梅尔滤波器组的最佳数量。实验测试结果表明,本模型在包含264种鸟类的数据集上,平均准确率达到92.44%,最大准确率达到98.14%,同时确定了36种作为梅尔滤波器组的最佳数量,模型在横向和纵向上都优于传统深度学习模型。
-
公开(公告)号:CN116504253A
公开(公告)日:2023-07-28
申请号:CN202310498901.7
申请日:2023-05-05
Applicant: 南京林业大学
Abstract: 本发明公开了一种基于频率动态卷积模型的鸟类声音识别方法和系统,通过统计森林鸟类种群数量的变化,对区域进行生态评估。包括以下步骤:集各类鸟类声音信号,进行降噪处理;提取声音特征生成Log‑mel特征谱图供深度学习模型训练;应用频率动态卷积处理特征谱图;采用多尺度特征融合模块结合特征谱图不同层次的特征信息;引入CA注意力机制将图片位置信息加入到通道注意力;训练生成模型;将模型部署在AI设备中,监测鸟类声音并输出鸟类识别结果。本发明提出的模型采用频率动态卷积,特征融合和CA注意力机制,可部署在运算能力有限的嵌入式AI设备中,并在较少参数量和较低计算量的条件下,保证鸟类声音识别的准确率。
-
-
-