一种基于Mel声谱图与改进SEResNet的鱼类行为识别方法

    公开(公告)号:CN116994602B

    公开(公告)日:2024-10-11

    申请号:CN202311019925.6

    申请日:2023-08-14

    Abstract: 本发明提出一种基于Mel声谱图与改进SEResNet的鱼类行为识别方法,包括采集养殖水域中的鱼类音频信号,对鱼类音频信号进行预处理;通过Mel声谱图特征提取方法对预处理后的鱼类音频信号进行声音特征提取,得到鱼类音频的Mel声谱图特征信息;构建TAP‑SEResNet模型,包括SEResNet模块、SE注意力机制模块、TAP模块、全连接层模块和Softmax分类器模块;将Mel声谱图特征信息输入TAP‑SEResNet模型中,得到鱼类声音信息特征;将鱼类声音信息特征输入TAP模块,得到深层声音特征向量;将深层声音特征向量输入全连接层模块得到声音特征整合信息;将声音特征整合信息输入Softmax分类器模块进行分类,输出鱼类行为识别结果。本发明能够能够减少关键信息丢失,且能够处理声音细节特征,使鱼类行为识别精度提高。

    一种基于自适应选择光流的水下鲁棒视频中鱼类目标分割方法

    公开(公告)号:CN118262228B

    公开(公告)日:2024-10-11

    申请号:CN202410462719.0

    申请日:2024-04-17

    Abstract: 本发明属于鱼类目标识别技术领域,提出一种基于自适应选择光流的水下鲁棒视频中鱼类目标分割方法,包括获取鱼类水下数据集,并将光流数据抽取出来;对视频帧和光流数据进行特征提取,并进行全局的质量评估和融合,得到多个层级的融合特征;对最高层的融合特征进行多尺度特征提取,在coarse‑to‑fine的解码器结构里设计嵌入了多维注意力模块,使用粗略定位图作为引导,得到解码器特征,并输出鲁棒水下鱼类分割模型;通过多输出选择性融合方法和鲁棒水下鱼类分割模型并融合得到预测结果;进行交叉熵损失计算和训练,得到鱼类目标分割系统;将待进行鱼类目标分割的鱼类水下视频输入鱼类目标分割系统中,得到鱼类目标分割结果。本发明能够得到更精准的分割结果。

    一种基于改进YOLOv7模型的鱼类目标个体位置检测方法

    公开(公告)号:CN117237986A

    公开(公告)日:2023-12-15

    申请号:CN202311164828.6

    申请日:2023-09-08

    Abstract: 本发明提出一种基于改进YOLOv7模型的鱼类目标个体位置检测方法,包括采集养殖水域中的图像作为待检测图像,将待检测的图像进行预处理和增强操作,得到数据增强图像数据集;在YOLOv7模型的SPPCSPC模块后添加BiFomer注意力机制模块,在YOLOv7模型的损失函数模块中添加NWD损失函数模块,得到改进YOLOv7模型;将预处理后得到的数据增强图像数据集输入到改进YOLOv7模型中,通过数据增强图像数据集训练改进YOLOv7模型,得到训练好的改进YOLOv7模型;将待检测的采集养殖水域图像输入训练好的改进YOLOv7模型中,得到鱼类目标个体的位置信息。本发明提高了在浑浊水域高密度鱼群中鱼类目标个体位置的检测精确率和召回率。

    一种基于多模态交互融合网络的鱼类行为识别方法

    公开(公告)号:CN118587539A

    公开(公告)日:2024-09-03

    申请号:CN202410624733.6

    申请日:2024-05-20

    Abstract: 本发明属于智能识别技术领域,提出了一种基于多模态交互融合网络的鱼类行为识别方法,要点在于构建包括全局平均池化层模块、多模态学习及融合模块、TAP模块、全连接层模块和Softmax分类器模块的Mul‑SEResNet50模型;将图像数据和Mel声谱图特征数据输入全局平均池化层模块得到视觉特征和声音特征;将视觉特征和声音特征输入多模态学习及融合模块得到多模态融合特征;将多模态融合特征输入TAP模块得到深层多模态融合特征向量;将深层多模态融合特征向量输入全连接层模块得到多模态融合特征整合信息;将多模态融合特征整合信息输入Softmax分类器模块,输出鱼类行为识别结果。本发明充分利用不同模态的信息,且能够更好地保留鱼类声音的最佳特征信息,识别准确率较高。

    一种基于Mel声谱图与改进SEResNet的鱼类行为识别方法

    公开(公告)号:CN116994602A

    公开(公告)日:2023-11-03

    申请号:CN202311019925.6

    申请日:2023-08-14

    Abstract: 本发明提出一种基于Mel声谱图与改进SEResNet的鱼类行为识别方法,包括采集养殖水域中的鱼类音频信号,对鱼类音频信号进行预处理;通过Mel声谱图特征提取方法对预处理后的鱼类音频信号进行声音特征提取,得到鱼类音频的Mel声谱图特征信息;构建TAP‑SEResNet模型,包括SEResNet模块、SE注意力机制模块、TAP模块、全连接层模块和Softmax分类器模块;将Mel声谱图特征信息输入TAP‑SEResNet模型中,得到鱼类声音信息特征;将鱼类声音信息特征输入TAP模块,得到深层声音特征向量;将深层声音特征向量输入全连接层模块得到声音特征整合信息;将声音特征整合信息输入Softmax分类器模块进行分类,输出鱼类行为识别结果。本发明能够能够减少关键信息丢失,且能够处理声音细节特征,使鱼类行为识别精度提高。

    一种基于自适应选择光流的水下鲁棒视频中鱼类目标分割方法

    公开(公告)号:CN118262228A

    公开(公告)日:2024-06-28

    申请号:CN202410462719.0

    申请日:2024-04-17

    Abstract: 本发明属于鱼类目标识别技术领域,提出一种基于自适应选择光流的水下鲁棒视频中鱼类目标分割方法,包括获取鱼类水下数据集,并将光流数据抽取出来;对视频帧和光流数据进行特征提取,并进行全局的质量评估和融合,得到多个层级的融合特征;对最高层的融合特征进行多尺度特征提取,在coarse‑to‑fine的解码器结构里设计嵌入了多维注意力模块,使用粗略定位图作为引导,得到解码器特征,并输出鲁棒水下鱼类分割模型;通过多输出选择性融合方法和鲁棒水下鱼类分割模型并融合得到预测结果;进行交叉熵损失计算和训练,得到鱼类目标分割系统;将待进行鱼类目标分割的鱼类水下视频输入鱼类目标分割系统中,得到鱼类目标分割结果。本发明能够得到更精准的分割结果。

    一种改进YOLOv8模型的养殖鱼群中鱼类目标个体的位置检测方法

    公开(公告)号:CN117058232A

    公开(公告)日:2023-11-14

    申请号:CN202310933832.8

    申请日:2023-07-27

    Abstract: 本发明提出一种改进YOLOv8模型的养殖鱼群中鱼类目标个体的位置检测方法,采集养殖水域中的图像作为待检测图像并进行预处理;改进YOLOv8模型;将预处理后的图像输入到改进YOLOv8模型中得到特征图;通过预测目标的中心点坐标和边界框的尺度定位目标,得到原始图像上的候选预测框,并计算候选预测框的得分;根据候选预测框的得分,选取候选预测框中得分较高的一部分作为候选框,并且根据非极大值抑制算法去除重复的候选框,得到预测框;根据预测框检测预测框中鱼类目标个体的位置和大小以及鱼类目标个体的的类别,得到最终的目标检测结果,包括鱼类个体目标的位置信息和鱼类个体目标类别信息。本发明提高了养殖鱼群中鱼类目标个体的位置检测的准确性。

Patent Agency Ranking