-
公开(公告)号:CN115050376B
公开(公告)日:2025-01-07
申请号:CN202210654424.4
申请日:2022-06-10
Applicant: 华南农业大学
IPC: G10L17/26 , G10L17/02 , G10L17/04 , G10L17/14 , G10L21/0232
Abstract: 本发明公开了一种基于Transformer声谱图特征学习的母牛发情检测方法及装置,方法包括:将采集母牛声音数据分割为等时长的声音片段并进行降噪;对降噪后的声音片段进行标注;将所有降噪后的声音片段转换为梅尔声谱图并进行数据增强;构建基于Transformer的声谱图特征学习模型,利用多头自注意力机制对数据增强后的梅尔声谱图进行学习,获取梅尔声谱图的深度特征;构建基于通道注意力机制的母牛发情声音事件检测模型,以梅尔声谱图的深度特征为输入,通过深度学习对深度特征中的时域线索进行分类并串联,实现母牛发情声音事件检测,最终输出发情事件发生的时刻和概率。本发明利用注意力机制对母牛的声音事件进行识别与定位,实现基于声音信号的母牛发情事件检测。
-
公开(公告)号:CN114937461A
公开(公告)日:2022-08-23
申请号:CN202210660972.8
申请日:2022-06-13
Applicant: 华南农业大学 , 广州市金宝生态农业有限公司
Abstract: 本发明公开了一种基于通道注意力与残差门控卷积的生猪声音事件检测方法及装置,方法包括,首先采集生猪声音数据,并对声音数据进行预处理;然后使用快速傅里叶变换,得到频谱图,并使用谱减法去除环境噪音;再使用单参数双门限端点检测方法,检测并裁剪得到频谱图中的含生猪声音的片段,将这些片段转换为梅尔频谱图;接下来构建基于通道注意力与残差门控卷积的深度特征提取器,提取基于梅尔频谱图的声音深度特征;最后,设计基于双向循环递归‑前馈神经网络的帧级别声音分类器,对声音的深度特征进行处理分析,由此呈现整段音频的生猪声音事件时域分布结果。本发明可精确快速地提取长时间、多噪音的养殖场环境内生猪声音事件时域分布结果。
-
公开(公告)号:CN114937461B
公开(公告)日:2024-12-03
申请号:CN202210660972.8
申请日:2022-06-13
Applicant: 华南农业大学 , 广州市金宝生态农业有限公司
IPC: G10L25/66 , G10L25/30 , G10L25/18 , G10L25/21 , G10L15/08 , G10L15/02 , G06N3/0442 , G06N3/045 , G06N3/0464 , G06N3/0985 , G06F18/241
Abstract: 本发明公开了一种基于通道注意力与残差门控卷积的生猪声音事件检测方法及装置,方法包括,首先采集生猪声音数据,并对声音数据进行预处理;然后使用快速傅里叶变换,得到频谱图,并使用谱减法去除环境噪音;再使用单参数双门限端点检测方法,检测并裁剪得到频谱图中的含生猪声音的片段,将这些片段转换为梅尔频谱图;接下来构建基于通道注意力与残差门控卷积的深度特征提取器,提取基于梅尔频谱图的声音深度特征;最后,设计基于双向循环递归‑前馈神经网络的帧级别声音分类器,对声音的深度特征进行处理分析,由此呈现整段音频的生猪声音事件时域分布结果。本发明可精确快速地提取长时间、多噪音的养殖场环境内生猪声音事件时域分布结果。
-
公开(公告)号:CN115050376A
公开(公告)日:2022-09-13
申请号:CN202210654424.4
申请日:2022-06-10
Applicant: 华南农业大学
IPC: G10L17/26 , G10L17/02 , G10L17/04 , G10L17/14 , G10L21/0232
Abstract: 本发明公开了一种基于Transformer声谱图特征学习的母牛发情检测方法及装置,方法包括:将采集母牛声音数据分割为等时长的声音片段并进行降噪;对降噪后的声音片段进行标注;将所有降噪后的声音片段转换为梅尔声谱图并进行数据增强;构建基于Transformer的声谱图特征学习模型,利用多头自注意力机制对数据增强后的梅尔声谱图进行学习,获取梅尔声谱图的深度特征;构建基于通道注意力机制的母牛发情声音事件检测模型,以梅尔声谱图的深度特征为输入,通过深度学习对深度特征中的时域线索进行分类并串联,实现母牛发情声音事件检测,最终输出发情事件发生的时刻和概率。本发明利用注意力机制对母牛的声音事件进行识别与定位,实现基于声音信号的母牛发情事件检测。
-
公开(公告)号:CN114708285A
公开(公告)日:2022-07-05
申请号:CN202210331189.7
申请日:2022-03-31
Applicant: 华南农业大学
Abstract: 本发明公开了基于吸收马尔科夫链和骨架映射网络的视频分割方法及装置,方法包括下述步骤:提取目标的感兴趣区域并对该区域进行超像素分割;根据当前帧、第一帧、上一帧的超像素建立吸收马尔科夫链,初步判断当前帧超像素的标签;提出长期、短期时空线索,优化超像素标签;根据超像素标签,获取表达目标形态的前景骨架和表达干扰物体信息的背景估计;构造骨架映射网络,将前景骨架、背景骨架和当前帧图像,作为骨架映射网络的输入,输出目标的最终分割结果。本发明可以较好地分割出复杂场景下目标的边缘轮廓,应对视频分割中的剧烈形变,相似背景等挑战,且不需要长时间训练神经网络,对计算机硬件的需求较低。
-
公开(公告)号:CN114708285B
公开(公告)日:2024-09-13
申请号:CN202210331189.7
申请日:2022-03-31
Applicant: 华南农业大学
Abstract: 本发明公开了基于吸收马尔科夫链和骨架映射网络的视频分割方法及装置,方法包括下述步骤:提取目标的感兴趣区域并对该区域进行超像素分割;根据当前帧、第一帧、上一帧的超像素建立吸收马尔科夫链,初步判断当前帧超像素的标签;提出长期、短期时空线索,优化超像素标签;根据超像素标签,获取表达目标形态的前景骨架和表达干扰物体信息的背景估计;构造骨架映射网络,将前景骨架、背景骨架和当前帧图像,作为骨架映射网络的输入,输出目标的最终分割结果。本发明可以较好地分割出复杂场景下目标的边缘轮廓,应对视频分割中的剧烈形变,相似背景等挑战,且不需要长时间训练神经网络,对计算机硬件的需求较低。
-
-
-
-
-