-
公开(公告)号:CN119027981B
公开(公告)日:2025-03-04
申请号:CN202411168459.2
申请日:2024-08-23
Applicant: 国网黑龙江省电力有限公司哈尔滨供电公司 , 东北电力大学 , 国家电网有限公司
Abstract: 本发明涉及图像识别技术领域,具体涉及一种输电线路入侵鸟类图像声音联合识别方法。获取输电线路图像数据以及声音信号,通过边缘线的长度以及规则程度在图像数据中筛选出输电线路边缘。接着,在输电线路边缘上识别出边缘像素点密集的图像块作为疑似鸟类区域,这些疑似鸟类区域更可能代表鸟类停留的位置。考虑疑似鸟类区域的颜色集中度和位置靠近视觉中心的程度,以确定其鸟类特征显著值。为了更准确地捕捉鸟类特征,对图像进行多尺度处理,获取每个疑似鸟类区域的特征权重对目标检测算法进行优化后对实时图像数据进行目标检测。最后,将图像检测结果与声音信号相结合,利用声音特征进一步验证和确认鸟类种类,从而提高鸟类识别的全面性和准确性。
-
公开(公告)号:CN119513780A
公开(公告)日:2025-02-25
申请号:CN202411647091.8
申请日:2024-11-18
Applicant: 国网智能科技股份有限公司
IPC: G06F18/2433 , G06F18/10 , G06F18/241 , G06F18/214 , G06F18/25 , G06N3/0475 , G06N3/0455 , G06N3/094 , G10L17/02 , G10L17/04 , G10L17/26 , G10L25/51
Abstract: 本发明属于电网主设备诊断技术领域,提供了一种基于声纹云边协同的电网主设备故障诊断方法及系统,其采用了新的云边协同的方法,将声纹监测数据的分析分为两个阶段。在边缘侧部署异常检出模型,实现对海量声纹数据的异常分析,避免了云端大量并发信号的并发请求,提高了声纹监测和分析的时效性。在云端,部署融合声纹、可见光、红外等多源数据的多模态缺陷识别方法,实现了对声音异常信号的二次分类,提高了设备运维和管理的可靠性。
-
公开(公告)号:CN119479672A
公开(公告)日:2025-02-18
申请号:CN202410291896.7
申请日:2024-03-14
Applicant: 北京谛声科技有限责任公司
IPC: G10L21/0208 , G10L21/0272 , G10L17/26 , G10L17/02
Abstract: 本申请公开了一种降噪处理方法、装置、设备及介质。在上述方法中,首先获得原始声学信号以及对应的参考声学信号之后,利用ICEEMDAN算法分别对原始声学信号和参考声学信号进行分解,获得原始固有模态函数集合和参考固有模态函数集合;再利用SANC算法对原始固有模态函数集合进行自适应降噪处理,获得多个降噪固有模态函数,其中SANC算法的参考信号为参考固有模态函数集合;最后将多个降噪固有模态函数进行重构,获得降噪声学信号。在此过程中,利用ICEEMDAN算法和SANC算法可以对仿真信号以及实际的声纹数据进行降噪处理,可以有效滤除原始声学信号中机车机械间内的多种类型噪声,例如平稳噪声与瞬态噪声,从而提高降噪过滤效果。
-
公开(公告)号:CN119418709A
公开(公告)日:2025-02-11
申请号:CN202411574508.2
申请日:2024-11-06
Applicant: 华北科技学院(中国煤矿安全技术培训中心) , 太通建设有限公司
IPC: G10L17/26 , G10L17/02 , G10L17/04 , G10L21/0208 , E21F17/18
Abstract: 本发明提供一种煤矿瓦斯和煤尘爆炸声音识别方法与系统,包括:将含噪的矿井声音信号通过离散小波变换得到不同子带,利用噪声系数的估计关系估计去噪阈值,计算分解得到的子带进行拟合优度检验统计,得到其统计量,将统计量和阈值进行比较,从而实现去噪。对去噪的信号训练样本进行预处理和特征向量提取,接着将特征值向量同时输入SVM和LSSVM模型中,训练得到识别模型。将信号测试样本经过预处理和特征向量提取后,将特征值矩阵输入SVM和LSSVM模型,得到SVM和LSSVM模型的结果标签,对识别结果标签结果进行判决融合,最终得到爆炸声音识别结果。本方法能够提高声音信号识别的准确度,具有较强的兼容性和移植性。
-
公开(公告)号:CN119418707A
公开(公告)日:2025-02-11
申请号:CN202411487059.8
申请日:2024-10-24
Applicant: 电视电声研究所(中国电子科技集团公司第三研究所)
IPC: G10L17/26 , G10L17/02 , G10L17/04 , G10L17/18 , G10L21/0272 , G10L21/0232 , G10L21/0216 , G10L21/0208
Abstract: 本发明提出一种鸟类鸣声分离模型和分离方法、系统、设备及介质;该模型基于Deeplabv3plus编码器‑解码器结构,包括:Xception网络,其Middle flow包括3个卷积层并重复16次;最大池化层替换为可分离卷积;ASPP模块,其包括一个卷积层、三个膨胀卷积层以及一个全局平均池化层;PSA模块,用于提供通道和空间两个维度的双重注意力机制;输出层,产生多个对应特定方向的声谱幅度掩膜。该分离方法包括:基于R通道麦克风阵列采集多源混叠鸣声信号;提取多通道鸟鸣声信号频谱特征和相位差特征作为模型的输入,获得360/R个方向的声谱幅度掩膜;将参考通道的频谱和掩膜系数相乘获得每个声源方向的频谱特征;基于ISTFT和相位特征得到分离声源的时域信号。本申请有效提高了鸟类鸣声分离效果。
-
公开(公告)号:CN119360862A
公开(公告)日:2025-01-24
申请号:CN202411631604.6
申请日:2024-11-15
Applicant: 浙江科技大学
Abstract: 本发明公开了一种轻量化高鲁棒性的输电线路高风险鸟类声纹识别方法,包括:实时采集鸟鸣音频,获得包含鸟鸣声的音频样本,对获取的鸟鸣音频样本统一进行预处理,之后通过MFCC、Delta以及LPCC方法分别获得音频信号对应的梅尔频率倒谱系数、随时间变化的动态信息以及线性预测倒谱系数,拼接后获得混合特征;最后将混合特征输入到构建的轻量化声纹分类网络模型中,输出分类结果。本发明具备分类精度高、适用范围广、占用资源低、对环境噪音鲁棒性强,且网络模型轻量化设计,计算速度快,满足了轻量化高鲁棒性鸟鸣音频分类的需求。该方法能够显著提升鸟类音频识别的自动化水平,减少人工干预,在鸟类声纹识别领域具有广泛的实际应用价值。
-
公开(公告)号:CN119314494A
公开(公告)日:2025-01-14
申请号:CN202411844616.7
申请日:2024-12-16
Applicant: 国网山东省电力公司济南供电公司
IPC: G10L17/04 , G10L17/26 , G10L17/18 , G10L21/0264 , G10L25/51 , G06F18/24 , G06N3/0499 , G06N3/08
Abstract: 本发明的一种电缆缺陷识别的方法、装置、电子设备及存储介质,属于配电电缆缺陷识别技术领域,方法包括以下步骤:采集目标电缆的声纹数据;通过三角拓扑聚合优化法对最大相关峭度滤波法的滤波长度和周期进行参数优化,采用优化后的最大相关峭度滤波法对声纹数据进行去噪增强处理;通过三角拓扑聚合优化法对在线序列极限学习机的输入权值和隐藏层偏置进行参数优化,基于参数优化后的在线序列极限学习机构建电缆缺陷识别模型;基于声纹数据进行模型训练,采用输出权值的链式更新法则实时更新电缆缺陷识别模型的当前输出权值,并输出电缆缺陷识别结果。本发明显著提升了声纹增强和极限学习机参数优化的效率和效果,极大地降低了硬件资源和计算成本。
-
公开(公告)号:CN119229877A
公开(公告)日:2024-12-31
申请号:CN202411143183.2
申请日:2024-08-20
Abstract: 本发明公开了一种说话人验证模型训练方法、装置、介质及设备,所述方法包括:对获取的语音音频数据进行波形提取,得到语音音频数据对应的音频波形数据;将所述音频波形数据输入至预设分类模型中,以通过所述预设分类模型输出所述语音音频数据对应的预测标签;根据语音音频数据对应的防伪标签和预测标签,确定所述预设分类模型的损失值;通过所述损失值对所述预设分类模型进行参数调整,得到说话人验证模型。本发明采取监督学习的方式利用真实的防伪标签对模型的预测标签进行辅助判定,利用最小化输出和真实标签之间的误差来训练整个模型,提高了训练效率降低了成本。
-
公开(公告)号:CN119170021A
公开(公告)日:2024-12-20
申请号:CN202411266208.8
申请日:2024-09-10
Applicant: 中国平安财产保险股份有限公司
Inventor: 邓志龙
IPC: G10L17/26 , G10L21/0208 , G10L25/66 , G10L25/30
Abstract: 本申请实施例属于人工智能领域,涉及一种牲畜健康监测方法,包括:获取养殖场中牲畜群的牲畜声音;对牲畜声音进行增强处理,得到第一声音;提取第一声音的声纹特征,并将声纹特征输入健康评估模型,得到牲畜群的健康状态分数;获取当前的季节性影响参数,并将季节性影响参数输入季节影响评估模型,得到牲畜健康的季节性修正分数;根据预设的动态系数对健康状态分数和季节性修正分数进行计算,得到牲畜群的健康分数;根据健康分数生成牲畜群的健康监测结果。本申请还提供一种牲畜健康监测装置、计算机设备及存储介质。此外,本申请还涉及区块链技术,牲畜声音可存储于区块链中。本申请能够实时、准确地监测牲畜的健康状态。
-
公开(公告)号:CN119130675A
公开(公告)日:2024-12-13
申请号:CN202411244856.3
申请日:2024-09-05
Applicant: 中国平安财产保险股份有限公司
Abstract: 本发明实施例提供一种宠物身份核验方法、装置、计算机设备及计算机可读存储介质,涉及金融和人工智能领域。获取待检测宠物的音视频信息,音视频信息包括待检测宠物对应的宠物视频和宠物音频;对宠物音频进行特征提取以及识别处理,得到宠物声纹特征;对宠物视频进行特征提取以及识别处理,得到宠物外貌特征;获取目标宠物的身份特征信息,身份特征信息包括目标声纹特征和目标外貌特征;确定宠物声纹特征和目标声纹特征的相似度为第一相似度,并确定宠物外貌特征和目标外貌特征的相似度为第二相似度;根据第一相似度和第二相似度生成待检测宠物与目标宠物的身份核验结果。本申请旨在解决无法准确地识别投保宠物与理赔宠物的身份信息的问题。
-
-
-
-
-
-
-
-
-