-
公开(公告)号:CN119314479A
公开(公告)日:2025-01-14
申请号:CN202411417021.3
申请日:2024-10-11
Applicant: 北京交通大学
Abstract: 本申请公开了一种列车司机语音识别方法、设备、介质及产品,涉及深度学习及语音识别技术领域,该方法包括获取列车司机的语音信息;对语音信息进行去噪处理、预处理和快速傅里叶变换,得到第一频谱特征;将第一频谱特征输入到专有词汇识别模型,得到专有词汇识别结果;将第一频谱特征输入到通用词汇识别模型,得到通用词汇识别结果;对专有词汇识别结果和通用词汇识别结果进行融合处理,得到列车司机的语音识别结果。通过融合专有词汇识别模型与通用词汇识别模型的识别结果,获得了列车司机的语音识别结果,这种融合处理有效地弥补了通用模型在铁路领域识别上的局限性,从而提高了列车司机语音识别的准确性。
-
公开(公告)号:CN116070698A
公开(公告)日:2023-05-05
申请号:CN202211684648.6
申请日:2022-12-27
Applicant: 北京交通大学 , 中国铁道科学研究院集团有限公司电子计算技术研究所
IPC: G06N3/098 , G06N3/0455
Abstract: 本发明提供一种基于自编码器的单分类联邦学习方法及系统,属于联邦学习技术领域,在数据预处理阶段,利用预训练模型进行原始数据的特征提取和分析;在训练阶段,客户端按照数据标签分别使用自编码器完成单分类模型的训练,服务器根据标签对单分类模型进行分类聚合,并将聚合后的模型按标签重新下发给客户端;在预测阶段,基于集成学习整合多个单分类专家模型和预训练模型的输出,以确定预测结果。本发明提取出不同标签数据的关键特征,对客户端本地的数据类别没有要求,并且可以抑制客户端模型间的离散程度,提高全局模型的性能,能够在保护客户端隐私的情况下有效应对各种Non‑IID情况。此外训练过程中的异步聚合更新还可以提高训练过程中的通信效率。
-