一种列车司机语音识别方法、设备、介质及产品

    公开(公告)号:CN119314479A

    公开(公告)日:2025-01-14

    申请号:CN202411417021.3

    申请日:2024-10-11

    Abstract: 本申请公开了一种列车司机语音识别方法、设备、介质及产品,涉及深度学习及语音识别技术领域,该方法包括获取列车司机的语音信息;对语音信息进行去噪处理、预处理和快速傅里叶变换,得到第一频谱特征;将第一频谱特征输入到专有词汇识别模型,得到专有词汇识别结果;将第一频谱特征输入到通用词汇识别模型,得到通用词汇识别结果;对专有词汇识别结果和通用词汇识别结果进行融合处理,得到列车司机的语音识别结果。通过融合专有词汇识别模型与通用词汇识别模型的识别结果,获得了列车司机的语音识别结果,这种融合处理有效地弥补了通用模型在铁路领域识别上的局限性,从而提高了列车司机语音识别的准确性。

Patent Agency Ranking