-
公开(公告)号:CN119314479A
公开(公告)日:2025-01-14
申请号:CN202411417021.3
申请日:2024-10-11
Applicant: 北京交通大学
Abstract: 本申请公开了一种列车司机语音识别方法、设备、介质及产品,涉及深度学习及语音识别技术领域,该方法包括获取列车司机的语音信息;对语音信息进行去噪处理、预处理和快速傅里叶变换,得到第一频谱特征;将第一频谱特征输入到专有词汇识别模型,得到专有词汇识别结果;将第一频谱特征输入到通用词汇识别模型,得到通用词汇识别结果;对专有词汇识别结果和通用词汇识别结果进行融合处理,得到列车司机的语音识别结果。通过融合专有词汇识别模型与通用词汇识别模型的识别结果,获得了列车司机的语音识别结果,这种融合处理有效地弥补了通用模型在铁路领域识别上的局限性,从而提高了列车司机语音识别的准确性。
-
公开(公告)号:CN118860390A
公开(公告)日:2024-10-29
申请号:CN202410840542.3
申请日:2024-06-26
Applicant: 北京交通大学
IPC: G06F8/38 , G06F17/10 , G06F3/0484
Abstract: 本申请公开一种动态化人机交互界面生成方法、装置、介质及产品,涉及人机交互界面设计技术领域,所述方法包括:对任务进行分析得到任务流程形式化模型;定义界面元素,构建人机交互界面动态生成系统;将人机交互界面设计问题简化为二维空间的布局问题,构建布局原则目标函数和操作移动路径函数并构建总目标函数;设计界面组件位置;建立各交互按钮的高斯核函数模型;基于任两个交互按钮的初始位置坐标值和高斯核函数模型,确定两个交互按钮的误触概率;基于任两个交互按钮的误触概率和预设误触概率阈值,调整对应交互按钮的初始位置坐标值,得到对应交互按钮的最终位置。本申请解决了任务场景下人机交互界面的动态设计问题。
-