多模态口头语言识别
    1.
    发明公开

    公开(公告)号:CN119404246A

    公开(公告)日:2025-02-07

    申请号:CN202380047991.6

    申请日:2023-05-24

    Abstract: 一种方法包括获得人说话的音频输入,其中音频输入由电子设备捕获。该方法还包括,对于多种语言类型中的每一种,(i)通过将训练的口头语言识别模型应用于音频输入来确定人正在以一种语言类型说话的第一概率,(ii)基于人或电子设备的至少一个特性来确定人正在以所述语言类型说话的至少一个第二概率,以及(iii)基于第一概率和第二概率来确定语言类型的分数。该方法还包括将与最高分数相关联的语言类型识别为音频输入中人的口头语言。

Patent Agency Ranking