命令词识别方法、装置、设备及存储介质

    公开(公告)号:CN117409770A

    公开(公告)日:2024-01-16

    申请号:CN202310934276.6

    申请日:2023-07-27

    Abstract: 本申请涉及语音识别技术领域,提供一种命令词识别方法、装置、设备及存储介质。所述方法包括获取待识别的语音信息,并提取所述语音信息的音频特征;对所述音频特征进行压缩处理,并将压缩后的音频特征输入到经过预训练的命令词识别模型中,对所述语音信息中的命令词进行识别。本申请实施例提供的命令词识别方法,通过对音频特征进行压缩,可以剔除音频特征中的静音片段等无效信息,将压缩后的音频特征输入到经过预训练的命令词识别模型,对语音信息中的命令词进行识别时,可以避免或减少数据填充,从而减少计算资源的浪费。

    流式语音识别方法、终端设备及介质

    公开(公告)号:CN113838468A

    公开(公告)日:2021-12-24

    申请号:CN202111119338.5

    申请日:2021-09-24

    Abstract: 本发明公开了一种流式语音识别方法,终端设备及计算机可读存储介质。所述方法包括:获取词嵌入特征序列以及音频流对应音频特征序列;通过音频编码器对所述音频特征序列进行编码,得到音频上下文序列,以及根据标签编码器对所述词嵌入序列进行编码,得到文本上下文序列,其中,所述音频编码器和所述标签编码器为基于相对位置编码的自注意力编码器;将所述音频上下文序列和所述文本上下文序列输入联合解码器,得到标签的概率分布结果,并根据所述概率分布结果确定识别结果。本发明旨在达成减少语音识别的计算量的效果。

    机顶盒控制方法及装置、电子设备及存储介质

    公开(公告)号:CN115866012A

    公开(公告)日:2023-03-28

    申请号:CN202111124054.5

    申请日:2021-09-24

    Abstract: 本申请公开了一种机顶盒控制方法及装置、电子设备及存储介质。所述机顶盒控制方法可包括:获取所述终端设备与服务平台之间建立传输控制协议TCP长连接的令牌;在确定有待上报的语音流时,基于所述令牌与所述服务平台之间建立所述TCP长连接;基于建立的所述TCP长连接向所述服务平台上报所述语音流;其中,所述语音流,至少用于触发所述服务平台生成控制指令,所述控制指令用于控制所述机顶盒的工作;在所述语音流上报完毕后,断开所述TCP长连接。如此,仅在有语音流上报时才建立TCP长连接且在完成语音流上报之后及时断开TCP长连接,减少了TCP长连接长时间维护导致的开销。

    音量调节的方法、装置、电子设备和存储介质

    公开(公告)号:CN112037771A

    公开(公告)日:2020-12-04

    申请号:CN202010886561.1

    申请日:2020-08-28

    Abstract: 本发明实施例涉及语音识别领域,公开了一种音量调节的方法、装置、电子设备和存储介质。上述音量调节的方法包括:获取用于训练语音识别模型的训练集中的各音频样本;其中,所述语音识别模型用于语音识别;确定所述训练集中的各音频样本的音量值;根据所述各音频样本的音量值,确定所述训练集的音量基准值;根据所述音量基准值,对所述各音频样本的音量值进行调节;其中,调节后的所述各音频样本的音量值与所述音量基准值的差值在预设的差值范围内。本发明实施例提供的音量调节的方法可以基于整个训练集对每条音频数据进行音量调节,合适地调整训练集中音频样本的音量值,从而提升语音识别模型的识别效果。

    控制信源选择的方法、装置、设备、存储介质和程序产品

    公开(公告)号:CN119094827A

    公开(公告)日:2024-12-06

    申请号:CN202411213436.9

    申请日:2024-08-30

    Abstract: 本发明提供一种控制信源选择的方法、装置、设备、存储介质和程序产品,涉及遥控技术领域。其中方法包括:在检测到第一按键的一次按键操作或接收到语音指令之后,发送控制指令,以使电视机按照信源选择的步骤依次显示画面,并最终显示与第一信源相关联的内容;其中,控制指令与配置信息相关联;配置信息是所述遥控器从外部获取的。本发明只需一次按键操作或语音操作就可以发送将电视的信源切换至第一信源的控制指令,无需用户进行多次操作,从而提高信源切换的操作便捷性;同时,控制指令与配置信息相关联,且配置信息是遥控器从外部获取的,从而无需用户学习信源切换路径,进而降低信源切换的操作难度,最终提高用户的使用体验感。

Patent Agency Ranking