语音合成播报方法、装置、相关设备及计算机程序产品

    公开(公告)号:CN119229841A

    公开(公告)日:2024-12-31

    申请号:CN202411582070.2

    申请日:2024-11-07

    Abstract: 本申请公开了一种语音合成播报方法、装置、相关设备及计算机程序产品,在收到语音合成播报指令时,同时启动本地合成流程以及请求服务器进行语音合成,终端按照设定抛出规则,将服务器返回的音频数据抛出播放。借助于服务器强大的算力,可以保证合成后的音频数据的质量。此外,为了更加及时、准确地判断网络传输是否中断,本申请实时计算吞吐率,吞吐率能够从用户听觉角度及时判断网络传输是否出现或即将出现中断,在确定当前计算的吞吐率小于设定阈值时,表示网络传输出现或即将出现中断,为了持续提供相对稳定的音频数据,利用本地合成的音频数据进行续播,因而在网络波动时能够维持连贯的用户体验,提升了语音播报质量。

    人机交互方法、装置、设备及介质

    公开(公告)号:CN119336436A

    公开(公告)日:2025-01-21

    申请号:CN202411529054.7

    申请日:2024-10-30

    Abstract: 本发明提供一种人机交互方法、装置、设备及介质,其中方法包括:获取用户端的端侧数据,端侧数据包括用户输入数据和端侧采集数据中的至少一种;基于端侧大模型,生成与端侧数据对应的交互信息;端侧大模型是设置在用户端所在的本地设备处的大型语言模型;执行交互信息。本发明提供的人机交互方法、装置、设备及介质,通过在本地部署端侧大模型,实现用户端自带推理和决策能力,即使在无网络情况下,也能高效运行,确保持续的交互体验。同时,由于本地端侧大模型处理避免了数据上传至云端,显著降低了隐私风险,因此能够灵活应用个性化数据处理交互任务,生成更符合用户需求的交互响应,克服了传统方法依赖预设规则、灵活性不足的局限性。

Patent Agency Ranking