基于模型融合的语音降噪方法、装置及存储介质

    公开(公告)号:CN117789744B

    公开(公告)日:2024-05-24

    申请号:CN202410206087.1

    申请日:2024-02-26

    IPC分类号: G10L21/0208 G10L25/30

    摘要: 本申请公开了一种基于模型融合的语音降噪方法、装置及存储介质,涉及语音处理技术领域,其中,上述方法包括:将与待降噪语音信号对应的待降噪语音特征输入到目标判别模型,得到判别降噪结果和参考噪声信息,判别降噪结果包括第一降噪语音特征,参考噪声信息为估计出的待降噪语音特征中的噪声信息;将待降噪语音特征和参考噪声信息输入到目标生成模型,得到第二降噪语音特征,第二降噪语音特征为目标生成模型基于述参考噪声信息对待降噪语音特征进行降噪处理得到的语音特征;对第一降噪语音特征和第二降噪语音特征进行融合,得到融合降噪语音特征,并将融合降噪语音特征转换为与融合降噪语音特征对应的已降噪语音信号。

    基于模型融合的语音降噪方法、装置及存储介质

    公开(公告)号:CN117789744A

    公开(公告)日:2024-03-29

    申请号:CN202410206087.1

    申请日:2024-02-26

    IPC分类号: G10L21/0208 G10L25/30

    摘要: 本申请公开了一种基于模型融合的语音降噪方法、装置及存储介质,涉及语音处理技术领域,其中,上述方法包括:将与待降噪语音信号对应的待降噪语音特征输入到目标判别模型,得到判别降噪结果和参考噪声信息,判别降噪结果包括第一降噪语音特征,参考噪声信息为估计出的待降噪语音特征中的噪声信息;将待降噪语音特征和参考噪声信息输入到目标生成模型,得到第二降噪语音特征,第二降噪语音特征为目标生成模型基于述参考噪声信息对待降噪语音特征进行降噪处理得到的语音特征;对第一降噪语音特征和第二降噪语音特征进行融合,得到融合降噪语音特征,并将融合降噪语音特征转换为与融合降噪语音特征对应的已降噪语音信号。

    基于多模态数据的烹饪辅助方法、存储介质及电子装置

    公开(公告)号:CN118113887A

    公开(公告)日:2024-05-31

    申请号:CN202211513328.4

    申请日:2022-11-29

    IPC分类号: G06F16/432 G06F16/332

    摘要: 本申请公开了一种基于多模态数据的烹饪辅助方法、存储介质及电子装置,涉及智慧家庭技术领域,该基于多模态数据的烹饪辅助方法包括:获取多模态数据,所述多模态数据包括语音数据和图像数据;根据所述语音数据确定烹饪询问意图;在所述烹饪询问意图为菜品询问意图的情况下,根据所述图像数据确定菜品图像信息;根据所述烹菜品询问意图和所述菜品图像信息确定烹饪辅助信息。通过结合菜品询问意图以及菜品图像信息充分了解用户要解决的关于烹饪菜品的问题,根据菜品询问意图和菜品图像信息提供全面准确的烹饪辅助,并将烹饪辅助信息推送至预设智能终端进行播放,提升用户体验。

    目标烹饪视频的生成方法、装置、存储介质及电子装置

    公开(公告)号:CN115988152A

    公开(公告)日:2023-04-18

    申请号:CN202211521223.3

    申请日:2022-11-30

    摘要: 本申请公开了一种目标烹饪视频的生成方法、装置、存储介质及电子装置,涉及智慧家庭技术领域,该目标烹饪视频的生成方法包括:对目标对象的烹饪过程进行采集,得到所述目标对象的初始烹饪视频,其中,所述初始烹饪视频中包括所述目标对象的烹饪动作,所述目标对象使用的烹饪食材和所述目标对象使用的烹饪设备;获取所述烹饪过程中所述烹饪设备工作时产生的音频信号;基于所述烹饪动作,所述烹饪食材,所述烹饪设备的设备数据和所述音频信号生成所述烹饪过程的描述文本;根据所述描述文本对应的烹饪解说音频和所述初始烹饪视频生成目标烹饪视频,采用上述技术方案,解决了如何生成具有解说音频的烹饪视频的技术问题。

    目标烹饪视频的生成方法、装置、存储介质及电子装置

    公开(公告)号:CN115988152B

    公开(公告)日:2024-09-24

    申请号:CN202211521223.3

    申请日:2022-11-30

    摘要: 本申请公开了一种目标烹饪视频的生成方法、装置、存储介质及电子装置,涉及智慧家庭技术领域,该目标烹饪视频的生成方法包括:对目标对象的烹饪过程进行采集,得到所述目标对象的初始烹饪视频,其中,所述初始烹饪视频中包括所述目标对象的烹饪动作,所述目标对象使用的烹饪食材和所述目标对象使用的烹饪设备;获取所述烹饪过程中所述烹饪设备工作时产生的音频信号;基于所述烹饪动作,所述烹饪食材,所述烹饪设备的设备数据和所述音频信号生成所述烹饪过程的描述文本;根据所述描述文本对应的烹饪解说音频和所述初始烹饪视频生成目标烹饪视频,采用上述技术方案,解决了如何生成具有解说音频的烹饪视频的技术问题。