-
公开(公告)号:CN118645093A
公开(公告)日:2024-09-13
申请号:CN202410863023.9
申请日:2024-06-28
申请人: 海尔优家智能科技(北京)有限公司 , 青岛海尔科技有限公司 , 青岛海尔智能家电科技有限公司 , 海尔智家股份有限公司
摘要: 本申请公开了一种基于多模态融合的语义拒识方法及装置、存储介质,涉及智慧家庭技术领域,该基于多模态融合的语义拒识方法包括:根据目标对象的第一语音和所述第一语音允许被分配的第一标签,确定所述第一语音对应的第一语义信息表示;并通过图像编码器确定第一图像对应的第一语境信息表示;其中,所述第一图像是在所述目标对象发出所述第一语音的情况下,所述目标对象所处环境的图像;通过目标对齐算法对所述第一语义信息表示和所述第一语境信息表示进行对齐,得到第一对齐结果;根据所述第一对齐结果构造对所述第一语音的语义拒识策略。采用上述技术方案,解决了基于单文本数据的语义拒识模型的拒识效果差的问题。
-
公开(公告)号:CN117746834B
公开(公告)日:2024-05-24
申请号:CN202410191016.9
申请日:2024-02-21
申请人: 青岛海尔科技有限公司 , 青岛海尔智能家电科技有限公司 , 海尔优家智能科技(北京)有限公司
摘要: 本申请公开了一种基于大模型的语音生成方法及装置、存储介质、电子装置,涉及语音处理领域,上述方法包括:对目标对象输入的用户指令进行解析,以确定用户指令对应的语言风格信息,并生成语言风格信息对应的第一语音;确定第一语音的第一梅尔频谱和第二语音的第二梅尔频谱;根据第一梅尔频谱提取第一语音的第一音色向量;以及根据第二梅尔频谱提取第二语音的第二音色向量;删除第一语音对应的第一语音向量中的第一音色向量,得到第二语音向量,并在第二语音向量中添加第二语音对应的第二音色向量,以生成第三语音,将第三语音确定为语音助手输出的语音,基于上述方案,解决了现有技术中语音助手语料库单调,缺乏语言风格上的变化等问题。
-
公开(公告)号:CN117746834A
公开(公告)日:2024-03-22
申请号:CN202410191016.9
申请日:2024-02-21
申请人: 青岛海尔科技有限公司 , 青岛海尔智能家电科技有限公司 , 海尔优家智能科技(北京)有限公司
摘要: 本申请公开了一种基于大模型的语音生成方法及装置、存储介质、电子装置,涉及语音处理领域,上述方法包括:对目标对象输入的用户指令进行解析,以确定用户指令对应的语言风格信息,并生成语言风格信息对应的第一语音;确定第一语音的第一梅尔频谱和第二语音的第二梅尔频谱;根据第一梅尔频谱提取第一语音的第一音色向量;以及根据第二梅尔频谱提取第二语音的第二音色向量;删除第一语音对应的第一语音向量中的第一音色向量,得到第二语音向量,并在第二语音向量中添加第二语音对应的第二音色向量,以生成第三语音,将第三语音确定为语音助手输出的语音,基于上述方案,解决了现有技术中语音助手语料库单调,缺乏语言风格上的变化等问题。
-
公开(公告)号:CN117789744B
公开(公告)日:2024-05-24
申请号:CN202410206087.1
申请日:2024-02-26
申请人: 青岛海尔科技有限公司 , 青岛海尔智能家电科技有限公司 , 海尔优家智能科技(北京)有限公司
IPC分类号: G10L21/0208 , G10L25/30
摘要: 本申请公开了一种基于模型融合的语音降噪方法、装置及存储介质,涉及语音处理技术领域,其中,上述方法包括:将与待降噪语音信号对应的待降噪语音特征输入到目标判别模型,得到判别降噪结果和参考噪声信息,判别降噪结果包括第一降噪语音特征,参考噪声信息为估计出的待降噪语音特征中的噪声信息;将待降噪语音特征和参考噪声信息输入到目标生成模型,得到第二降噪语音特征,第二降噪语音特征为目标生成模型基于述参考噪声信息对待降噪语音特征进行降噪处理得到的语音特征;对第一降噪语音特征和第二降噪语音特征进行融合,得到融合降噪语音特征,并将融合降噪语音特征转换为与融合降噪语音特征对应的已降噪语音信号。
-
公开(公告)号:CN117789744A
公开(公告)日:2024-03-29
申请号:CN202410206087.1
申请日:2024-02-26
申请人: 青岛海尔科技有限公司 , 青岛海尔智能家电科技有限公司 , 海尔优家智能科技(北京)有限公司
IPC分类号: G10L21/0208 , G10L25/30
摘要: 本申请公开了一种基于模型融合的语音降噪方法、装置及存储介质,涉及语音处理技术领域,其中,上述方法包括:将与待降噪语音信号对应的待降噪语音特征输入到目标判别模型,得到判别降噪结果和参考噪声信息,判别降噪结果包括第一降噪语音特征,参考噪声信息为估计出的待降噪语音特征中的噪声信息;将待降噪语音特征和参考噪声信息输入到目标生成模型,得到第二降噪语音特征,第二降噪语音特征为目标生成模型基于述参考噪声信息对待降噪语音特征进行降噪处理得到的语音特征;对第一降噪语音特征和第二降噪语音特征进行融合,得到融合降噪语音特征,并将融合降噪语音特征转换为与融合降噪语音特征对应的已降噪语音信号。
-
公开(公告)号:CN118113887A
公开(公告)日:2024-05-31
申请号:CN202211513328.4
申请日:2022-11-29
申请人: 海尔优家智能科技(北京)有限公司 , 青岛海尔科技有限公司 , 海尔智家股份有限公司
IPC分类号: G06F16/432 , G06F16/332
摘要: 本申请公开了一种基于多模态数据的烹饪辅助方法、存储介质及电子装置,涉及智慧家庭技术领域,该基于多模态数据的烹饪辅助方法包括:获取多模态数据,所述多模态数据包括语音数据和图像数据;根据所述语音数据确定烹饪询问意图;在所述烹饪询问意图为菜品询问意图的情况下,根据所述图像数据确定菜品图像信息;根据所述烹菜品询问意图和所述菜品图像信息确定烹饪辅助信息。通过结合菜品询问意图以及菜品图像信息充分了解用户要解决的关于烹饪菜品的问题,根据菜品询问意图和菜品图像信息提供全面准确的烹饪辅助,并将烹饪辅助信息推送至预设智能终端进行播放,提升用户体验。
-
公开(公告)号:CN117676246A
公开(公告)日:2024-03-08
申请号:CN202211049029.X
申请日:2022-08-30
申请人: 海尔优家智能科技(北京)有限公司 , 青岛海尔科技有限公司 , 海尔智家股份有限公司
摘要: 本申请公开了一种多媒体项目的播放方法和装置、存储介质及电子装置,涉及智慧家庭技术领域,该多媒体项目的播放方法包括:检测目标用户在目标多媒体项目播放到目标播放节点时的目标情绪特征,其中,目标用户是体验目标多媒体项目的用户,目标情绪特征用于指示目标用户的情绪状态;根据目标情绪特征和目标播放节点获取目标多媒体资源;在目标多媒体项目中的目标播放节点播放目标多媒体资源,其中,目标多媒体项目包括在一个或者多个播放节点上播放的多媒体资源,一个或者多个播放节点包括目标播放节点,采用上述技术方案,解决了相关技术中,多媒体项目的播放的过程中,多媒体项目的沉浸度较低等问题。
-
公开(公告)号:CN116504225A
公开(公告)日:2023-07-28
申请号:CN202310343077.8
申请日:2023-03-31
申请人: 海尔优家智能科技(北京)有限公司 , 青岛海尔科技有限公司 , 海尔智家股份有限公司
摘要: 本申请公开了一种设备的语音控制方法和装置、存储介质及电子装置,涉及智能家居/智慧家庭技术领域,其中,上述方法包括:提取第一语音信号的声学特征,得到第一声学特征,其中,第一语音信号是语音设备在进行语音交互的过程中所采集的语音信号;根据第一声学特征进行语义解析,得到与第一语音信号对应的目标语义意图;在目标语义意图属于一组预设意图的情况下,根据第一声学特征进行语音情感识别,得到与第一语音信号对应的第一情感类别;将第一情感类别与目标语义意图进行融合,得到更新后的目标语义意图,其中,更新后的目标语义意图是带有情感参数的语义意图;控制被控设备执行与更新后的目标语义意图对应的设备操作。
-
公开(公告)号:CN115988152A
公开(公告)日:2023-04-18
申请号:CN202211521223.3
申请日:2022-11-30
申请人: 海尔优家智能科技(北京)有限公司 , 青岛海尔科技有限公司 , 海尔智家股份有限公司
摘要: 本申请公开了一种目标烹饪视频的生成方法、装置、存储介质及电子装置,涉及智慧家庭技术领域,该目标烹饪视频的生成方法包括:对目标对象的烹饪过程进行采集,得到所述目标对象的初始烹饪视频,其中,所述初始烹饪视频中包括所述目标对象的烹饪动作,所述目标对象使用的烹饪食材和所述目标对象使用的烹饪设备;获取所述烹饪过程中所述烹饪设备工作时产生的音频信号;基于所述烹饪动作,所述烹饪食材,所述烹饪设备的设备数据和所述音频信号生成所述烹饪过程的描述文本;根据所述描述文本对应的烹饪解说音频和所述初始烹饪视频生成目标烹饪视频,采用上述技术方案,解决了如何生成具有解说音频的烹饪视频的技术问题。
-
公开(公告)号:CN115988152B
公开(公告)日:2024-09-24
申请号:CN202211521223.3
申请日:2022-11-30
申请人: 海尔优家智能科技(北京)有限公司 , 青岛海尔科技有限公司 , 海尔智家股份有限公司
摘要: 本申请公开了一种目标烹饪视频的生成方法、装置、存储介质及电子装置,涉及智慧家庭技术领域,该目标烹饪视频的生成方法包括:对目标对象的烹饪过程进行采集,得到所述目标对象的初始烹饪视频,其中,所述初始烹饪视频中包括所述目标对象的烹饪动作,所述目标对象使用的烹饪食材和所述目标对象使用的烹饪设备;获取所述烹饪过程中所述烹饪设备工作时产生的音频信号;基于所述烹饪动作,所述烹饪食材,所述烹饪设备的设备数据和所述音频信号生成所述烹饪过程的描述文本;根据所述描述文本对应的烹饪解说音频和所述初始烹饪视频生成目标烹饪视频,采用上述技术方案,解决了如何生成具有解说音频的烹饪视频的技术问题。
-
-
-
-
-
-
-
-
-