模型移植和语音任务处理方法、装置、设备、介质及产品

    公开(公告)号:CN120015037A

    公开(公告)日:2025-05-16

    申请号:CN202510043397.0

    申请日:2025-01-10

    Abstract: 本申请提供一种模型移植和语音任务处理方法、装置、设备、介质及产品,该方法包括:获取原始语音任务处理模型,原始语音任务处理模型在模型训练平台上训练得到,且包括多个节点;确定多个节点中的需保存节点,得到表征语音任务处理模型的拓扑结构的拓扑文件,语音任务处理模型在语音任务处理平台上运行,需保存节点包括参与语音任务处理模型的推理过程,且其输出结果被其他算子节点使用的算子节点,算子节点为执行计算操作的节点;根据拓扑文件生成语音任务处理模型的模型资源文件,模型资源文件用于将语音任务处理模型加载至语音任务处理平台。本申请能够将语音任务处理模型移植至hifi5平台,并在hifi5平台上稳定且高效地运行。

    基于心理咨询的问答方法、装置、设备和计算机程序产品

    公开(公告)号:CN119988559A

    公开(公告)日:2025-05-13

    申请号:CN202510111040.1

    申请日:2025-01-23

    Abstract: 本申请提出一种基于心理咨询的问答方法、装置、设备和计算机程序产品,该方法能够根据咨询对象的第一问题描述语句,从案例数据库存储的多个问题描述语句中检索与第一问题描述语句关联的第二问题描述语句。通过学习第二问题描述语句和第二问题描述语句对应的第二咨询规划方案,生成第一问题描述语句对应的第一咨询规划方案,以便于根据第一咨询规划方案生成与咨询对象的心理干预对话。如此能够通过学习与咨询对象关联的案例自动生成心理咨询对话,实现自动进行心理咨询问答,用户即使不与专业的心理咨询师进行互动交流也可以得到专业的心理干预,能够覆盖到广大有需求的人群。

    水印添加方法、水印检测方法及水印添加模型训练方法

    公开(公告)号:CN119962541A

    公开(公告)日:2025-05-09

    申请号:CN202510437524.5

    申请日:2025-04-09

    Abstract: 本发明提供一种水印添加方法、水印检测方法及水印添加模型训练方法,涉及计算机视觉技术领域,引入拆分模型,用于根据历史词元确定词元分类参数,使文本生成模型的不同次输出对应的词元字典中相同类别的词元的占比不同,可以适用于多种情况下的生成文本,避免强硬地设置固定占比破坏文本生成模型的生成内容的准确性和可用性,使水印添加效果稳定,进而保证了后续的水印检测效果。而且,还引入偏差模型,以根据历史词元确定词元字典中不同词元类别的概率偏差参数,进而使水印添加模块结合概率偏差参数和词元分类参数对第一词元概率分布进行更新,可以改变词元字典中不同词元类别的词元被选中的概率值,进一步提升后续的水印检测效果。

    合成视频的方法、电子设备及计算机程序产品

    公开(公告)号:CN119323625B

    公开(公告)日:2025-05-09

    申请号:CN202411866722.5

    申请日:2024-12-18

    Abstract: 本申请提出一种合成视频的方法、电子设备及计算机程序产品。该合成视频的方法包括:获取包含第一虚拟对象的第一视频以及包含目标虚拟对象的肢体动作的第二视频,针对第一视频,去除目标视频段中第一虚拟对象的目标肢体部位,得到待合成视频,目标视频段为第一视频中对应动作插入时段的视频段;基于第二视频和目标视频段的时序对应关系,将第二视频各视频帧的目标肢体部位拼接到待合成视频各视频帧的目标肢体部位缺失处,生成合成视频。由于第二视频仅包含目标肢体部位,因此,可以做到虚拟对象与肢体动作的解耦。在虚拟对象为虚拟人物的情况下,制作第二视频/动作视频时,无需考虑人物主要身体部位的穿着打扮,甚至无需考虑人物的身份。

    语音情感识别方法及相关装置、电子设备和存储介质

    公开(公告)号:CN114333786B

    公开(公告)日:2025-05-09

    申请号:CN202111363984.6

    申请日:2021-11-17

    Inventor: 石周 高天 方昕

    Abstract: 本申请公开了一种语音情感识别方法及相关装置、电子设备和存储介质,其中,语音情感识别方法包括:获取待识别语音;利用情感识别网络对待识别语音进行识别,得到待识别语音的情感类别;其中,情感识别网络包含于联合模型,联合模型还包括域识别网络,联合模型是基于情感识别网络对属于第一数据域类别的第一样本语音的情感分类损失以及域识别网络分别对第一样本语音和第二样本语音的域分类损失联合训练得到的,且第二样本语音属于第二数据域类别,第一样本语音标注有样本情感类别。上述方案,能够在具有准确情感类别标注的样本数据较为稀少的情况下,提升语音情感识别的准确性。

    语音交互方法、装置、设备、介质及程序产品

    公开(公告)号:CN119943071A

    公开(公告)日:2025-05-06

    申请号:CN202510063415.1

    申请日:2025-01-15

    Abstract: 本申请提供一种语音交互方法、装置、设备、介质及程序产品,该语音交互方法包括:确定第一原始信号的第一置信度和第一语音增强信号的第二置信度;其中,第一语音增强信号是对第一原始信号进行语音增强后得到的信号;基于第一置信度、第二置信度、第二原始信号和第二语音增强信号,确定目标信号;其中,第二语音增强信号是对第二原始信号进行语音增强后得到的信号;基于目标信号,与目标设备进行语音交互。本申请能够减小语音增强带来的语音失真。

    视频生成方法、装置、电子设备和计算机程序产品

    公开(公告)号:CN119922351A

    公开(公告)日:2025-05-02

    申请号:CN202411771790.3

    申请日:2024-12-04

    Abstract: 本申请提出一种视频生成方法、装置、电子设备和计算机程序产品,该方法能够基于复刻对象的音频和参考图像,生成复刻对象的虚拟形象视频。具体可以根据音频和参考图像,生成复刻对象口唇区域的动态图像,结合口唇区域的动态图像、参考图像和音频对应的情绪状态,得到复刻对象的动态图像;或者,从音频和参考图像中提取得到复刻特征,根据复刻特征和音频对应的情绪状态生成复刻对象的动态图像,然后根据音频和复刻对象的动态图像,生成复刻对象的虚拟形象视频,实现复刻特定对象的虚拟形象的目的。

Patent Agency Ranking