基于情感类别标签的可控情感语音合成方法及系统

    公开(公告)号:CN113327572B

    公开(公告)日:2024-02-09

    申请号:CN202110612224.8

    申请日:2021-06-02

    Inventor: 吴志勇 李翔

    Abstract: 本发明公开了一种基于情感类别标签的可控情感语音合成系统及方法,该方法包括:文本特征提取步骤,用于从输入的音素序列中提取出语音文本特征;语音风格特征提取步骤,用于接收与音素序列对应的目标语音的声学特征,并从声学特征中提取出语音风格特征;语音风格特征记忆步骤,用于根据语音风格特征得到目标语音的情感风格特征;声学特征预测步骤,用于根据语音文本特征和情感风格特征预测合成情感语音声学特征。本发明可提高语音风格特征与语音文本特征的解耦程度,使得合成语音的风格调控结果不受文本内容限制,提升合成语音的可控性和灵活性,并且可有效利用语料中语音的情感标签与各情感数据分布信息,以更高效地提取各情感的语音风格特征。(56)对比文件张海龙;何小雨;李鹏;周美丽.基于语音信号的情感识别技术研究.延安大学学报(自然科学版).2017,(第01期),全文.

    韵律预测方法、装置、设备、存储介质和程序产品

    公开(公告)号:CN117219052A

    公开(公告)日:2023-12-12

    申请号:CN202310121183.1

    申请日:2023-01-31

    Abstract: 本申请提供了一种韵律预测方法、装置、设备、存储介质和程序产品;涉及人工智能技术;方法包括:对目标文本进行特征提取,得到所述目标文本的文本特征;从第一目标分布中采样得到用于韵律预测的初始韵律特征,并从第二目标分布中采样得到用于韵律预测的噪声;基于所述文本特征、所述初始韵律特征、以及所述噪声,对所述目标文本进行韵律预测,得到所述目标文本的预测韵律特征;其中,所述预测韵律特征,用于供结合所述文本特征进行语音合成,得到所述目标文本的、具有所述预测韵律特征的合成语音;通过本申请,能够丰富文本的预测韵律特征的多样性,使得基于预测韵律特征针对文本进行语音合成所得到的合成语音具备多样化。

    用于柔性驱动机器人的自适应变阻抗控制方法、系统与设备

    公开(公告)号:CN113858201B

    公开(公告)日:2023-04-25

    申请号:CN202111153304.8

    申请日:2021-09-29

    Applicant: 清华大学

    Inventor: 李翔 张轩 李秀

    Abstract: 本申请提供一种意图驱动的自适应阻抗控制方法、系统、设备、存储介质及机器人,涉及物理性人机交互领域,所述方法包括:获取目标用户的运动数据,将所述运动数据数据输入到运动意图模型,通过所述运动意图模型计算所述目标用户的运动意图,对所述运动意图进行实时追踪,获取变阻抗模型参数,将所述变阻抗模型参数输入驱动器的控制系统模型中,调整驱动器输出力矩,以使所述机器人进行动作。本申请并不是简单的引导人类或者跟随人类,而是评估人类的运动意图,主动采取措施对人类进行协助,本申请的方法能够实现稳定的闭环控制过程,其安全性得到严格保证,通过本申请的方法能够实现人机之间安全、高效的交互。

    一种四足机器人进行动态物体操作的方法和装置

    公开(公告)号:CN120056132A

    公开(公告)日:2025-05-30

    申请号:CN202510493022.4

    申请日:2025-04-18

    Applicant: 清华大学

    Inventor: 李翔 朱东杰

    Abstract: 本申请提供了一种四足机器人进行动态物体操作的方法和装置,涉及四足机器人控制技术领域,旨在实现四足机器人在复杂地形上的动态物体操作。该方法包括:获取机器人本体感知数据、目标物体位置和用户指令;通过高层策略网络根据所述机器人本体感知数据、所述目标物体位置和所述用户指令,生成技能索引和低层控制命令;其中,所述技能索引用于指示选择的目标低层技能,所述低层控制命令表征所述目标低层技能的控制命令;通过低层技能网络根据所述技能索引和所述低层控制命令,生成机器人的目标关节位置;根据所述目标关节位置控制机器人在目标地形上对所述目标物体进行操作。

    基于模型预测控制的多指灵巧手可泛化物体操作方法与系统

    公开(公告)号:CN119610115A

    公开(公告)日:2025-03-14

    申请号:CN202411951170.8

    申请日:2024-12-27

    Applicant: 清华大学

    Abstract: 本申请提供了一种基于模型预测控制的多指灵巧手可泛化物体操作方法与系统,涉及灵巧手控制技术领域,旨在控制灵巧手以操作物体稳定运动。该方法包括:基于灵巧手和目标物体的准动态动力学模型,根据目标物体的期望运动进行序列规划,得到参考序列,所述准动态动力学模型具有光滑的接触动力学梯度;根据接触动力学模型对所述参考序列中每个时间步的参考信息进行修正,得到修正参考信息,所述接触动力学模型中接触力随物体间接触距离的变化而改变,所述修正参考信息包括灵巧手期望关节速度和灵巧手期望关节位置;根据所述修正参考信息对所述灵巧手进行控制,以操作所述目标物体实现所述期望运动。

    一种篇章级别多尺度文本韵律分析方法、装置和设备

    公开(公告)号:CN116386595A

    公开(公告)日:2023-07-04

    申请号:CN202310347958.7

    申请日:2023-04-03

    Applicant: 清华大学

    Abstract: 本发明中提供了一种篇章级别多尺度文本韵律分析方法、装置和设备,所述方法包括:将待分析文本拆分为多个语句;利用话语级别多尺度文本韵律分析模型对多个语句进行处理,得到每个语句对应的局部韵律嵌入序列特征和句子级别话语特征;将多个语句的句子级别话语特征输入到长短期记忆网络进行处理,得到篇章级别的全局风格嵌入特征和每个语句对应的具有上下文信息的句子级别话语特征;将具有上下文信息的句子级别话语特征映射为具有上下文信息的音素级别话语特征后和局部韵律嵌入序列特征融合,得到具有上下文信息的局部韵律嵌入序列特征。本发明中能够实现更精细、更连贯的韵律情感控制,实现通过纯文本自动得到符合文本特征韵律情感表达的语音。

    意图驱动的自适应阻抗控制方法、系统、设备、存储介质及机器人

    公开(公告)号:CN113858201A

    公开(公告)日:2021-12-31

    申请号:CN202111153304.8

    申请日:2021-09-29

    Applicant: 清华大学

    Inventor: 李翔 张轩 李秀

    Abstract: 本申请提供一种意图驱动的自适应阻抗控制方法、系统、设备、存储介质及机器人,涉及物理性人机交互领域,所述方法包括:获取目标用户的运动数据,将所述运动数据数据输入到运动意图模型,通过所述运动意图模型计算所述目标用户的运动意图,对所述运动意图进行实时追踪,获取变阻抗模型参数,将所述变阻抗模型参数输入驱动器的控制系统模型中,调整驱动器输出力矩,以使所述机器人进行动作。本申请并不是简单的引导人类或者跟随人类,而是评估人类的运动意图,主动采取措施对人类进行协助,本申请的方法能够实现稳定的闭环控制过程,其安全性得到严格保证,通过本申请的方法能够实现人机之间安全、高效的交互。

Patent Agency Ranking