-
公开(公告)号:CN114242031B
公开(公告)日:2024-09-10
申请号:CN202111535836.8
申请日:2021-12-15
Applicant: 清华大学深圳国际研究生院
Abstract: 本发明提供一种跨说话人语音风格建模方法及计算机可读存储介质,方法包括:构建跨说话人语音风格模型,包括:音频特征提取模块、目标标签分类模块、目标域标签筛选模块、对抗标签分类模块依序连接,用于提取输入音频块的音色特征和风格特征;构建多说话人多风格类别的数据集并采用数据集训练跨说话人语音风格模型直至提取的音色特征和风格特征的误差不再下降;将任意一个说话人标签和一个风格类别标签输入到训练好的跨说话人语音风格模型中与语音合成系统一起得到音色与说话人标签一致、风格与风格标签一致的语音。得到具备跨说话人迁移能力的语音风格模型;通过基于块式组合的音频特征提取机制提高模型对于音色和风格建模结果的鲁棒性。
-
公开(公告)号:CN116700244A
公开(公告)日:2023-09-05
申请号:CN202310622800.6
申请日:2023-05-29
Applicant: 清华大学
IPC: G05D1/02
Abstract: 本申请公开了一种用于受限环境中物体取送的自动化操作方法及装置,涉及物体运输技术领域,包括:获取预设区域内的物体的尺寸信息、物体的初始位置、物体的目的位置,以及障碍物的尺寸信息和障碍物位置;根据物体的尺寸信息、初始位置、目的位置、障碍物的尺寸信息以及障碍物位置,确定物体从初始位置到目的位置经过的多个路径点,以及所有的路径点对应的作用力信息,路径点包括初始位置;根据路径点以及作用力信息,控制推送装置将物体从初始位置推送至目的位置,以实现将物体推送至目的位置,且无需工作人员人工操作推送装置推送物体,提高了工作效率,解决了在先技术中工作效率低下的问题。
-
公开(公告)号:CN116342480A
公开(公告)日:2023-06-27
申请号:CN202310076554.9
申请日:2023-01-16
Applicant: 清华大学
Abstract: 本发明实施例提供了一种遮挡鲁棒的柔性线缆状态感知方法、装置和设备,所述方法包括:获取柔性线缆的三维点云;通过点云特征提取网络对所述三维点云进行特征提取,得到点云深度特征;利用端到端回归分支网络将所述点云深度特征映射为柔性线缆上均匀分布的M个关键节点的第一预测三维位置;利用点对点投票分支网络将所述点云深度特征映射为柔性线缆M个关键节点的第二预测三维位置;基于非刚性点云配准网络将所述端到端回归分支网络预测结果和所述点对点投票分支网络预测结果进行融合,得到柔性线缆状态感知结果。本发明实施例能实现在遮挡的有障碍环境中对柔性线缆复杂形状的精准状态感知,并能广泛用于不同长度、粗细、材质的柔性线缆。
-
公开(公告)号:CN116127318A
公开(公告)日:2023-05-16
申请号:CN202310076921.5
申请日:2023-01-16
Applicant: 清华大学
IPC: G06F18/214 , A61B5/11 , A61B5/00 , G06F18/20
Abstract: 本发明提供了一种基于VAE的下肢外骨骼异常状态检测方法、装置和设备,所述方法包括:采集人体穿戴外骨骼机器人的行走数据;将行走数据输入到预先训练好的VAE网络进行数据重构,得到与行走数据对应的重构数据;根据行走数据和重构数据计算异常得分;在异常得分超过预设阈值的情况下,确定人体与外骨骼机器人交互异常。在本发明中,VAE网络仅使用少量的正常行走数据进行训练,无需机器异常使用数据,因此降低了数据获取成本,同时能保证异常检测的高准确性与实时性。通过直接将行走数据输入VAE网络就能实现在人体与外骨骼机器人在交互过程中的故障、运行错误等异常检测,且能够追踪连续变化的异常状态,通过计算异常得分对异常状态进行定量评估。
-
公开(公告)号:CN113327572A
公开(公告)日:2021-08-31
申请号:CN202110612224.8
申请日:2021-06-02
Applicant: 清华大学深圳国际研究生院
IPC: G10L13/027 , G10L13/06 , G10L13/08 , G10L25/63
Abstract: 本发明公开了一种基于情感类别标签的可控情感语音合成系统及方法,该方法包括:文本特征提取步骤,用于从输入的音素序列中提取出语音文本特征;语音风格特征提取步骤,用于接收与音素序列对应的目标语音的声学特征,并从声学特征中提取出语音风格特征;语音风格特征记忆步骤,用于根据语音风格特征得到目标语音的情感风格特征;声学特征预测步骤,用于根据语音文本特征和情感风格特征预测合成情感语音声学特征。本发明可提高语音风格特征与语音文本特征的解耦程度,使得合成语音的风格调控结果不受文本内容限制,提升合成语音的可控性和灵活性,并且可有效利用语料中语音的情感标签与各情感数据分布信息,以更高效地提取各情感的语音风格特征。
-
公开(公告)号:CN112598306A
公开(公告)日:2021-04-02
申请号:CN202011591652.9
申请日:2020-12-29
Applicant: 清华大学 , 北京辰安科技股份有限公司 , 北京辰安信息科技有限公司
Abstract: 本申请提出一种客服坐席的配置方法、装置、电子设备和存储介质,其中,该方法包括:在对当前日期对应的客服坐席进行配置的过程中,结合当前日期之前的前n天的历史接警数据,确定包括当前日期在内的后续m天中的最大的日接警量预测值以及确定出当前日期所需要的正常坐席数,根据前n天的历史接警数据,确定前n天中的最大日接警量,结合最大日接警量、正常接警坐席数和最大的日接警量预测值,确定出当前日期所需要的冗余接警坐席数,根据正常接警坐席和冗余接警坐席数,对当前日期所对应的客服坐席进行配置。由此,准确实现了对当前日期所对应的客服坐席进行配置,从而提高了当前日期的客服坐席的配置,有效合理的安排坐席处理接警需求。
-
公开(公告)号:CN222549331U
公开(公告)日:2025-03-04
申请号:CN202323159424.6
申请日:2023-11-22
Applicant: 清华大学
Abstract: 本申请提供了一种适用于骨科手术的自动化传感装置,包括均用于装配到手术机器人的机械臂上的力传感器、视觉传感器和钻孔模组;其中,钻孔模组,用于装配钻具,并推动钻具执行钻孔操作;力传感器,用于检测钻具在钻孔操作中的力矩信息;视觉传感器,用于获取手术区域的图像数据;其中,力传感器、视觉传感器和钻孔模组分别与手术机器人的控制系统连接;控制系统,用于接收力矩信息和图像数据,控制钻孔模组朝手术区域以目标力矩钻孔。通过本申请提供的装置,实现精确控制钻具的位置和动作,以协助医师完成手术,实现了在复杂精细手术中的应用,降低了手术过程中的复杂性和缩短了手术时间。
-
公开(公告)号:CN203151433U
公开(公告)日:2013-08-21
申请号:CN201220472136.9
申请日:2012-09-14
Applicant: 清华大学
Abstract: 本实用新型公开了属于无线通信技术的功率放大器设计领域的一种基于T型网络和耦合线的双频同步式功率放大器,基于T型网络和耦合线的双频同步式功率放大器具有双路或者多路双频Doherty功放,一个双频主功放和一个双频辅助功放连接至双频双路功分器加90°相位差输出的功分器模块;双频定向耦合器或双频双路功分器加90°相位差输出的功分器模块与输入端连接,双频主功放和双频辅助功放分别与主双频延迟线和辅双频延迟线连接,可以双频同步式工作在任意两种频段上,在不同频带上均能实现效率的提高。双频Doherty在单个频带上的表现与传统Doherty功放相同,能提高小功率区的效率,在大功率区保持高效率。
-
-
-
-
-
-
-