-
公开(公告)号:CN117113972A
公开(公告)日:2023-11-24
申请号:CN202310667063.1
申请日:2023-06-07
Applicant: 上海理工大学
IPC: G06F40/211 , G10L15/26 , G10L15/22 , G06F40/30 , G06F40/268 , G06F18/25 , G06F18/241 , G06F18/2415 , G06F40/289 , G06N3/042 , G06N3/0442 , G06N3/045 , G06N3/0464 , G06N3/048
Abstract: 本发明公开了一种基于情感检测的仿生机器人表情生成方法,该系统包括交互用户、仿生机器头、计算机终端、语音采集和播放装置;整个系统可分为微表情控制指令生成和微表情动作执行两部分,在人机对话过程中,仿生机器头通过语音采集装置和语音识别模块获取用户输入文本信息,然后将输入文本信息分别经过文本对话模块和文本情感检测TSDM模块获得生成文本信息、用户输入情感,再将生成文本信息分别经过文本情感检测TSDM模块和文本转音频模块获得仿生机器头的生成情感和生成音频信息,最后根据用户输入情感和生成情感获得仿生机器头表情控制指令进而控制机器头舵机转动实现微表情动作,本发明,具有自发性的特点。
-
公开(公告)号:CN116741140A
公开(公告)日:2023-09-12
申请号:CN202310773458.X
申请日:2023-06-28
Applicant: 上海理工大学
Abstract: 本发明公开了一种基于中文分词优化的中文语音合成方法:首先利用基于加权自蒸馏的中文分词模型CWS‑WSD将医疗服务机器人交互过程中产生的回复文本进行分词,明确文本中的词汇边界,然后根据分词结果插入相应的停顿标志符,最后将插入标识符后的文本送入Tacotron2进行语音合成。本发明通过在语音合成过程中事先对中文文本进行中文分词,来为文本加入词汇边界,进而在生成的语音中对应地加入停顿来缓解前述提到的歧义和交互质量的问题。
-