-
公开(公告)号:CN114242041A
公开(公告)日:2022-03-25
申请号:CN202111503269.8
申请日:2021-12-10
Applicant: 北京大学深圳研究院 , 深圳市卫生健康发展研究和数据管理中心
Abstract: 本发明公开了一种语音实时转写录入方法和装置。方法包括:实时识别当前输入的语音;当识别出前k个词后,与句式库中预设句子的前k个词进行匹配,得到相匹配的m个句子;显示所述m个句子,所述m个句子的前i‑1个词均相同,且至少第i个词不同,且i‑1≥k;实时识别继续输入的语音,得到p个词;如果所述p个词与其中某个句子的第i至i+p‑1个词相同,则筛选出该句子作为目标句子;显示并输出所述目标句子的全部或者前i+p‑1个词。本发明方案中,不需要逐字逐句的进行语音输入,而是输入几个关键词即可达到语音输入整个句子的目的。在识别某些领域的专用表达的时候,可以减少语音输入的工作量,提高语音录入的效率。
-
公开(公告)号:CN113990286B
公开(公告)日:2024-11-19
申请号:CN202111272328.5
申请日:2021-10-29
Applicant: 北京大学深圳研究院
Abstract: 本发明涉及语音合成技术,揭露了一种语音合成方法,包括:获取待合成文本,将待合成文本转化为基础音频数据;利用预训练的情感识别模型对待合成文本进行情感识别,得到所述待合成文本的情感类型;利用语义分析模型识别待合成文本的所属角色;从的语音区块链节点中查询所属角色及所述情感类型对应的发音参数;将所述发音参数和所述基础语音数据输入至音频合成器进行合成,得到情感音频数据。其中,本发明构建语音区块链节点来存储发音参数,涉及了区块链技术。本发明还提出一种语音合成装置、电子设备以及存储介质。本发明可以解决合成的语音机械而呆板的问题。
-
公开(公告)号:CN113990286A
公开(公告)日:2022-01-28
申请号:CN202111272328.5
申请日:2021-10-29
Applicant: 北京大学深圳研究院
Abstract: 本发明涉及语音合成技术,揭露了一种语音合成方法,包括:获取待合成文本,将待合成文本转化为基础音频数据;利用预训练的情感识别模型对待合成文本进行情感识别,得到所述待合成文本的情感类型;利用语义分析模型识别待合成文本的所属角色;从的语音区块链节点中查询所属角色及所述情感类型对应的发音参数;将所述发音参数和所述基础语音数据输入至音频合成器进行合成,得到情感音频数据。其中,本发明构建语音区块链节点来存储发音参数,涉及了区块链技术。本发明还提出一种语音合成装置、电子设备以及存储介质。本发明可以解决合成的语音机械而呆板的问题。
-
-