专利检索 cpc:"G10L13/033" 第 1 页

1.

发明公开
声音处理装置和方法无效

公开(公告)号：CN109643539A

公开(公告)日：2019-04-16

申请号：CN201780049113.2

申请日：2017-08-03

申请人： 索尼公司

发明人： 岩濑广 , 斋藤真里 , 河野真一

IPC分类号： G10L13/02 , G10L13/033 , H04R3/00

CPC分类号： G10L13/033 , G10L13/02 , G10L13/043 , G10L25/27 , G10L25/93 , H04R3/00

摘要： 本技术涉及允许呈现语音回放的进度的状态的语音处理装置和方法。该语音处理装置设置有控制单元，该控制单元根据语音回放来控制语音输出，该语音输出在听觉上指示相对于整个语音回放的进度。该技术可以应用于语音生成进度呈现UI系统。

2.

发明公开
歌声合成方法及装置有权

公开(公告)号：CN109147757A

公开(公告)日：2019-01-04

申请号：CN201811056146.2

申请日：2018-09-11

申请人： 广州酷狗计算机科技有限公司

发明人： 劳振锋

IPC分类号： G10L13/02 , G10L13/033

CPC分类号： G10L13/02 , G10L13/033

摘要： 本发明公开了一种歌声合成方法及装置，属于语音合成技术领域。所述方法包括：当获取到用户语音时，提取出所述用户语音中每个字的基频、包络和辅音信息；根据歌曲中每个字的音高频率，对所述用户语音中每个字的基频进行调整，所述歌曲中每个字的音高频率为所述歌曲中每个字的音高对应的频率；对调整后的基频、所述用户语音中每个字的包络和辅音信息进行合成处理，得到合成音频；根据所述歌曲中每个字的时长，对所述合成音频中每个字的时长进行调整，得到合成的用户歌声。本发明采用用户原本的包络和辅助信息合成用户歌声，可以保留用户原本的音色，合成的用户歌声与用户的声音更为接近。

3.

发明公开
一种语音处理方法及电子设备审中-实审

公开(公告)号：CN109036373A

公开(公告)日：2018-12-18

申请号：CN201810857848.4

申请日：2018-07-31

申请人： 北京微播视界科技有限公司

发明人： 王丽娜

IPC分类号： G10L13/033 , G10L13/04 , G10L13/08 , G10L15/18 , G10L15/183 , G10L15/19 , G10L21/0208

CPC分类号： G10L13/033 , G10L13/043 , G10L13/08 , G10L15/1822 , G10L15/183 , G10L15/19 , G10L21/0208 , G10L2021/02087

摘要： 本申请公开了一种语音处理方法及电子设备，该方法包括：对获取的预播报信息的内容进行语义识别；根据识别结果生成与所述预播报信息相对应的背景音频及语音信息；对所述背景音频及所述语音信息进行合成操作，生成与所述预播报信息相对应的播报音频。该语音处理方法能够对背景音频及语音信息进行合成操作，使得在对语音信息进行播报的同时还能够播放背景音频，增强用户体验。

4.

发明公开
用于提供与方言相关联的输出的方法、设备及程序产品审中-实审

公开(公告)号：CN108986802A

公开(公告)日：2018-12-11

申请号：CN201810338000.0

申请日：2018-04-16

申请人： 联想(新加坡)私人有限公司

发明人： 瑞安·查尔斯·克努森 , 罗德里克·埃科尔斯

IPC分类号： G10L15/22 , G10L15/30 , G10L15/08 , H04M1/725

CPC分类号： G10L13/033 , G10L13/047 , G10L15/005 , G10L25/27 , G10L25/75

摘要： 一个实施方式提供了一种用于提供与方言相关联的输出的方法、设备及程序产品。该方法包括：在信息处理设备处，接收可听用户输入；使用处理器来确定与可听用户输入相关联的方言；以及基于该确定来提供与该方言相关联的输出。描述并且要求保护了其他方面。

5.

发明公开
一种流程模型图的多语言文本及语音生成方法有权

公开(公告)号：CN108681529A

公开(公告)日：2018-10-19

申请号：CN201810250865.1

申请日：2018-03-26

申请人： 山东科技大学

发明人： 曾庆田 , 原桂远 , 段华 , 刘聪 , 李超 , 鲁法明 , 倪维健 , 周长红 , 赵华 , 林泽东 , 刁秀丽 , 温彦 , 张峰

IPC分类号： G06F17/24 , G10L13/02 , G10L13/033 , G10L13/04

CPC分类号： G06F17/241 , G10L13/02 , G10L13/033 , G10L13/04

摘要： 本发明公开了一种流程模型图的多语言文本及语音生成方法，属于流程挖掘领域。本发明首先识别流程模型图中的模型元素、模型节点文本和模型有向边，并将识别的流程模型存储为标准流程模型文件；然后使用多语言语义依存解析模型元素文本，使用RPST算法解析模型结构，使用带注释流程结构树存储模型元素文本和流程模型结构信息；然后根据文本信息数量和结构复杂度对带注释流程结构树划分，然后使用深度语法树从带注释流程结构树生成流程模型的多语言文本，最后从多语言文本生成流程模型的多语言语音。本发明能够正确的识别流程模型图中的流程模型，能够正确的解析流程模型的文本及结构，能够生成语法正确的文本和发音正确的语音。

6.

发明公开
声音处理装置、声音处理方法以及存储介质有权

公开(公告)号：CN108630213A

公开(公告)日：2018-10-09

申请号：CN201710761063.2

申请日：2017-08-30

申请人： 株式会社 , 东芝

发明人： 山本雅裕

IPC分类号： G10L21/013 , G10L21/003

CPC分类号： G10L13/08 , G10L13/033 , G10L13/04 , G10L13/10 , G10L21/003

摘要： 提供能够使利用者的注意力增强的声音处理装置、声音处理方法以及存储介质。声音处理装置具备确定部、决定部和调制部。确定部确定要输出的声音的强调部分。决定部决定多个输出部中的、要输出用于强调强调部分的声音的第1输出部及第2输出部。调制部对使第1输出部输出的第1声音及使第2输出部输出的第2声音中的至少一方的强调部分进行调制，以使得在第1声音的强调部分与第2声音的强调部分之间，音调及相位中的至少一方不同。

7.

发明公开
一种模拟用户说话的语音合成方法及系统无效

公开(公告)号：CN107833572A

公开(公告)日：2018-03-23

申请号：CN201711080690.6

申请日：2017-11-06

申请人： 芋头科技(杭州)有限公司

发明人： 孟猛

IPC分类号： G10L13/08 , G10L13/033 , G10L13/04 , G10L15/26 , G10L15/02

CPC分类号： G10L13/08 , G10L13/033 , G10L13/043 , G10L15/02 , G10L15/26

摘要： 本发明公开了一种模拟用户说话的语音合成方法及系统，属于语音合成技术领域；方法包括步骤S1，获取外部输入的一段待模拟语音；步骤S2，将待模拟语音识别为对应的包括多个顺序排列的基本音子的发音文本；步骤S3，根据待模拟语音分别处理得到发音文本中每个基本音子的发音时段信息；步骤S4，将发音文本和发音时段信息送入包括一预先训练形成的语音合成模型的语音合成器中，以得到对应于待模拟语音的合成语音并输出。系统包括语音获取单元、语音识别单元、处理单元以及合成单元。上述技术方案的有益效果是：体现语音模拟应用的音色一致性，突出应用本身的个性特点，同时提供给用户更有特色的合成语音，提升用户的使用体验。

8.

发明公开
一种信息播放方法、第一电子设备和计算机存储介质有权

公开(公告)号：CN107767857A

公开(公告)日：2018-03-06

申请号：CN201710892040.5

申请日：2017-09-27

申请人： 联想(北京)有限公司

发明人： 赵静滨

IPC分类号： G10L13/033 , G10L21/007 , G10L21/013

CPC分类号： G10L13/033 , G10L13/0335 , G10L21/007 , G10L21/013

摘要： 本发明实施例公开了一种信息播放方法，所述方法包括：获取第一特征信息；其中，所述第一特征信息是用户对第一电子设备进行操作后产生的；基于所述第一特征信息，确定第一声音模型；接收播放指令，并响应所述播放指令采用所述第一声音模型，播放预设声音信息。本发明的实施例同时还公开了一种第一电子设备。

9.

发明公开
基于面部结构合成话音的方法和装置有权

公开(公告)号：CN106575500A

公开(公告)日：2017-04-19

申请号：CN201580045327.3

申请日：2015-08-28

申请人： 英特尔公司

发明人： S.贝甘 , A.A.奥加内佐夫

IPC分类号： G10L13/027 , G10L13/047 , G06K9/00

CPC分类号： G10L13/027 , G06K9/00315 , G10L13/033 , G10L13/047

摘要： 所公开的是用于使用在基于发音的文本到语音转换系统中的实施例，所述系统配置成基于定义人员的话音的外部可视发音语音合成模型参数的面部特性和基于从预定义的模型的储存库之中选择的预定义的发音语音合成模型而建立人员的话音的发音语音合成模型。

10.

发明公开
稳定音色的音乐语音变调方法无效

公开(公告)号：CN106228973A

公开(公告)日：2016-12-14

申请号：CN201610573399.1

申请日：2016-07-21

申请人： 福州大学

发明人： 张栋 , 彭建云 , 余春艳 , 张为凡 , 刘宇欣

IPC分类号： G10L13/033 , G10L19/125 , G10L25/15 , G10L25/24 , G10L25/45 , G10L25/90

CPC分类号： G10L13/033 , G10L13/0335 , G10L19/125 , G10L25/15 , G10L25/24 , G10L25/45 , G10L25/90

摘要： 本发明涉及一种稳定音色的音乐语音变调方法，利用语音信号可分为声门激励分量和声道冲激响应分量，通过语音信号的倒谱序列导出频谱包络，然后利用频谱包络分离出语音信号的激励分量，再将语音信号的激励分量通过变调算法处理改变其音高，最后将频谱包络和音高改变后的激励分量重新合成，得到音高改变但音色稳定的音乐语音信号。本发明所提出的一种稳定音色的音乐语音变调方法，该方法简单，实现灵活，具有较强的实用性。

搜索结果

国家/区域

专利有效性

申请日

公布(公告)日

申请人

申请人所在国/区域

发明人

IPC

IPC部

IPC大类

IPC小类

IPC大组

IPC小组

外观分类