-
公开(公告)号:CN110797004B
公开(公告)日:2021-01-26
申请号:CN201810864442.9
申请日:2018-08-01
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本申请实施例公开了数据传输方法和装置。该方法的一具体实施方式包括:基于音频数据中的边界信息,对音频数据进行切分,得到多个包数据;对多个包数据中的每一个包数据进行编码,得到编码后的包数据,以及按照对应的播放次序,将编码后的包数据发送至终端。实现了以流式方式即将音频数据切分为包数据传输音频数据至终端并且可自适应网络状况控制切分方式,避免了诸如根据文本的停顿进行断句后传输较长的语句的语音而造成的播放卡顿的问题。同时,基于边界信息对音频数据的精确切分可确保每一个包数据在字的粒度上的完整性,避免了音频数据的播放中的抖动问题。
-
公开(公告)号:CN110797004A
公开(公告)日:2020-02-14
申请号:CN201810864442.9
申请日:2018-08-01
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本申请实施例公开了数据传输方法和装置。该方法的一具体实施方式包括:基于音频数据中的边界信息,对音频数据进行切分,得到多个包数据;对多个包数据中的每一个包数据进行编码,得到编码后的包数据,以及按照对应的播放次序,将编码后的包数据发送至终端。实现了以流式方式即将音频数据切分为包数据传输音频数据至终端并且可自适应网络状况控制切分方式,避免了诸如根据文本的停顿进行断句后传输较长的语句的语音而造成的播放卡顿的问题。同时,基于边界信息对音频数据的精确切分可确保每一个包数据在字的粒度上的完整性,避免了音频数据的播放中的抖动问题。
-
公开(公告)号:CN109087627A
公开(公告)日:2018-12-25
申请号:CN201811202290.2
申请日:2018-10-16
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本申请实施例公开了用于生成信息的方法和装置。该方法的一具体实施方式包括:对于预先设定的语音集合中语音的音节,提取该音节对应的基频,得到针对该音节的基频序列,根据上述基频序列得到针对该音节的基频特征信息;统计上述语音集合中语音的音节的基频特征信息,得到统计结果;根据上述统计结果,生成上述语音集合中语音的音节的重音信息。该实施方式实现了语音集合中语音的音节的重音信息的自动生成。
-
公开(公告)号:CN105529023A
公开(公告)日:2016-04-27
申请号:CN201610049832.1
申请日:2016-01-25
Applicant: 百度在线网络技术(北京)有限公司
IPC: G10L13/02 , G10L13/033 , G10L13/047 , G10L13/10
Abstract: 本发明提出一种语音合成方法和装置,该语音合成方法包括:对要合成的文本进行文本特征提取,获取上下文特征信息;获取预先生成的模型,所述模型是根据训练样本的上下文特征信息和变换后的声学参数进行训练后生成的,所述变换后的声学参数包括多个韵律层级的基频参数;根据所述模型,确定与所述上下文特征信息对应的模型输出参数,所述模型输出参数包括:多个韵律层级的基频参数;对所述多个韵律层级的基频参数进行基频重构;根据基频重构后的参数和所述模型输出参数中的其他参数得到合成语音。该方法能够提高合成语音的表现效果。
-
公开(公告)号:CN110677802B
公开(公告)日:2022-05-13
申请号:CN201810720462.9
申请日:2018-07-03
Applicant: 百度在线网络技术(北京)有限公司
IPC: H04S7/00
Abstract: 本申请实施例公开了用于处理音频的方法和装置。上述方法的一具体实施方式包括:获取目标位置的信息;基于目标位置的信息,确定目标头相关传递函数;利用目标头相关传递函数对预设音频进行处理,得到目标音频。该实施方式使得处理后得到的目标音频包括目标位置的方位信息,提高了用户的收听效果。
-
公开(公告)号:CN109346109A
公开(公告)日:2019-02-15
申请号:CN201811482074.8
申请日:2018-12-05
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本申请实施例公开了基频提取方法和装置。该方法的一具体实施方式包括:基于待处理语音信号的声学特征,提取待处理语音信号中各语音帧的候选基频点;对语音帧进行清浊音分类,得到各语音帧对应的清浊音类别;基于各语音帧对应的清浊音类别以及预设的基频筛选条件对候选基频点进行修正,并采用动态规划算法从修正后的候选基频点中确定出待处理语音信号的基频序列。该实施方式提升了基频提取的准确性。
-
公开(公告)号:CN105654940A
公开(公告)日:2016-06-08
申请号:CN201610051963.3
申请日:2016-01-26
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本发明提供了一种语音合成方法和装置,其中方法包括:利用预先训练的第一模型,从语音库中针对待合成语音挑选候选语音单元构成备选空间;利用预先训练的第二模型,从备选空间中选择语音单元用于拼接,使得选择的语音单元构成的序列的搜索代价最优;所述第一模型和所述第二模型中至少一个为神经网络模型。本发明能够提高最终合成的语音的自然度和表现力。
-
公开(公告)号:CN109979422B
公开(公告)日:2021-09-28
申请号:CN201910130728.9
申请日:2019-02-21
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本发明提供一种基频处理方法、装置、设备及计算机可读存储介质,方法包括:接收第一基频提取工具提取的歌唱音频的第一基频,以及第二基频提取工具提取的音符音频的第二基频;根据预设的对齐规则对所述第一基频以及所述第二基频进行边界对齐操作,获得待处理文件;根据预设的提取规则从所述待处理文件中提取待训练数据;通过所述待训练数据对预设的待训练模型进行训练,获得基频建立模型。从而后续能够根据该基频建立模型实现对基频的建立,由于该基频建立模型通过待处理文件中提取出的待训练数据进行训练,从而根据该基频建立模型得到的基频能够模拟真实歌声中的多种技巧种类,基频表现力较高。
-
公开(公告)号:CN105529023B
公开(公告)日:2019-09-03
申请号:CN201610049832.1
申请日:2016-01-25
Applicant: 百度在线网络技术(北京)有限公司
IPC: G10L13/02 , G10L13/033 , G10L13/047 , G10L13/10
Abstract: 本发明提出一种语音合成方法和装置,该语音合成方法包括:对要合成的文本进行文本特征提取,获取上下文特征信息;获取预先生成的模型,所述模型是根据训练样本的上下文特征信息和变换后的声学参数进行训练后生成的,所述变换后的声学参数包括多个韵律层级的基频参数;根据所述模型,确定与所述上下文特征信息对应的模型输出参数,所述模型输出参数包括:多个韵律层级的基频参数;对所述多个韵律层级的基频参数进行基频重构;根据基频重构后的参数和所述模型输出参数中的其他参数得到合成语音。该方法能够提高合成语音的表现效果。
-
公开(公告)号:CN104538024B
公开(公告)日:2019-03-08
申请号:CN201410720550.0
申请日:2014-12-01
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本发明提供了语音合成方法、装置和设备。该方法包括:获取待处理文本的语境信息;根据所述语境信息利用时长预测模型确定语音时长,其中所述时长预测模型是基于深度神经网络训练得到;根据所述语境信息及所述语音时长,利用谱和基频预测模型确定谱和基频特征参数;根据所述谱和基频特征参数得到合成语音。本发明提供的语音合成方法能够提供高音质、自然流畅的语音。
-
-
-
-
-
-
-
-
-