-
公开(公告)号:CN110060685B
公开(公告)日:2021-05-28
申请号:CN201910297806.4
申请日:2019-04-15
Applicant: 百度在线网络技术(北京)有限公司
IPC: G10L15/26 , G10L21/0208 , G10L15/22
Abstract: 本申请提出一种语音唤醒方法和装置,其中,方法包括:通过电子设备的音视频硬件抽象层接口,获取电子设备当前采集的音频数据;将采集的音频数据进行降噪处理,生成待检测的音频数据;对待检测的音频数据进行唤醒词检测,确定待检测的音频数据中是否包含唤醒词;若待检测的音频数据中包含唤醒词,则对电子设备进行唤醒处理。该方法能够实现提升语音唤醒效率,降低唤醒时延。
-
公开(公告)号:CN108962219A
公开(公告)日:2018-12-07
申请号:CN201810695218.1
申请日:2018-06-29
Applicant: 百度在线网络技术(北京)有限公司
Inventor: 房伟伟
Abstract: 本申请实施例公开了用于处理文本的方法和装置。该方法的一具体实施方式包括:获取待处理文本;分析待处理文本,得到待处理文本的情节信息,其中,情节信息用来描述待处理文本的内容;基于情节信息,确定待处理文本对应的语音特征信息,其中,语音特征信息用来表示待处理文本对应的语音的特征,语音特征信息包括以下至少一项:语速信息、音调信息和语气信息。该实施方式实现了通过对文本的分析处理得到文本对应的语音的语速、音调和语气等语音特征。
-
公开(公告)号:CN108962219B
公开(公告)日:2019-12-13
申请号:CN201810695218.1
申请日:2018-06-29
Applicant: 百度在线网络技术(北京)有限公司
Inventor: 房伟伟
Abstract: 本申请实施例公开了用于处理文本的方法和装置。该方法的一具体实施方式包括:获取待处理文本;分析待处理文本,得到待处理文本的情节信息,其中,情节信息用来描述待处理文本的内容;基于情节信息,确定待处理文本对应的语音特征信息,其中,语音特征信息用来表示待处理文本对应的语音的特征,语音特征信息包括以下至少一项:语速信息、音调信息和语气信息。该实施方式实现了通过对文本的分析处理得到文本对应的语音的语速、音调和语气等语音特征。
-
公开(公告)号:CN108962226B
公开(公告)日:2019-12-20
申请号:CN201810792887.0
申请日:2018-07-18
Applicant: 百度在线网络技术(北京)有限公司
Inventor: 房伟伟
Abstract: 本申请实施例公开了用于检测语音的端点的方法和装置。该方法的一具体实施方式包括:基于获取到的音频数据,生成音频帧序列,其中,生成的音频帧序列中的音频帧与音频帧类型相对应,音频帧类型为语音类型或非语音类型;对于音频帧序列中的语音类型的音频帧,确定声源发出该音频帧对应的声音时的位置信息;根据音频帧序列中的音频帧对应的音频帧类型和位置信息,确定音频帧序列对应的音频中语音的端点。该实施方式提供了新的检测语音的端点的方式。
-
公开(公告)号:CN110060685A
公开(公告)日:2019-07-26
申请号:CN201910297806.4
申请日:2019-04-15
Applicant: 百度在线网络技术(北京)有限公司
IPC: G10L15/26 , G10L21/0208 , G10L15/22
Abstract: 本申请提出一种语音唤醒方法和装置,其中,方法包括:通过电子设备的音视频硬件抽象层接口,获取电子设备当前采集的音频数据;将采集的音频数据进行降噪处理,生成待检测的音频数据;对待检测的音频数据进行唤醒词检测,确定待检测的音频数据中是否包含唤醒词;若待检测的音频数据中包含唤醒词,则对电子设备进行唤醒处理。该方法能够实现提升语音唤醒效率,降低唤醒时延。
-
公开(公告)号:CN108962226A
公开(公告)日:2018-12-07
申请号:CN201810792887.0
申请日:2018-07-18
Applicant: 百度在线网络技术(北京)有限公司
Inventor: 房伟伟
Abstract: 本申请实施例公开了用于检测语音的端点的方法和装置。该方法的一具体实施方式包括:基于获取到的音频数据,生成音频帧序列,其中,生成的音频帧序列中的音频帧与音频帧类型相对应,音频帧类型为语音类型或非语音类型;对于音频帧序列中的语音类型的音频帧,确定声源发出该音频帧对应的声音时的位置信息;根据音频帧序列中的音频帧对应的音频帧类型和位置信息,确定音频帧序列对应的音频中语音的端点。该实施方式提供了新的检测语音的端点的方式。
-
-
-
-
-