-
公开(公告)号:CN111627463B
公开(公告)日:2024-01-16
申请号:CN201910151776.6
申请日:2019-02-28
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本公开提供了一种语音VAD尾点确定方法,包括:接收用户的语音信息,对所述语音信息划分数据包,并将数据包按照时序上传给服务器;在判断当前数据包为静音包时,计算当前的静音时长t;根据所述当前的静音时长t和预设的第一阈值T1,触发所述服务器检测所述语音信息的语义完整性,以使所述服务器根据语义完整性检测结果确定所述语音信息的尾点。语音VAD的尾点不再是靠智能设备上进行截断,智能设备将语音信息划分的数据包按照时序上传给服务器,触发服务器检测所述语音信息的语义完整性,以使服务器根据语义完整性检测结果确定所述语音信息的尾点。语音信息的尾点静音时长由原来的固定时长,成为一个可动态调整的值。
-
公开(公告)号:CN111627463A
公开(公告)日:2020-09-04
申请号:CN201910151776.6
申请日:2019-02-28
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本公开提供了一种语音VAD尾点确定方法,包括:接收用户的语音信息,对所述语音信息划分数据包,并将数据包按照时序上传给服务器;在判断当前数据包为静音包时,计算当前的静音时长t;根据所述当前的静音时长t和预设的第一阈值T1,触发所述服务器检测所述语音信息的语义完整性,以使所述服务器根据语义完整性检测结果确定所述语音信息的尾点。语音VAD的尾点不再是靠智能设备上进行截断,智能设备将语音信息划分的数据包按照时序上传给服务器,触发服务器检测所述语音信息的语义完整性,以使服务器根据语义完整性检测结果确定所述语音信息的尾点。语音信息的尾点静音时长由原来的固定时长,成为一个可动态调整的值。
-
公开(公告)号:CN111768790A
公开(公告)日:2020-10-13
申请号:CN201910195180.6
申请日:2019-03-14
Applicant: 百度在线网络技术(北京)有限公司
IPC: G10L19/00 , G10L19/032
Abstract: 本申请实施例公开了用于传输语音数据的方法和装置。该方法的一具体实施方式包括:根据预设时间段内发送的语音数据量确定语音数据传输所需的最小带宽;根据接收到的至少两条回复确认报文确定语音数据传输的可用带宽;基于最小带宽与可用带宽调整音频编码器的码率参数;使用调整过码率参数的音频编码器对采集到的语音进行编码,得到编码后的语音数据;向语音数据接收方发送编码后的语音数据。该实施方式提供了一种基于可变码率的音频编码器的语音数据传输机制,提高了传输语音数据的效率。
-
公开(公告)号:CN111768790B
公开(公告)日:2023-11-21
申请号:CN201910195180.6
申请日:2019-03-14
Applicant: 百度在线网络技术(北京)有限公司
IPC: G10L19/00 , G10L19/032
-
-
-