-
公开(公告)号:CN111627463A
公开(公告)日:2020-09-04
申请号:CN201910151776.6
申请日:2019-02-28
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本公开提供了一种语音VAD尾点确定方法,包括:接收用户的语音信息,对所述语音信息划分数据包,并将数据包按照时序上传给服务器;在判断当前数据包为静音包时,计算当前的静音时长t;根据所述当前的静音时长t和预设的第一阈值T1,触发所述服务器检测所述语音信息的语义完整性,以使所述服务器根据语义完整性检测结果确定所述语音信息的尾点。语音VAD的尾点不再是靠智能设备上进行截断,智能设备将语音信息划分的数据包按照时序上传给服务器,触发服务器检测所述语音信息的语义完整性,以使服务器根据语义完整性检测结果确定所述语音信息的尾点。语音信息的尾点静音时长由原来的固定时长,成为一个可动态调整的值。
-
公开(公告)号:CN111627463B
公开(公告)日:2024-01-16
申请号:CN201910151776.6
申请日:2019-02-28
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本公开提供了一种语音VAD尾点确定方法,包括:接收用户的语音信息,对所述语音信息划分数据包,并将数据包按照时序上传给服务器;在判断当前数据包为静音包时,计算当前的静音时长t;根据所述当前的静音时长t和预设的第一阈值T1,触发所述服务器检测所述语音信息的语义完整性,以使所述服务器根据语义完整性检测结果确定所述语音信息的尾点。语音VAD的尾点不再是靠智能设备上进行截断,智能设备将语音信息划分的数据包按照时序上传给服务器,触发服务器检测所述语音信息的语义完整性,以使服务器根据语义完整性检测结果确定所述语音信息的尾点。语音信息的尾点静音时长由原来的固定时长,成为一个可动态调整的值。
-
公开(公告)号:CN110797004B
公开(公告)日:2021-01-26
申请号:CN201810864442.9
申请日:2018-08-01
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本申请实施例公开了数据传输方法和装置。该方法的一具体实施方式包括:基于音频数据中的边界信息,对音频数据进行切分,得到多个包数据;对多个包数据中的每一个包数据进行编码,得到编码后的包数据,以及按照对应的播放次序,将编码后的包数据发送至终端。实现了以流式方式即将音频数据切分为包数据传输音频数据至终端并且可自适应网络状况控制切分方式,避免了诸如根据文本的停顿进行断句后传输较长的语句的语音而造成的播放卡顿的问题。同时,基于边界信息对音频数据的精确切分可确保每一个包数据在字的粒度上的完整性,避免了音频数据的播放中的抖动问题。
-
公开(公告)号:CN110797004A
公开(公告)日:2020-02-14
申请号:CN201810864442.9
申请日:2018-08-01
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本申请实施例公开了数据传输方法和装置。该方法的一具体实施方式包括:基于音频数据中的边界信息,对音频数据进行切分,得到多个包数据;对多个包数据中的每一个包数据进行编码,得到编码后的包数据,以及按照对应的播放次序,将编码后的包数据发送至终端。实现了以流式方式即将音频数据切分为包数据传输音频数据至终端并且可自适应网络状况控制切分方式,避免了诸如根据文本的停顿进行断句后传输较长的语句的语音而造成的播放卡顿的问题。同时,基于边界信息对音频数据的精确切分可确保每一个包数据在字的粒度上的完整性,避免了音频数据的播放中的抖动问题。
-
-
-