Patent search ap:("百度在线网络技术(北京)有限公司") AND inv:"陈建哲" Page 1

1.

发明授权
语音唤醒的数据包处理方法和装置有权转让

公开(公告)号：CN110046045B

公开(公告)日：2021-07-30

申请号：CN201910268017.8

申请日：2019-04-03

Applicant: 百度在线网络技术(北京)有限公司

Inventor： 贺学焱 , 陈建哲 , 王兴

IPC: G06F9/50 , G10L15/26 , G10L15/28

Abstract: 本申请提出一种语音唤醒的数据包处理方法和装置，其中，方法包括：通过获取当前语音数据包的音频时间长度和预计处理时间；根据音频时间长度和预计处理时间生成唤醒引擎的唤醒实时率；检测唤醒实时率是否满足预设的数据包处理条件；若唤醒实时率满足预设的数据包处理条件，则将当前累加值增加唤醒实时率后作为新的当前累加值；判断新的当前累加值是否大于等于预设处理阈值；若新的当前累加值大于等于预设处理阈值，则将当前系统中的语音数据包从当前系统中进行删除。由此，通过唤醒引擎根据唤醒实时率检测的机制，主动删除语音数据包，增加了CPU的利用率，预防了唤醒卡顿现象，提升了用户体验。

2.

发明公开
语音唤醒的数据包处理方法和装置有权转让

公开(公告)号：CN110046045A

公开(公告)日：2019-07-23

申请号：CN201910268017.8

申请日：2019-04-03

Applicant: 百度在线网络技术(北京)有限公司

Inventor： 贺学焱 , 陈建哲 , 王兴

IPC: G06F9/50 , G10L15/26 , G10L15/28

Abstract: 本申请提出一种语音唤醒的数据包处理方法和装置，其中，方法包括：通过获取当前语音数据包的音频时间长度和预计处理时间；根据音频时间长度和预计处理时间生成唤醒引擎的唤醒实时率；检测唤醒实时率是否满足预设的数据包处理条件；若唤醒实时率满足预设的数据包处理条件，则将当前累加值增加唤醒实时率后作为新的当前累加值；判断新的当前累加值是否大于等于预设处理阈值；若新的当前累加值大于等于预设处理阈值，则将当前系统中的语音数据包从当前系统中进行删除。由此，通过唤醒引擎根据唤醒实时率检测的机制，主动删除语音数据包，增加了CPU的利用率，预防了唤醒卡顿现象，提升了用户体验。

3.

发明授权
语音信号检测方法和装置有权转让

公开(公告)号：CN109979487B

公开(公告)日：2021-07-30

申请号：CN201910172909.8

申请日：2019-03-07

Applicant: 百度在线网络技术(北京)有限公司

Inventor： 张腾飞 , 陈建哲 , 钟思思

IPC: G10L25/60 , G10L25/03 , G10L25/18

Abstract: 本发明实施例提出一种语音信号检测方法和装置。其中，所述方法包括：向播放设备发送播放指示；根据待测语音指标，向收集设备发送信号收集指示；接收所述收集设备根据所述信号收集指示返回的待测语音信号，所述待测语音信号包括所述收集设备中与所述待测语音指标相关的语音功能节点处理的信号；根据所述待测语音信号，得到分析结果。本发明实施例根据待测语音指标向收集设备发送信号收集指示，从而获得收集设备中与该指标相关的语音功能节点处理的待测语音信号，便于利用待测语音信号确定收集设备中各语音功能节点是否正常。

4.

发明公开
用于处理数据的方法和装置无效转让

公开(公告)号：CN109951729A

公开(公告)日：2019-06-28

申请号：CN201910223981.9

申请日：2019-03-22

Applicant: 百度在线网络技术(北京)有限公司

Inventor： 陈建哲 , 向伟 , 张腾飞

IPC: H04N21/414 , H04N21/439 , H04N21/442 , H04N21/485 , G10L21/0316 , G06F3/16

Abstract: 本申请实施例公开了用于处理数据的方法和装置。该方法的一具体实施方式包括：检测车载终端的音频播放状态是否发生改变；响应于检测到车载终端的音频播放状态发生改变，确定与状态改变对应的数据处理方式；获取待播放的原始音频数据，按照所确定的数据处理方式对所获取的原始音频数据进行平滑处理。该实施方式能够避免在车载终端突然开始播放和突然停止播放时出现的异常音，改善了用户体验。

5.

发明公开
多路语音识别方法、装置、设备及可读存储介质无效转让

公开(公告)号：CN109920405A

公开(公告)日：2019-06-21

申请号：CN201910164535.5

申请日：2019-03-05

Applicant: 百度在线网络技术(北京)有限公司

Inventor： 陈建哲 , 彭汉迎 , 欧阳能钧

IPC: G10L15/02 , G10L15/26 , G10L25/03

Abstract: 本发明实施例提供一种多路语音识别方法、装置、设备及可读存储介质。本发明实施例的方法，通过接收多路麦克风阵列采集的音频数据，对每路音频数据进行波束成形处理，得到每路音频数据中与对应音频采集区域对应的音频信号，削弱该路音频数据中其他方向上的音频信号；对多路音频信号进行干扰抑制处理得到每个音频采集区域对应语音信号，减少其他音频采集区域的噪音信号对该路语音信号的干扰，对各语音信号语音识别得到每个音频采集区域对应的语音识别结果，提高了语音识别的识别率；在多人同时讲话时，抑制各路语音信号间的相互干扰，得到每个音频采集位置对应的语音识别结果，提高了语音识别的效率和准确性。

6.

发明授权
语音处理方法、系统和装置有权

公开(公告)号：CN113823282B

公开(公告)日：2024-08-30

申请号：CN202111108547.X

申请日：2019-06-26

Applicant: 百度在线网络技术(北京)有限公司

Inventor： 陈建哲 , 欧阳能钧 , 袁鼎

IPC: G10L15/22 , G10L15/26 , G10L15/30 , G10L13/04

Abstract: 本申请实施例公开了语音处理方法、系统和装置。该方法的一具体实施方式包括：接收终端设备发送的用户语音，对所述用户语音进行语音识别，得到语音识别结果；向语义服务器发送所述语音识别结果，接收所述语义服务器返回的、针对所述语音识别结果的回复文本；向语音合成服务器发送所述回复文本，将所接收的所述语音合成服务器发送的回复语音向所述终端设备转发。本申请实施例省略了终端设备对服务器返回的结果进行分析处理以及生成请求，有效地节省了处理时间，进而可以缩短终端设备与用户进行交互时，终端设备的反应时间。

7.

发明公开
歌唱者识别方法和装置无效转让

公开(公告)号：CN109308901A

公开(公告)日：2019-02-05

申请号：CN201811148198.2

申请日：2018-09-29

Applicant: 百度在线网络技术(北京)有限公司

Inventor： 陈建哲 , 钟思思 , 贺学焱

IPC: G10L17/04

Abstract: 本申请实施例公开了歌唱者识别方法和装置。该方法的一具体实施方式包括：采用已训练的人声分离模型对待识别的音乐数据进行处理，得到待识别的音乐数据中的人声数据；将待识别的音乐数据中的人声数据输入已训练的歌唱者识别模型，得到待识别的音乐数据的歌唱者识别结果。该实施方式提升了歌唱者识别的准确度。

8.

发明公开
音频信号处理方法、装置、设备和存储介质有权转让

公开(公告)号：CN109273020A

公开(公告)日：2019-01-25

申请号：CN201811147841.X

申请日：2018-09-29

Applicant: 百度在线网络技术(北京)有限公司

Inventor： 欧阳能钧 , 宋晔 , 陈建哲

IPC: G10L21/0208

Abstract: 根据本公开的示例实施例，提供了音频信号处理方法、装置、设备和计算机可读存储介质。音频信号处理方法包括接收来自第一处理设备的第一音频信号，第一处理设备耦合至位于第一区域内的第一音频采集设备，并且适于对由第一音频采集设备所采集的音频信号进行回声消除以得到第一音频信号；接收来自第二处理设备的第二音频信号，第二处理设备耦合至位于与第一区域不同的第二区域内的第二音频采集设备，并且适于对由第二音频采集设备所采集的音频信号进行回声消除以得到第二音频信号；以及利用第二音频信号对第一音频信号进行进一步的回声消除。根据本公开实施例的音频信号处理方案所处理的音频信号具有更高的信噪比和更佳的质量。

9.

发明公开
多音区唤醒测试方法、装置及存储介质无效

公开(公告)号：CN113851109A

公开(公告)日：2021-12-28

申请号：CN202111125311.7

申请日：2019-02-28

Applicant: 百度在线网络技术(北京)有限公司

Inventor： 彭汉迎 , 陈建哲

IPC: G10L15/01 , G10L15/22

Abstract: 本发明实施例提出一种多音区唤醒测试方法、装置及计算机可读存储介质。其中多音区唤醒测试方法包括：记录第一音区的信息，所述第一音区是语音测试文件在多音区的语音测试环境中的播放位置所在音区；获取通过播放所述语音测试文件触发唤醒的第二音区的信息；将所述第二音区的信息与所述第一音区的信息相对比；根据对比结果确定唤醒测试结果。本发明实施例能够针对多音区语音识别的应用场景评估多音区的唤醒效果，得到的唤醒准确度测试结果可用于对多音区算法进行优化，减少了测试的时间损耗，节省了人力成本。

10.

发明公开
语音处理方法、系统和装置有权

公开(公告)号：CN113823282A

公开(公告)日：2021-12-21

申请号：CN202111108547.X

申请日：2019-06-26

Applicant: 百度在线网络技术(北京)有限公司

Inventor： 陈建哲 , 欧阳能钧 , 袁鼎

IPC: G10L15/22 , G10L15/26 , G10L15/30 , G10L13/04

Abstract: 本申请实施例公开了语音处理方法、系统和装置。该方法的一具体实施方式包括：接收终端设备发送的用户语音，对所述用户语音进行语音识别，得到语音识别结果；向语义服务器发送所述语音识别结果，接收所述语义服务器返回的、针对所述语音识别结果的回复文本；向语音合成服务器发送所述回复文本，将所接收的所述语音合成服务器发送的回复语音向所述终端设备转发。本申请实施例省略了终端设备对服务器返回的结果进行分析处理以及生成请求，有效地节省了处理时间，进而可以缩短终端设备与用户进行交互时，终端设备的反应时间。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification