Patent search ap:("百度在线网络技术(北京)有限公司") AND inv:"谢延" Page 1

1.

发明授权
智能设备控制方法、装置及计算机设备有权

公开(公告)号：CN107564518B

公开(公告)日：2021-10-22

申请号：CN201710718772.2

申请日：2017-08-21

Applicant: 百度在线网络技术(北京)有限公司

Inventor： 谢波 , 孙杨 , 谢延 , 钱胜

IPC: G10L15/22 , G10L15/26 , G06F9/4401

Abstract: 本发明提出一种智能设备控制方法、装置及计算机设备，其中，该方法包括：对智能设备获取的语音信号进行语音识别，判断所述语音信号对应的控制指令是否与所述智能设备当前的工作场景匹配；若匹配，则根据所述控制指令对所述智能设备的工作状态进行调整。由此，无需唤醒词即可实现根据与当前工作场景匹配的控制指令对智能设备的控制，控制方式简单，提高了控制的灵活性，改善了用户体验。

2.

发明授权
基于人工智能的语音识别方法、装置和系统有权

公开(公告)号：CN107146623B

公开(公告)日：2021-03-16

申请号：CN201710223526.X

申请日：2017-04-07

Applicant: 百度在线网络技术(北京)有限公司

Inventor： 杜念冬 , 谢延 , 唐海员

IPC: G10L15/30 , H04L29/06 , H04L29/08

Abstract: 本发明提出一种基于人工智能的语音识别方法、装置和系统，其中，方法包括：在语音识别过程中，采集待识别的语音数据；通过与服务端的上行连接，向服务端发送上行数据流，其中，上行数据流包括语音数据；在向服务端发送上行数据流的过程中，并行通过与服务端的下行连接，接收服务端发送的下行数据流；其中，下行数据流，包括结果数据，结果数据是服务端根据语音数据进行语音识别得到的。该方法通过两条并行的数据流，以流式数据传输的方式实现了待识别语音数据的实时上传和语音识别结果的实时下发，解决了现有技术中无法实现数据的实时上传和实时下发的技术问题。

3.

发明授权
一种语音唤醒方法、装置、终端和存储介质有权

公开(公告)号：CN107134279B

公开(公告)日：2020-06-19

申请号：CN201710525422.4

申请日：2017-06-30

Applicant: 百度在线网络技术(北京)有限公司

Inventor： 谢波 , 钱胜 , 孙杨 , 谢延

IPC: G10L15/22 , G10L15/30 , G10L15/32 , G10L15/197

Abstract: 本发明公开了一种语音唤醒方法、装置、终端和存储介质，属于语音识别技术领域。该方法包括：获取用于唤醒智能终端的唤醒语音；利用所述智能终端的预设声学模型和预设唤醒词识别网络，对所述唤醒语音的声学特征进行分析，获得所述唤醒语音相对预设唤醒词的声学特征的置信度；若所述置信度位于预设的中等置信度范围内，则将所述唤醒语音上传到远程服务器；若利用所述远程服务器中的语言模型对所述唤醒语音分析得到的语言特征，与所述预设唤醒词的语言特征匹配一致，则接收所述远程服务器生成的智能终端唤醒指令。本发明实施例提供的一种语音唤醒方法、装置、终端和存储介质，实现了用户对唤醒词的自定义。

4.

发明公开
基于声纹的通讯方法、装置和系统有权

公开(公告)号：CN104967622A

公开(公告)日：2015-10-07

申请号：CN201510372778.X

申请日：2015-06-30

Applicant: 百度在线网络技术(北京)有限公司

Inventor： 杜念冬 , 李超 , 谢延

IPC: H04L29/06 , H04L9/32

CPC classification number: G10L17/24 , G06F21/31 , G06F21/32 , H04L63/0861 , H04L9/3231 , H04L63/083

Abstract: 本发明提出一种基于声纹的通讯方法、装置和系统，该基于声纹的通讯方法包括向服务端发送第一信息，并接收所述服务端发送的标识信息，所述标识信息是所述服务端接收到所述第一信息后生成的，所述第一信息是用户账号信息和语音信息中的一种；向所述服务端发送第二信息和所述标识信息，所述第二信息是所述用户账号信息和所述语音信息中的另一种。该方法能够提高基于声纹通讯的安全性。

5.

发明公开
一种语音交互方法、装置、终端及服务器有权

公开(公告)号：CN109741753A

公开(公告)日：2019-05-10

申请号：CN201910026638.5

申请日：2019-01-11

Applicant: 百度在线网络技术(北京)有限公司

Inventor： 王丹 , 邹赛赛 , 马赛 , 宇文宏伟 , 谢延

IPC: G10L15/30

Abstract: 本发明提供一种语音交互方法、装置、终端及服务器，该语音交互方法包括：进行串行的多轮端点检测；针对每轮端点检测得到的每个音频数据，向服务器发送识别会话请求信息，由所述服务器对所述多轮端点检测得到的多个音频数据进行识别；接收所述服务器发送的识别结果以及与所述识别结果对应的目标播报内容。本发明的实施例，可以实现持续的多次语音识别过程，从而减少环境音和/或说话人停顿间隔等对识别准确性的影响，不仅支持犹豫发问，还提高识别准确率，增强终端的响应自然度。

6.

发明公开
基于人工智能的语音识别方法、装置和系统有权

公开(公告)号：CN107146623A

公开(公告)日：2017-09-08

申请号：CN201710223526.X

申请日：2017-04-07

Applicant: 百度在线网络技术(北京)有限公司

Inventor： 杜念冬 , 谢延 , 唐海员

IPC: G10L15/30 , H04L29/06 , H04L29/08

Abstract: 本发明提出一种基于人工智能的语音识别方法、装置和系统，其中，方法包括：在语音识别过程中，采集待识别的语音数据；通过与服务端的上行连接，向服务端发送上行数据流，其中，上行数据流包括语音数据；在向服务端发送上行数据流的过程中，并行通过与服务端的下行连接，接收服务端发送的下行数据流；其中，下行数据流，包括结果数据，结果数据是服务端根据语音数据进行语音识别得到的。该方法通过两条并行的数据流，以流式数据传输的方式实现了待识别语音数据的实时上传和语音识别结果的实时下发，解决了现有技术中无法实现数据的实时上传和实时下发的技术问题。

7.

发明公开
语音识别方法和装置有权

公开(公告)号：CN105139849A

公开(公告)日：2015-12-09

申请号：CN201510435887.1

申请日：2015-07-22

Applicant: 百度在线网络技术(北京)有限公司

Inventor： 谢延

IPC: G10L15/22 , G10L15/04 , G10L15/30 , G10L25/54 , G10L25/87

CPC classification number: G10L15/20 , G10L15/22 , G10L15/26

Abstract: 本发明公开了一种语音识别方法和装置，其中，方法包括：S1、接收用户输入的语音信息，并实时对语音信息进行识别；S2、当语音信息产生静音时，判断静音的类型；S3、如果静音为短静音，则获得第一识别结果，并显示第一识别结果，同时继续执行步骤S1；以及S4、如果静音为长静音，则获得第二识别结果，并显示第二识别结果。本发明实施例的语音识别方法和装置，通过实时对用户输入的语音信息进行识别，当语音信息产生静音时，判断静音的类型，如果静音为短静音，则获得及显示第一识别结果，同时继续接收用户输入的语音信息，如果静音为长静音，则获得及显示第二识别结果，能够降低用户等待时间，提升用户使用体验。

8.

发明公开
语音识别方法以及装置有权

公开(公告)号：CN105096941A

公开(公告)日：2015-11-25

申请号：CN201510558047.4

申请日：2015-09-02

Applicant: 百度在线网络技术(北京)有限公司

Inventor： 杜念冬 , 邹赛赛 , 谢延

IPC: G10L15/07

Abstract: 本发明公开了一种语音识别方法以及装置，其中方法包括：获取说话人输入的语音信息，并获取说话人的说话人信息；根据说话人信息判断是否存在与说话人对应的个人声学模型；如果存在，则获取的个人声学模型，并根据说话人的个人声学模型对语音信息进行语音识别；如果不存在，则根据基础声学模型对语音信息进行语音识别，并根据语音信息生成说话人的语料信息并存储；以及根据基础声学模型和存储的语料信息生成说话人的个人声学模型。该方法可以基于说话人自适应的语音识别过程能够针对每个说话人的特点，定制他们的声学模型，从而提高每个说话人的准确度，提升了用户体验。

9.

发明公开
语音识别方法和装置无效复审申请

公开(公告)号：CN104916283A

公开(公告)日：2015-09-16

申请号：CN201510319421.5

申请日：2015-06-11

Applicant: 百度在线网络技术(北京)有限公司

Inventor： 段弘 , 唐立亮 , 谢延 , 彭守业

IPC: G10L15/02 , G10L15/04 , G10L15/08 , G10L13/02 , H04L29/08

Abstract: 本发明公开了一种语音识别方法和装置，其中，语音识别方法，包括：S1、接收输入的语音信息，并将语音信息切分成多个语音缓存片段；S2、依次对多个语音缓存片段进行在线识别；S3、当在线识别发生错误时，获得已完成在线识别的多个语音缓存片段对应的多个第一识别结果，并对未完成在线识别的多个语音缓存片段进行离线识别，以及获得离线识别对应的多个第二识别结果；以及S4、合并多个第一识别结果和多个第二识别结果以生成最终的识别结果。本发明实施例的语音识别方法和装置，提高了语音识别的稳定性和精准度，进而提升了用户的使用体验。

10.

发明授权
会议同步方法和装置有权

公开(公告)号：CN107370610B

公开(公告)日：2020-12-11

申请号：CN201710761582.9

申请日：2017-08-30

Applicant: 百度在线网络技术(北京)有限公司

Inventor： 杜念冬 , 韩岩 , 谢延

IPC: H04L12/18 , H04L29/06 , H04L29/08 , H04N7/15 , G10L15/04 , G10L15/26

Abstract: 本申请提出一种会议同步方发和装置，其中方法包括：获取第一终端发送的同步会议申请请求，其中申请请求中包括当前会议的信息；根据当前会议的信息，确定与当前会议关联的处理资源及共享链接；将共享链接发送给第一终端；在接收到第一终端发送的语音数据时，利用处理资源对语音数据进行处理，生成与当前会议对应的会议内容。该方法通过会议信息确定处理资源及共享链接，以对语音数据进行处理生成会议内容，不仅实现了对会议内容的自动记录，还可将会议内容通过共享链接分享给其他用户，提高了会议同步的灵活性，提升了用户体验。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification