Patent search ap:("百度在线网络技术(北京)有限公司") AND inv:"钱胜" Page 2

11.

发明授权
一种语音处理方法及系统有权

公开(公告)号：CN109346074B

公开(公告)日：2020-03-03

申请号：CN201811196474.2

申请日：2018-10-15

Applicant: 百度在线网络技术(北京)有限公司

Inventor： 王知践 , 钱胜

IPC: G10L15/22 , G10L15/04 , G10L17/00

Abstract: 本发明公开了一种语音处理方法及系统，其中所述方法包括获取待识别的语音；对所述待识别的语音进行语音识别；在语音识别的过程中，同时根据所待识别的语音的识别结果进行动态VAD判断；当通过动态VAD判断检测到所述待识别的语音结束时，根据所述待识别的语音的识别结果执行对应指令。应用本发明所述方案，能够根据用户命令词进行针对性响应，包括快速判断和慢速判断，提高了语音识别的准确性和及时性，避免语音识别过早结束造成中断误报，或过晚结束造成响应时间过长。

12.

发明公开
用于语音交互控制的方法、装置、设备和介质有权

公开(公告)号：CN110718223A

公开(公告)日：2020-01-21

申请号：CN201911033410.5

申请日：2019-10-28

Applicant: 百度在线网络技术(北京)有限公司

Inventor： 白锦峰 , 翟传磊 , 陈旭 , 陈涛 , 马啸空 , 张策 , 吴震 , 彭星源 , 王知践 , 钱胜 , 王桂彬 , 贾磊

IPC: G10L15/22 , G10L15/30 , G10L15/26 , G10L15/28 , G10L15/16 , G10L15/04 , G10L15/02 , G10L15/06

Abstract: 本申请公开了语音交互控制的方法、装置、设备和介质，涉及语音技术。一种语音交互控制的方法包括获得语音交互设备处的声音信号和从声音信号识别的识别信息；至少基于声音信号的声学特征表示和/或与识别信息相关联的语义特征表示确定声音信号的交互置信度；确定识别信息与声音信号的匹配状况；提供交互置信度和匹配状况以用于控制语音交互设备对声音信号的响应。由此，可以准确判断区别人机交互的声音和非人机交互的声音，提高语音交互控制的准确度和智能度，提升人机交互的用户体验。

13.

发明授权
基于人工智能的语音处理方法及装置有权

公开(公告)号：CN106710606B

公开(公告)日：2019-11-08

申请号：CN201611246698.0

申请日：2016-12-29

Applicant: 百度在线网络技术(北京)有限公司

Inventor： 王知践 , 钱胜

IPC: G10L25/78 , G10L19/00

Abstract: 本发明提出一种基于人工智能的语音处理方法及装置，其中，方法包括：利用声学模型对待解码的语音包中的当前帧进行打分；根据打分结果识别当前帧是否为准静音帧；如果识别出当前帧为准静音帧，在解码时跳过当前帧，不对当前帧进行解码。本发明中，在对待解码的语音包的当前帧进行解码之前，根据声学模型的打分结果识别出当前帧是否需要解码，当不需要解码时，在解码时跳过当前帧，从而可以避免冗余解码，提升解码的速度，加快对待解码的语音包的识别。

14.

发明公开
语音处理方法、装置、用户设备及存储介质有权

公开(公告)号：CN109727603A

公开(公告)日：2019-05-07

申请号：CN201811467944.4

申请日：2018-12-03

Applicant: 百度在线网络技术(北京)有限公司

Inventor： 邵俊尧 , 钱胜

IPC: G10L19/16 , G10L15/28 , G10L25/69

Abstract: 本发明涉及信息处理技术领域，公开了一种语音处理方法、装置、用户设备及存储介质，解决了在解码过程中，仅依赖上文信息，而不能有效利用下文信息的问题。所述方法包括：获取语音数据；根据声学模型，匹配得到语音数据中每个音节数据对应的声学得分以及解码路径；当viterbi解码到解码路径的分叉点，且要根据语言模型对解码路径的分叉点之后的音节数据进行匹配时，根据分叉点之后的音节数据对应的声学得分，对分叉点之后的解码路径进行裁剪；根据语言模型对裁剪后的解码路径上的音节数据进行匹配，得到语言得分；以及根据裁剪后的解码路径上的声学得分和语言得分，对语音数据逐帧进行viterbi解码。本发明实施例适用于语音数据的处理过程。

15.

发明公开
用于获取信息的方法及装置有权

公开(公告)号：CN109410920A

公开(公告)日：2019-03-01

申请号：CN201811199186.2

申请日：2018-10-15

Applicant: 百度在线网络技术(北京)有限公司

Inventor： 王知践 , 钱胜

IPC: G10L15/04 , G10L15/08 , G10L15/26 , G10L15/30 , G10L21/0208

Abstract: 本申请实施例公开了用于获取信息的方法及装置。该方法的一具体实施方式包括：对待识别语音信号进行识别，得到对应上述待识别语音信号的初始识别文字信息；从上述初始识别文字信息中筛选出单字得到单字集合；对于上述单字集合中的单字，查询上述待识别语音信号中对应该单字的语音信号片段，通过该语音信号片段判断该单字是否为噪音；删除上述初始识别文字信息中的被判断为噪音的单字，得到对应上述待识别语音信号的文字信息。该实施方式能够删除对噪音识别得到的单字，提高了获取文字信息的准确性。

16.

发明公开
一种语音处理方法及系统有权

公开(公告)号：CN109346074A

公开(公告)日：2019-02-15

申请号：CN201811196474.2

申请日：2018-10-15

Applicant: 百度在线网络技术(北京)有限公司

Inventor： 王知践 , 钱胜

IPC: G10L15/22 , G10L15/04 , G10L17/00

Abstract: 本发明公开了一种语音处理方法及系统，其中所述方法包括获取待识别的语音；对所述待识别的语音进行语音识别；在语音识别的过程中，同时根据所待识别的语音的识别结果进行动态VAD判断；当通过动态VAD判断检测到所述待识别的语音结束时，根据所述待识别的语音的识别结果执行对应指令。应用本发明所述方案，能够根据用户命令词进行针对性响应，包括快速判断和慢速判断，提高了语音识别的准确性和及时性，避免语音识别过早结束造成中断误报，或过晚结束造成响应时间过长。

17.

发明公开
用于查询指令的方法及装置有权

公开(公告)号：CN109299223A

公开(公告)日：2019-02-01

申请号：CN201811198911.4

申请日：2018-10-15

Applicant: 百度在线网络技术(北京)有限公司

Inventor： 王知践 , 钱胜

IPC: G06F16/33

Abstract: 本申请实施例公开了用于查询指令的方法及装置。该方法的一具体实施方式包括：获取第一查询指令，通过指令库描述文件查询与上述第一查询指令对应的指令编号，其中，上述指令库描述文件通过指令编号标识指令库中指令之间的查询关系；响应于存在与上述第一查询指令对应的至少一个指令编号，显示上述第一查询指令对应的页面，上述页面包含与上述至少一个指令编号对应的至少一个指令标识；响应于获取到与上述页面中的至少一个指令标识中的指令标识对应的第二查询指令，通过上述指令库描述文件查询与该指令标识对应的指令。该实施方式减小了获取指令过程中的数据处理量，有利于提高数据处理效率。

18.

发明公开
一种建立语音识别模型的方法、语音识别方法及系统有权

公开(公告)号：CN109243428A

公开(公告)日：2019-01-18

申请号：CN201811196304.4

申请日：2018-10-15

Applicant: 百度在线网络技术(北京)有限公司

Inventor： 王知践 , 钱胜

IPC: G10L15/14 , G10L15/02 , G10L15/16 , G10L15/197

Abstract: 本发明公开了一种建立语音识别模型的方法、语音识别方法及系统，其中所述建立语音识别模型的方法包括读取并解析每个语法文件，构建每个语法的网络；读取声学的音节映射关系表，将所述每个语法的网络分别展开为音节网络；对各个音节网络进行合并最小化操作，形成音元解码网络；利用所述音元解码网络和语言模型，形成语音识别模型。应用本发明所述方案，扩展型强，支持N-Gram语言模型，支持类模型，使用灵活，适用于车载环境中的嵌入式识别器。

19.

发明公开
基于云端的语音处理方法和装置有权

公开(公告)号：CN107919130A

公开(公告)日：2018-04-17

申请号：CN201711079226.5

申请日：2017-11-06

Applicant: 百度在线网络技术(北京)有限公司

Inventor： 钱胜

IPC: G10L15/34 , G10L15/22

CPC classification number: G10L15/34 , G10L15/22 , G10L2015/225

Abstract: 本发明提出一种基于云端的语音处理方法和装置，其中，方法包括：获取终端采集的待识别的语音；对待识别的语音进行语音识别；在语音识别的过程中，同时检测待识别的语音是否结束；当检测到待识别的语音结束时，将待识别的语音的识别结果反馈给终端。通过在语音的识别过程中，同时检测待识别的语音是否结束，从而可以保证语音识别的准确性。进一步地，由云端进行语音识别，与终端本地无关，因此和硬件平台无关，不存在迁移开发，且不受终端本地资源的限制，因此，云端使用的语音识别模型可以做的非常复杂精细，从而可以提升系统的抗干扰性能。此外，云端使用的语音识别模型，已经为不同的应用量身打造，无需重新训练模型，简化了开发量。

20.

发明公开
语音端点检测方法、装置和计算机设备有权

公开(公告)号：CN107527630A

公开(公告)日：2017-12-29

申请号：CN201710866643.8

申请日：2017-09-22

Applicant: 百度在线网络技术(北京)有限公司

Inventor： 孙占海 , 钱胜

IPC: G10L25/87 , G10L25/30 , G10L25/78

Abstract: 本申请提出一种语音端点检测方法、装置和计算机设备，其中，上述语音端点检测方法包括：通过DNNVAD对输入的音频信号进行检测；当在所述音频信号中未检测到语音信号时，通过EVAD在所述音频信号中每N帧计算一次平均能量值；如果当前计算的N帧的音频信号的平均能量值大于或等于第一阈值，则通过DNNVAD从当前N帧的起始帧开始对所述音频信号进行语音检测，确定所述音频信号中语音信号的端点。本申请可以实现通过EVAD对音频信号中声音的起点进行检测，提高语音端点检测的速度，降低功耗，并在检测到声音起点之后，通过DNNVAD对音频信号进行语音检测，确定上述音频信号中语音信号的端点，提高了语音端点检测的精度。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification