Patent search ap:("深港产学研基地(北京大学香港科技大学深圳研修院)" OR "北京大学深圳研究院") AND inv:"程刚" Page 1

1.

发明授权
语音识别后处理方法和系统及相关设备有权

公开(公告)号：CN112634878B

公开(公告)日：2024-05-17

申请号：CN202011476615.3

申请日：2020-12-15

Applicant: 深港产学研基地(北京大学香港科技大学深圳研修院) , 北京大学深圳研究院

Inventor： 黄石磊 , 刘轶 , 程刚

IPC: G10L15/06 , G10L15/183 , G10L15/19 , G10L15/22

Abstract: 本发明公开了一种语音识别后处理方法和系统及相关设备。所述方法包括：从语音识别系统针对输入语音进行第一次解码产生的词图lattice中，提取前N个最好的识别结果N‑best lists；使用训练好的带有词性的BERT双向语言模型对N‑best lists进行重打分；从N‑best lists中选择得分最高的结果作为最终的识别结果。本发明对N‑best lists进行重打分时，通过使用带有词性的BERT双向语言模型，能够同时利用上下文信息，还可以利用到上下文的词性信息，从而可以进一步提升语音识别系统的性能。

2.

发明公开
语音识别后处理方法和系统及相关设备有权

公开(公告)号：CN112634878A

公开(公告)日：2021-04-09

申请号：CN202011476615.3

申请日：2020-12-15

Applicant: 深港产学研基地(北京大学香港科技大学深圳研修院) , 北京大学深圳研究院

Inventor： 黄石磊 , 刘轶 , 程刚

IPC: G10L15/06 , G10L15/183 , G10L15/19 , G10L15/22

Abstract: 本发明公开了一种语音识别后处理方法和系统及相关设备。所述方法包括：从语音识别系统针对输入语音进行第一次解码产生的词图lattice中，提取前N个最好的识别结果N‑best lists；使用训练好的带有词性的BERT双向语言模型对N‑best lists进行重打分；从N‑best lists中选择得分最高的结果作为最终的识别结果。本发明对N‑best lists进行重打分时，通过使用带有词性的BERT双向语言模型，能够同时利用上下文信息，还可以利用到上下文的词性信息，从而可以进一步提升语音识别系统的性能。

3.

发明公开
说话人分离方法、装置、电子设备及计算机可读存储介质审中-实审

公开(公告)号：CN114121023A

公开(公告)日：2022-03-01

申请号：CN202111446569.7

申请日：2021-11-30

Applicant: 深港产学研基地(北京大学香港科技大学深圳研修院)

Inventor： 刘轶 , 黄石磊 , 程刚

IPC: G10L17/04

Abstract: 本申请涉及一种说话人分离方法，所述方法包括：获取待分离的语音信息，对待分离的语音信息进行初步分割，得到分离结果；对分离结果进行语音识别，得到分离语音内容，提取分离语音内容中的说话人转变点；提取分离结果的声纹特征和语义特征，并根据声纹特征和语义特征对分离结果进行说话人分类，得到标准分类结果；基于说话人转变点和标准分类结果对待分离的语音信息进行分类，得到目标分离结果。此外，本申请还涉及一种说话人分离方法、装置、设备及存储介质。本申请可解决说话人分离的准确度不够高的问题。

4.

发明公开
一种基于智能设备的语音定向方法及系统无效

公开(公告)号：CN106338711A

公开(公告)日：2017-01-18

申请号：CN201610760099.4

申请日：2016-08-30

Applicant: 康佳集团股份有限公司 , 北京大学深圳研究院

Inventor： 黄石磊 , 刘轶 , 王昕 , 程刚 , 王序 , 杨乐辉

IPC: G01S3/80

Abstract: 本发明公开了一种基于智能设备的语音定向方法及系统，方法包括：智能设备开启后，实时获取语音信号；当智能设备检测到语音信号时，获取智能设备的当前前景图像，根据当前前景图像获取声源方向的候选方向；智能设备根据声源方向的候选方向通过定位算法计算后，根据计算结果定位语音信号的声源方向。本发明结合图像采集计算预先获取语音信号的候选方向，通过算法对候选方向进行验算，获取最佳的声源方向，减少了计算的复杂度，提高了语音信号的定位效率。

5.

发明公开
一种移动终端的语音识别系统及方法无效

公开(公告)号：CN106228975A

公开(公告)日：2016-12-14

申请号：CN201610809985.1

申请日：2016-09-08

Applicant: 康佳集团股份有限公司 , 北京大学深圳研究院

Inventor： 黄石磊 , 刘轶 , 王昕 , 程刚 , 王序 , 杨乐辉

IPC: G10L15/01 , G10L15/30 , H04L29/08 , H04M1/725

CPC classification number: G10L15/01 , G10L15/30 , H04L67/1002 , H04M1/72522

Abstract: 本发明公开一种移动终端的语音识别系统及方法，其移动终端的语音识别系统包括移动终端和服务器端。其中，移动终端包括：语音采集模块、移动终端通信模块、用户行为采集模块、移动终端语音识别模块、结果比较模块和结果输出模块；服务器端包括：服务器端通信模块、服务器端语音识别模块、后处理模块和语言模型生成模块。所述移动终端通过移动终端语音识别模块对用户的语音进行识别，同时所述服务器端通过服务器端语音识别模块对用户的语音进行识别，所述结果比较模块接收移动终端和服务器端的识别结果并进行比较，将最终语音识别结果发送到结果输出模块，结果输出模块根据最终语音识别结果执行相应操作，为用户智能控制移动终端带来了方便。

6.

发明授权
一种语音遥控器及其语音采集的方法、系统有权

公开(公告)号：CN106303644B

公开(公告)日：2020-03-31

申请号：CN201610810063.2

申请日：2016-09-08

Applicant: 康佳集团股份有限公司 , 北京大学深圳研究院

Inventor： 黄石磊 , 刘轶 , 王昕 , 程刚 , 王序 , 杨乐辉

IPC: H04N21/422

Abstract: 本发明涉及电视遥控技术领域，公开了一种语音遥控器及其语音采集的方法、系统，所述方法包括：当语音遥控器中的压力传感器感应到的压力超过阈值时，开启处于关闭状态的距离传感器、开关按钮、录音模块以及缓存模块；当距离传感器检测手指到开关按钮的距离小于预定值时，控制录音模块开始录音，并将语音数据记录在缓存模块中；当开关按钮被按下时，控制传输模块将语音数据传输到智能电视或者云端语音识别引擎上进行语音识别。本发明的语音采集方法通过在用户按下录音开关按钮之前就开始了录音，可以有效防止用户在按下录音开关按钮之前就已经录音的语音丢失，便于识别设备通过完整的录音更好的识别，为用户提供方便。

7.

发明公开
一种语音遥控器及其语音采集的方法、系统有权

公开(公告)号：CN106303644A

公开(公告)日：2017-01-04

申请号：CN201610810063.2

申请日：2016-09-08

Applicant: 康佳集团股份有限公司 , 北京大学深圳研究院

Inventor： 黄石磊 , 刘轶 , 王昕 , 程刚 , 王序 , 杨乐辉

IPC: H04N21/422

Abstract: 本发明涉及电视遥控技术领域，公开了一种语音遥控器及其语音采集的方法、系统，所述方法包括：当语音遥控器中的压力传感器感应到的压力超过阈值时，开启处于关闭状态的距离传感器、开关按钮、录音模块以及缓存模块；当距离传感器检测手指到开关按钮的距离小于预定值时，控制录音模块开始录音，并将语音数据记录在缓存模块中；当开关按钮被按下时，控制传输模块将语音数据传输到智能电视或者云端语音识别引擎上进行语音识别。本发明的语音采集方法通过在用户按下录音开关按钮之前就开始了录音，可以有效防止用户在按下录音开关按钮之前就已经录音的语音丢失，便于识别设备通过完整的录音更好的识别，为用户提供方便。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification