Patent search ap:("科大讯飞股份有限公司") AND inv:"白雨" Page 1

1.

发明公开
语音识别方法、装置、设备、系统及程序产品审中-实审

公开(公告)号：CN119864026A

公开(公告)日：2025-04-22

申请号：CN202411972326.0

申请日：2024-12-30

Applicant: 科大讯飞股份有限公司

Inventor： 白雨 , 陆梦寒 , 熊世富 , 高建清 , 刘聪

IPC: G10L15/22 , G10L15/18 , G10L25/87

Abstract: 本说明书实施例提供了一种语音识别方法，该方法通过对第一语音信息进行语音识别，以确定第一语音信息对应的目标用户以及语音场景；然后基于语音场景对目标用户对应的黑白名单进行配置，该黑白名单用于对语音结束值进行调整；并响应于第二语音信息的触发，根据黑白名单对名单资源进行更新；进而通过更新后的名单资源确定第二语音信息对应的语音结束值，以基于语音结束值对第二语音信息进行识别。从而实现个性化的语音结束值配置过程，由于结合用户的语音特征进行黑白名单配置，并通过黑白名单进行名单资源的维护，使得语音结束值可以适配于不同的用户，提高用户语音输入后内容的完整性，提高语音识别的准确性。

2.

发明公开
语音指令的流式识别方法、装置、介质及设备审中-公开

公开(公告)号：CN119889316A

公开(公告)日：2025-04-25

申请号：CN202510050291.3

申请日：2025-01-13

Applicant: 科大讯飞股份有限公司

Inventor： 白雨 , 陆梦寒

IPC: G10L15/22 , G10L15/18 , G10L15/183

Abstract: 本申请实施例提供了一种语音指令的流式识别方法、装置、计算机可读存储介质以及电子设备，涉及人工智能技术领域。该方法包括：对待处理音频进行语音活动检测，以确定待处理音频中的语音活动子段落，其中，语音活动子段落为经检测依次得到的起始状态和准结束状态之间的音频；在对当前的第i语音活动子段落进行语音识别的过程中，响应于检测得到准结束状态，获取对应于第i语音活动子段落的第i流式语音识别结果，其中，i的取值为不大于待处理音频中语音活动子段落的总量的正整数；将第i流式语音识别结果输入自然语言处理NLP模型，其中，NLP模型输出第i语音活动子段落对应的第i指令。本申请实施例能够在提升指令识别准确度的同时节省计算资源。

Patent Agency Ranking