Patent search ap:("科大讯飞股份有限公司") AND inv:"宋亚楠" Page 2

11.

发明公开
语音数据标注方法和装置有权

公开(公告)号：CN107578769A

公开(公告)日：2018-01-12

申请号：CN201610523333.1

申请日：2016-07-04

Applicant: 科大讯飞股份有限公司

Inventor： 宋亚楠 , 潘嘉 , 刘聪 , 胡国平 , 胡郁 , 刘庆峰

IPC: G10L13/08 , G10L15/26

Abstract: 本发明提出一种语音数据标注方法和装置，该语音数据标注方法包括：接收语音数据，对所述语音数据进行语音识别，得到识别文本；获取用户对所述识别文本确认后的用户确认文本；对所述识别文本和所述用户确认文本进行分析，提取自动标注特征；根据所述自动标注特征及预先构建的自动标注模型，对所述语音数据进行标注。该方法能够解决人工标注存在的问题，提高语音数据标注的效率并降低成本。

12.

发明公开
音频语种转换方法、系统和相关装置无效

公开(公告)号：CN119495285A

公开(公告)日：2025-02-21

申请号：CN202411486919.6

申请日：2024-10-23

Applicant: 科大讯飞股份有限公司

Inventor： 宋亚楠 , 孔常青 , 熊世富 , 高建清 , 刘聪

IPC: G10L15/00 , G10L15/02 , G10L15/04 , G10L15/18 , G10L21/007 , G06F40/58

Abstract: 本申请公开了一种音频语种转换方法、系统和相关装置，该方法包括：获取目标对象的初始音频流，确定所述初始音频流对应的初始音频特征、以及所述初始音频流对应的当前语种；基于所述初始音频特征和所述当前语种，获取当前转换轮次对应的目标特征片段；其中，不同转换轮次对应的所述目标特征片段基于所述初始音频特征的语义进行分割；确定至少一个转换语种，基于所述当前语种和所述目标特征片段，生成与所述转换语种匹配的转换音频。通过上述方式，本申请能够提高音频跨语种转换的准确性。

13.

发明公开
语音翻译方法、电子设备及计算机可读存储介质审中-实审

公开(公告)号：CN119400169A

公开(公告)日：2025-02-07

申请号：CN202411493813.9

申请日：2024-10-24

Applicant: 科大讯飞股份有限公司

Inventor： 陈潇钰 , 宋亚楠 , 孔常青 , 熊世富 , 高建清

IPC: G10L15/22 , G10L15/26 , G10L15/02 , G10L15/06 , G10L15/18 , G06F40/58

Abstract: 本申请公开了一种语音翻译方法、电子设备及计算机可读存储介质。其中，方法包括：获取音频片段；对音频片段进行表征提取，得到音频片段的多个初始高阶语音表征，并对各初始高阶语音表征进行音素分类，确定初始音素集；利用基于专有词汇偏置列表构建得到的目标数据库中的各专有词汇音素集匹配初始音素集中的音素，得到音频片段中的至少一个目标专有词汇的目标高阶语音表征；替换目标专有词汇的初始高阶语音表征为目标高阶语音表征，形成音频片段的高阶语音表征集；对高阶语音表征集进行翻译，得到音频片段的目标翻译文本。借助音素级专有词汇激励可以缓解语音翻译任务中不同应用场景下由于发音和口音差异带来的泛化性问题。

14.

发明授权
语音数据标注方法和装置有权

公开(公告)号：CN107578769B

公开(公告)日：2021-03-23

申请号：CN201610523333.1

申请日：2016-07-04

Applicant: 科大讯飞股份有限公司

Inventor： 宋亚楠 , 潘嘉 , 刘聪 , 胡国平 , 胡郁 , 刘庆峰

IPC: G06F40/20

Abstract: 本发明提出一种语音数据标注方法和装置，该语音数据标注方法包括：接收语音数据，对所述语音数据进行语音识别，得到识别文本；获取用户对所述识别文本确认后的用户确认文本；对所述识别文本和所述用户确认文本进行分析，提取自动标注特征；根据所述自动标注特征及预先构建的自动标注模型，对所述语音数据进行标注。该方法能够解决人工标注存在的问题，提高语音数据标注的效率并降低成本。

15.

发明公开
语音唤醒方法及装置有权

公开(公告)号：CN108538298A

公开(公告)日：2018-09-14

申请号：CN201810298845.1

申请日：2018-04-04

Applicant: 科大讯飞股份有限公司

Inventor： 宋亚楠 , 潘嘉 , 吴国兵

IPC: G10L15/26 , G10L15/22 , G06F17/30

Abstract: 本发明实施例提供了一种语音唤醒方法及装置，属于计算机应用技术领域。该方法包括：基于用户交互状态确定实时唤醒词库，实时唤醒词库用于下一次交互流程；获取用户输入的语音信号，基于实时唤醒词库及语音信号进行唤醒。由于在上一次交互流程中断后，可基于实时唤醒词库进行唤醒，再次进行唤醒时能够给予用户休眠无感知的用户体验，从而使得用户能够直接衔接休眠之前的交互场景，而不用重复之前已经执行过的交互流程。因此，可降低交互成本，并提高用户体验。

Patent Agency Ranking