Patent search ap:("南方海洋科学与工程广东省实验室(湛江)" OR "科大讯飞股份有限公司") AND inv:"刘俊华" Page 9

81.

发明公开
语音识别方法及相关装置、电子设备、存储介质有权转让

公开(公告)号：CN113724689A

公开(公告)日：2021-11-30

申请号：CN202110910287.1

申请日：2021-08-09

Applicant: 科大讯飞股份有限公司

Inventor： 吴重亮 , 方昕 , 吴明辉 , 李永超 , 刘俊华

IPC: G10L15/02 , G10L15/06 , G10L15/18 , G10L15/26

Abstract: 本申请公开了一种语音识别方法及相关装置、电子设备、存储介质，其中，语音识别方法包括：获取若干音频帧的语义特征表示；利用语音识别模型对若干音频帧的语义特征表示进行识别，得到若干音频帧对应的识别文本；其中，语音识别模型采用注意力机制，且注意力机制的掩膜是基于语音识别要求的时延而生成的。上述方案，能够降低不同时延要求下语音识别的复杂度和成本。

82.

发明授权
语音评测方法及相关装置有权

公开(公告)号：CN110148413B

公开(公告)日：2021-10-08

申请号：CN201910422699.3

申请日：2019-05-21

Applicant: 科大讯飞股份有限公司

Inventor： 刘丹 , 刘俊华 , 刘晨璇 , 魏思 , 王智国 , 胡国平

IPC: G10L15/26 , G10L25/60

Abstract: 本申请实施例公开了一种语音评测方法及相关装置，方法包括：获取第一测评模式下作为评测标准的第一语音，以及获取待评测的第二语音；处理第一语音得到第一文本，以及处理第二语音得到第二文本；获取第一测评模式对应的第一文本检测策略；按照第一文本检测策略处理第一文本和第二文本，得到针对第二语音的检测结果。本申请有利于提高设备进行语音评测的灵活性和全面性。

83.

发明公开
语音识别方法、装置、电子设备和存储介质有权转让

公开(公告)号：CN113113024A

公开(公告)日：2021-07-13

申请号：CN202110474762.5

申请日：2021-04-29

Applicant: 科大讯飞股份有限公司

Inventor： 方昕 , 刘俊华 , 潘志兵 , 周传福

IPC: G10L17/00 , G10L17/02 , G10L17/04 , G10L17/18

Abstract: 本发明提供一种语音识别方法、装置、电子设备和存储介质，其中方法包括：确定用户的待识别语音；基于预设状态转移路径，对所述待识别语音进行语音识别解码，得到语音识别结果；所述预设状态转移路径是基于所述用户的地域信息和/或历史输入信息扩充得到的。本发明提供的语音识别方法、装置、电子设备和存储介质，基于当前用户的地域信息和/或历史输入信息动态扩充解码网络中的预设状态转移路径，从而基于扩充后的预设状态转移路径对该用户的待识别语音进行语音识别解码，利用该用户的个性化信息，提升了个性化语音识别的准确性，且动态扩充预设状态转移路径的方式，增强了实用性。

84.

发明公开
一种语音识别方法、装置、设备及计算机可读存储介质有权转让

公开(公告)号：CN112951209A

公开(公告)日：2021-06-11

申请号：CN202110110872.3

申请日：2021-01-27

Applicant: 科大讯飞股份有限公司

Inventor： 马志强 , 方昕 , 刘俊华

IPC: G10L15/02 , G10L15/06 , G10L15/26 , G10L19/04 , G10L19/16

Abstract: 本申请提供了一种语音识别方法、装置、设备及计算机可读存储介质，其中，语音识别方法包括：基于预先建立的语音识别模型，依次获取待识别语音中每个语音帧对应的特征向量；在每获得一语音帧对应的特征向量后，基于语音识别模型、当前获得的特征向量和前一解码位置对应的识别结果，确定当前获得的特征向量处是否为解码位置；若是，则基于语音识别模型、当前获得的特征向量和当前获得的特征向量之前的所有特征向量，确定当前解码位置对应的识别结果。本申请提供的语音识别方法可实现实时流式解码，适用于实时的语音识别应用场景。

85.

发明授权
一种分类模型的生成方法及装置有权

公开(公告)号：CN108304890B

公开(公告)日：2021-06-08

申请号：CN201810218705.9

申请日：2018-03-16

Applicant: 科大讯飞股份有限公司

Inventor： 方昕 , 刘俊华 , 魏思 , 胡国平

IPC: G06K9/62

Abstract: 本申请公开了一种分类模型的生成方法及装置，该方法包括：获取目标训练数据，该目标训练数据包括同一数据类型下划分的不同领域数据，利用该目标训练数据训练特征生成器、主分类器以及辅助分类器，其中，特征生成器用于将目标训练数据的原始特征数据变换到同一特征空间中以得到变换后特征数据，主分类器用于根据变换后特征数据将目标训练数据进行分类预测，辅助分类器用于根据变换后特征数据将目标训练数据所属的划分领域进行区分。由于特征生成器的构建目的是为了降低辅助分类器的领域区分能力，当辅助分类器无法进行领域区分时便可以结束训练，因为此时的主分类器将不受划分领域的限制，这使得主分类器的分类结果更加准确。

86.

发明公开
语音处理方法、装置、设备及存储介质有权

公开(公告)号：CN112735392A

公开(公告)日：2021-04-30

申请号：CN202011634031.4

申请日：2020-12-31

Applicant: 科大讯飞股份有限公司

Inventor： 吴明辉 , 方昕 , 刘俊华

IPC: G10L15/14 , G10L15/26 , G10L19/00 , G10L25/51

Abstract: 本申请实施例公开了一种语音处理方法、装置、设备及存储介质，通过对用于解码文本单元的权重序列进行改进，使得每一文本单元对应的权重序列与各语音帧的时间信息的关联关系趋近于目标函数关系，由于每一文本单元对应的目标函数关系表示，该文本单元与各个语音帧的时间信息的关联度，与各个语音帧的时间信息间的关联关系，这就使得，利用权重序列进行解码得到的文本单元与语音帧的时间信息是强相关的，因此，利用各个语音帧的时间信息，以及各文本单元对应的目标函数能够准确实现语音帧的时间信息与文本单元的对应关系，也就是将语音帧的时间信息与文本单元准确对齐，从而提高了将语音识别结果与音频对齐的准确率。

87.

发明公开
语法缺陷数据识别模型构建方法和语法缺陷数据识别方法审中-实审转让

公开(公告)号：CN112668345A

公开(公告)日：2021-04-16

申请号：CN202011552924.4

申请日：2020-12-24

Applicant: 科大讯飞股份有限公司

Inventor： 张为泰 , 刘俊华 , 魏思 , 刘聪

IPC: G06F40/58 , G06F40/42 , G06F40/216 , G06F40/253 , G06N3/04 , G06N3/08

Abstract: 本申请公开了一种语法缺陷数据识别模型构建方法和语法缺陷数据识别方法，该构建方法包括：在获取到第一训练源文本、第一标准翻译文本及其对应的第一实际识别结果、和第一语法缺陷翻译文本及其对应的第二实际识别结果后，将第一训练源文本、第一标准翻译文本和第一语法缺陷翻译文本输入第一模型，得到第一标准翻译文本对应的第一预测识别结果和第一语法缺陷翻译文本对应的第二预测识别结果；再根据第一预测识别结果、第二预测识别结果、第一实际识别结果和第二实际识别结果更新第一模型，并返回执行将第一训练源文本、第一标准翻译文本和第一语法缺陷翻译文本输入第一模型的步骤，直至在达到第一停止条件时根据第一模型构建语法缺陷数据识别模型。

88.

发明授权
一种音频特征提取方法与装置、电子设备有权

公开(公告)号：CN107622773B

公开(公告)日：2021-04-06

申请号：CN201710803397.1

申请日：2017-09-08

Applicant: 科大讯飞股份有限公司

Inventor： 李永超 , 方昕 , 刘俊华

IPC: G10L25/21 , G10L25/18 , G10L25/03

Abstract: 本发明公开了一种音频特征提取方法及装置、电子设备，所述方法包括如下步骤：步骤一，获取待处理音频数据；步骤二，根据所述待处理音频数据的频谱能量幅度，确定待处理音频数据的原始候选极值点；步骤三，基于候选极值点之间的影响系数和/或基于候选极值点的密度和/或基于候选极值点之间的差分计算结果对每帧音频数据的原始候选极值点进行筛选，得到所述待处理音频数据的极值点列表；步骤四，根据所述待处理音频数据的极值点列表提取音频数据的指纹特征，通过本发明可提高提取的音频特征的抗噪性，使提取的音频特征能更准确的描述音频数据。

89.

发明公开
文本处理方法、装置、设备及可读存储介质有权

公开(公告)号：CN110162801A

公开(公告)日：2019-08-23

申请号：CN201910456776.7

申请日：2019-05-29

Applicant: 科大讯飞股份有限公司

Inventor： 孔常青 , 高建清 , 刘俊华 , 胡国平

IPC: G06F17/28 , G06F16/33 , G06F16/335

Abstract: 本申请实施例公开了一种文本处理方法、装置、设备及可读存储介质，获得源语言文本和目标语言内容片段后，根据目标语言内容片段与源语言文本的内容相关的特征信息，在源语言文本中确定与目标语言内容片段对应的源语言文本片段。基于目标语言内容片段与源语言文本片段的对应关系，可以为用户提供优化服务，如在翻译场景下，机器对发言人的语音进行识别得到源语言文本，翻译人员对发言人的语音进行翻译，得到目标语言内容片段，通过本案可以在翻译过程实时给出源语言文本中与目标语音内容片段对应的源语言文本片段，基于此可以对翻译人员给出翻译进度提示，避免遗漏的情况，为用户提供更优化服务。

90.

发明公开
一种语音翻译模型的训练方法及装置有权

公开(公告)号：CN109785824A

公开(公告)日：2019-05-21

申请号：CN201910198404.9

申请日：2019-03-15

Applicant: 科大讯飞股份有限公司

Inventor： 马志强 , 刘俊华 , 魏思 , 胡国平

IPC: G10L15/00 , G10L15/06 , G10L15/16 , G06F17/28

Abstract: 本申请公开了一种语音翻译模型的训练方法及装置，该方法包括：首先获取包括各个样本语音的模型训练数据，然后，利用当前的语音翻译模型对获取到的样本语音进行直接翻译，得到预测翻译文本，同时，利用当前的语音识别模型对获取到的样本语音进行识别，得到预测识别文本，接着，根据得到的预测翻译文本与预测识别文本，更新语音翻译模型和语音识别模型的参数。由于语音翻译模型与语音识别模型共享部分模型参数，所以，当更新语音识别模型的参数时，同样会对语音翻译模型中共享部分的模型参数进行更新，从而使得语音翻译模型的这部分模型参数更加准确，进而在利用该语音翻译模型进行语音翻译时，能够提升语音翻译模型的翻译性能。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification