Patent search ap:("科大讯飞股份有限公司") AND inv:"李晋" Page 2

11.

发明授权
变声检测方法及装置有权

公开(公告)号：CN108198574B

公开(公告)日：2020-12-08

申请号：CN201711475093.3

申请日：2017-12-29

Applicant: 科大讯飞股份有限公司

Inventor： 李晋 , 殷兵 , 柳林 , 胡国平

IPC: G10L25/51 , G10L17/02

Abstract: 本发明提供的变声检测方法及装置，获取待与目标对象进行认证匹配的待测语音数据；利用预置的变声检测模型，确定与所述待测语音数据匹配的待测声纹特征信息，以及语音伪造判决结果；确定所述待测声纹特征信息与所述目标对象已注册的声纹特征信息的相似度，得到声纹相似度；根据所述语音伪造判决结果以及所述声纹相似度，确定所述待测语音数据是否为人工伪造的变声语音数据。本发明利用变声检测模型来确定与所述待测语音数据匹配的待测声纹特征信息，以及语音伪造判决结果，进而来实现待测语音数据的检测，大幅提高了待测语音数据的检测效率以及检测结果的精准度。

12.

发明公开
一种说话人聚类方法、装置、设备及存储介质有权

公开(公告)号：CN111599346A

公开(公告)日：2020-08-28

申请号：CN202010424995.X

申请日：2020-05-19

Applicant: 科大讯飞股份有限公司

Inventor： 褚繁 , 李晋 , 方昕

IPC: G10L15/02 , G10L15/06 , G06K9/62

Abstract: 本申请提供了一种说话人聚类方法、装置、设备及存储介质，方法包括：获取语音数据集；对于语音数据集中的每条语音数据，以趋于通过该语音数据中的说话人信息与信道信息分离得到的说话人特征为获取方向，从该语音数据中获取说话人特征，得到由获取的说话人特征组成的说话人特征集；根据说话人特征集对语音数据集进行聚类。其中，在根据说话人特征集对语音数据集进行聚类时，可采用不需要预先设定类别数的聚类算法对说话人特征集中的说话人特征进行粗聚类，在粗聚类基础上，进一步根据类内距离和类间距离进行细聚类，从而根据细聚类结果获得语音数据集中语音数据的聚类结果。通过本申请提供的说话人聚类方法能够获得比较准确的聚类结果。

13.

发明公开
一种声纹模型的确定方法、装置、设备及存储介质有权

公开(公告)号：CN110517698A

公开(公告)日：2019-11-29

申请号：CN201910837580.2

申请日：2019-09-05

Applicant: 科大讯飞股份有限公司 , 咪咕数字传媒有限公司

Inventor： 殷兵 , 李晋 , 方昕 , 方四安 , 徐承 , 柳林

IPC: G10L17/02 , G10L17/04

Abstract: 本申请提供了一种声纹模型的确定方法、装置、设备及存储介质，其中，方法包括：获取目标语音的至少一个语谱片段，通过预先建立的声纹提取模型，确定每个语谱片段的至少一个第一特征图，其中，第一特征图中的各特征点相互独立，通过声纹提取模型，确定每个第一特征图对应的、包含其全局信息的第二特征图，获得每个语谱片段的至少一个第二特征图，其中，一个第一特征图对应的第二特征图为对该第一特征图中能够区分声纹的特征区域进行强化后的特征图；至少利用每个语谱片段的至少一个第二特征图，以及声纹提取模型，确定目标语音的声纹模型。本申请提供的声纹模型确定方法能够针对目标语音确定出稳定且精准的声纹模型。

14.

发明公开
模型训练方法、说话人识别方法、装置、设备、介质及产品审中-实审

公开(公告)号：CN118197321A

公开(公告)日：2024-06-14

申请号：CN202410189599.1

申请日：2024-02-20

Applicant: 科大讯飞股份有限公司

Inventor： 李晋 , 高天 , 方昕 , 潘嘉 , 高建清 , 刘俊华 , 戴礼荣

IPC: G10L17/04 , G10L17/18

Abstract: 本申请提出一种模型训练方法、说话人识别方法、装置、设备、介质及产品，该模型训练方法包括：在对声纹提取模型进行声纹身份预测训练的过程中，基于所述声纹提取模型的隐层声学特征，执行声学特征预测任务，得到声学特征预测结果；所述声学特征预测任务包括根据所述语音数据的第一语音帧的声学特征，预测所述语音数据的第二语音帧的声学特征；基于所述声学特征预测结果以及所述第二语音帧的真实声学特征，确定声学特征预测损失；以降低所述声学特征预测损失和所述声纹提取模型的身份预测训练损失为目标，对所述声纹提取模型进行参数优化。上述方案训练得到的声纹提取模型能够提取高精度的声纹模型，进而可以支持实现更高精度的声纹识别。

15.

发明授权
语音匹配方法、装置、电子设备及存储介质有权

公开(公告)号：CN111968650B

公开(公告)日：2024-04-30

申请号：CN202010826186.1

申请日：2020-08-17

Applicant: 科大讯飞股份有限公司

Inventor： 李晋 , 褚繁 , 方昕 , 余青松 , 柳林 , 戴礼荣 , 胡郁

IPC: G10L17/00 , G10L17/22 , G10L21/0272

Abstract: 本发明实施例提供一种语音匹配方法、装置、电子设备及存储介质，所述方法包括：确定待匹配话单的两个待匹配号码；将待匹配话单中的语音数据的声纹特征分别与两个待匹配号码的声纹特征进行匹配，得到待匹配话单中的语音数据与两个待匹配号码的匹配关系；其中，任一待匹配号码的声纹特征是对该待匹配号码的话单集中每一语音数据的声纹特征进行聚类得到的，该待匹配号码的话单集包括多个以该待匹配号码为一端、不同号码为另一端的话单。本发明实施例提供的方法、装置、电子设备及存储介质，保证了语音数据与其对应主被叫号码的一致性。

16.

发明公开
一种声纹特征提取方法、装置、设备及存储介质审中-实审

公开(公告)号：CN116312563A

公开(公告)日：2023-06-23

申请号：CN202310362146.X

申请日：2023-04-03

Applicant: 科大讯飞股份有限公司

Inventor： 李晋 , 高天 , 方昕 , 刘聪 , 徐文渊 , 陈艳姣

IPC: G10L17/04 , G10L17/02 , G10L17/20

Abstract: 本发明提供了一种声纹特征提取方法、装置、设备及存储介质，方法包括：获取目标语音数据的若干语谱片段；基于预先训练得到的声纹提取模型对若干语谱片段分别提取声纹特征，其中，声纹提取模型以若干时序未打乱的训练语谱片段和若干时序打乱的训练语谱片段为训练样本，以训练样本包含的各训练语谱片段分别对应的真实身份标签为样本标签，以使基于声纹提取模型对训练样本包含的每个训练语谱片段提取的声纹特征预测的身份标签与对应的真实身份标签趋于一致为目标训练得到；基于目标语音数据的若干语谱片段分别对应的声纹特征确定目标语音数据对应的声纹特征。本发明提供的声纹特征提取方法不易受语音时序的影响，可提取到较为精准鲁棒的声纹特征。

17.

发明公开
一种通信辐射源识别方法、装置、设备及存储介质审中-实审

公开(公告)号：CN115221918A

公开(公告)日：2022-10-21

申请号：CN202210706674.8

申请日：2022-06-21

Applicant: 科大讯飞股份有限公司

Inventor： 李晋 , 方昕 , 尤建 , 刘俊华 , 方四安 , 柳林

IPC: G06K9/00 , G06N3/04 , G06N3/08

Abstract: 本申请提出一种通信辐射源识别方法、装置、设备及存储介质，该方法包括：获取无线电信号的信号特征；将所述信号特征输入预先训练的通信辐射源识别模型，得到与所述无线电信号对应的通信辐射源识别结果；其中，所述通信辐射源识别模型包括特征重建子网络以及特征分类子网络，所述特征重建子网络通过将无线电信号样本的信号特征分别作为训练样本和训练标签进行特征重建训练得到。该通信辐射源识别方法大大降低了对标注样本的数量要求，能够在少量标注样本条件下达到通信辐射源识别目的，从而使得该方法能够胜任更多的通信辐射源识别任务。

18.

发明公开
声纹提取方法、装置、设备及可读存储介质审中-实审

公开(公告)号：CN115019808A

公开(公告)日：2022-09-06

申请号：CN202210616862.1

申请日：2022-06-01

Applicant: 科大讯飞股份有限公司

Inventor： 李晋 , 方昕 , 褚繁 , 高天 , 胡郁 , 戴礼荣 , 高建清

IPC: G10L17/20 , G10L17/02 , G10L17/04 , G10L17/18

Abstract: 本申请公开了一种声纹提取方法、装置、设备及可读存储介质。获取待进行声纹提取的语音数据之后，先确定语音数据对应的语谱片段，再针对每个语谱片段，对语谱片段进行声纹提取，得到语谱片段的融合有语音数据的录制环境信息的声纹表征向量；对各个语谱片段的融合环境信息的声纹表征向量进行加权平均，得到语音数据的融合有语音数据的录制环境信息的声纹表征向量。上述方案中，语音数据的声纹表征向量融合有语音数据的录制环境信息，其精准度更高，因此，采用上述方案能够消除语音数据录制环境差异对声纹信息的精准度的影响。

19.

发明公开
语音检测方法、装置、电子设备及计算机可读存储介质审中-实审

公开(公告)号：CN114333771A

公开(公告)日：2022-04-12

申请号：CN202111443833.1

申请日：2021-11-30

Applicant: 科大讯飞股份有限公司

Inventor： 褚繁 , 李晋 , 高天 , 方昕 , 胡郁

IPC: G10L15/02 , G10L15/08 , G10L15/16 , G10L25/24

Abstract: 本申请公开了一种语音检测方法、装置、电子设备及计算机可读存储介质，其中，该方法包括：利用特征提取网络对待检测语音进行特征提取，以得到待检测语音的编码特征向量；利用深层残差卷积网络对待检测语音的编码特征向量进行降维处理，以得到待检测语音的表征向量，其中，表征向量包含待检测语音的语音类别区分信息；根据表征向量与目标向量之间的距离，确定待检测语音的语音类别。通过上述方式，本申请能够提升语音检测的准确率。

20.

发明授权
一种内容推荐方法及装置有权转让

公开(公告)号：CN107886949B

公开(公告)日：2021-04-30

申请号：CN201711195319.4

申请日：2017-11-24

Applicant: 科大讯飞股份有限公司

Inventor： 姜超 , 殷兵 , 何山 , 张学阳 , 李晋

IPC: G10L15/22 , H04L29/08 , G06F16/9535

Abstract: 本发明实施例提供一种内容推荐方法及装置，所述方法包括：获取目标用户的语音请求数据，提取所述语音请求数据中对应的交互推荐特征；根据所述交互推荐特征，在预先构建的与所述目标用户对应的推荐知识库中获取相应的推荐内容并发送给所述目标用户；其中，所述推荐知识库中包括多个对应关系模型；且所述各对应关系模型分别基于从各历史用户的样本语音请求数据中提取的交互推荐特征及和所述各历史用户相对应的推荐内容建立。所述方法大大方便了用户使用的同时，结合了目标用户请求的声学、语义、用户属性及说话人信息，从而进一步提高了内容推荐的准确度。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification