Patent search ap:("科大讯飞股份有限公司") AND inv:"柳林" Page 4

31.

发明授权
语音匹配方法、装置、电子设备及存储介质有权

公开(公告)号：CN111968650B

公开(公告)日：2024-04-30

申请号：CN202010826186.1

申请日：2020-08-17

Applicant: 科大讯飞股份有限公司

Inventor： 李晋 , 褚繁 , 方昕 , 余青松 , 柳林 , 戴礼荣 , 胡郁

IPC: G10L17/00 , G10L17/22 , G10L21/0272

Abstract: 本发明实施例提供一种语音匹配方法、装置、电子设备及存储介质，所述方法包括：确定待匹配话单的两个待匹配号码；将待匹配话单中的语音数据的声纹特征分别与两个待匹配号码的声纹特征进行匹配，得到待匹配话单中的语音数据与两个待匹配号码的匹配关系；其中，任一待匹配号码的声纹特征是对该待匹配号码的话单集中每一语音数据的声纹特征进行聚类得到的，该待匹配号码的话单集包括多个以该待匹配号码为一端、不同号码为另一端的话单。本发明实施例提供的方法、装置、电子设备及存储介质，保证了语音数据与其对应主被叫号码的一致性。

32.

发明授权
表格版面分析与提取方法及相关装置有权

公开(公告)号：CN110598575B

公开(公告)日：2023-06-02

申请号：CN201910773607.6

申请日：2019-08-21

Applicant: 科大讯飞股份有限公司

Inventor： 王鹏飞 , 殷兵 , 胡金水 , 柳林 , 景子君 , 谢名亮 , 韩球 , 刘驰 , 魏冲洲

IPC: G06V30/413 , G06V30/414

Abstract: 本申请实施例公开了一种表格版面分析与提取方法及相关装置，方法包括：获取包含表格版面的图片；确定图片中符合表格线约束条件的多个单连通链集合，多个单连通链集合中每个单连通链集合包括至少一条单连通链，单连通链对应于图片中的横向或竖向的短线段，表格线约束条件是指单连通链的方向相同且处于同一直线；根据每个单连通链集合包含的至少一条单连通链，生成每个单连通链集合对应的参考表格线；根据多个单连通链集合对应的多个参考表格线，生成图片的表格版面。本申请有利于提高表格版面提取的效率和准确率。

33.

发明公开
一种通信辐射源识别方法、装置、设备及存储介质审中-实审

公开(公告)号：CN115221918A

公开(公告)日：2022-10-21

申请号：CN202210706674.8

申请日：2022-06-21

Applicant: 科大讯飞股份有限公司

Inventor： 李晋 , 方昕 , 尤建 , 刘俊华 , 方四安 , 柳林

IPC: G06K9/00 , G06N3/04 , G06N3/08

Abstract: 本申请提出一种通信辐射源识别方法、装置、设备及存储介质，该方法包括：获取无线电信号的信号特征；将所述信号特征输入预先训练的通信辐射源识别模型，得到与所述无线电信号对应的通信辐射源识别结果；其中，所述通信辐射源识别模型包括特征重建子网络以及特征分类子网络，所述特征重建子网络通过将无线电信号样本的信号特征分别作为训练样本和训练标签进行特征重建训练得到。该通信辐射源识别方法大大降低了对标注样本的数量要求，能够在少量标注样本条件下达到通信辐射源识别目的，从而使得该方法能够胜任更多的通信辐射源识别任务。

34.

发明授权
一种音视频检索方法、装置、设备及可读存储介质有权

公开(公告)号：CN108345679B

公开(公告)日：2021-03-23

申请号：CN201810159175.5

申请日：2018-02-26

Applicant: 科大讯飞股份有限公司

Inventor： 侯佳礼 , 刘俊华 , 王建社 , 柳林 , 刘海波 , 杨帆 , 刘江 , 赵志伟 , 冯祥 , 胡国平 , 殷兵 , 张程风

IPC: G06F16/68 , G06F16/78

Abstract: 本申请提供了一种音视频检索方法、装置、设备及可读存储介质，方法包括：获取输入的检索词；在预先构建的文本文档库中确定包含检索词的目标文本文档，文本文档库中的每一文本文档由对应的音视频文件转写得到；对于每篇目标文本文档，从目标文本文档中确定与检索词相关的文本内容，获得每篇目标文本文档对应的文本内容；通过每篇目标文本文档对应的文本内容与检索词的相关度，以及各目标文本文档对应的音视频文件，确定检索结果。本申请去除了与检索词无关的内容对检索结果的影响，大大提高了检索准确度。

35.

发明公开
声纹表征模型的训练方法及相关装置有权

公开(公告)号：CN110491393A

公开(公告)日：2019-11-22

申请号：CN201910817491.1

申请日：2019-08-30

Applicant: 科大讯飞股份有限公司 , 咪咕数字传媒有限公司

Inventor： 方昕 , 刘俊华 , 柳林

IPC: G10L17/04 , G10L17/02 , G10L17/18

Abstract: 本申请实施例公开了一种声纹表征模型的训练方法及装置，所述方法包括如下步骤：将语音数据集的多条语音数据执行特征提取操作，得到多个原始语音特征；将所述多个原始语音特征执行声纹表征操作、内容识别操作以及语音合成操作得到多个合成语音特征；依据所述多个合成语音特征和所述多个原始语音特征构建损失函数，依据所述损失函数对初始声纹表征模型的参数进行更新得到训练后的声纹表征模型。本申请提供的技术方案具有成本低的优点。

36.

发明公开
一种目标检测方法、装置、设备及可读存储介质有权转让

公开(公告)号：CN109784290A

公开(公告)日：2019-05-21

申请号：CN201910063147.8

申请日：2019-01-23

Applicant: 科大讯飞股份有限公司

Inventor： 何山 , 殷兵 , 柳林 , 刘聪

IPC: G06K9/00 , G06K9/32 , G06K9/34 , G06K9/62

Abstract: 本申请提供了一种目标检测方法、装置、设备及可读存储介质，目标检测方法包括：获取目标场景下的图像序列中的一待检测图像，获取目标场景下的各类目标在待检测图像各对应位置的出现情况；基于预设的前景检测算法以及目标场景下的各类目标在待检测图像中的出现情况，确定待检测图像对应的目标检测结果。本申请提供的目标检测方法能够大大减少前景检测效果不理想带来的虚警，还能够减少短时间内静止目标的漏警，并且还能够大大降低目标检测的运算量，提高目标检测效率。

37.

发明公开
目标图像检索方法及系统有权

公开(公告)号：CN109299304A

公开(公告)日：2019-02-01

申请号：CN201811250718.0

申请日：2018-10-25

Applicant: 科大讯飞股份有限公司

Inventor： 朱仁兵 , 胡挺 , 殷兵 , 何山 , 柳林 , 刘聪 , 杨世清

IPC: G06F16/53

Abstract: 本发明公开了一种目标图像检索方法及系统，其中方法包括：提取图像样本库中各图像样本的样本特征点；滤除每幅图像样本中冗余的样本特征点；利用滤除冗余后的样本特征点构建公共特征点集合和私有特征点集合；提取待处理图像的待处理特征点；将所述待处理特征点与所述公共特征点集合和所述私有特征点集合中的样本特征点进行匹配，得到每幅图像样本的匹配得分；选取匹配得分最高的图像样本作为目标图像。本发明通过压缩样本特征点冗余的方式精简图像样本库，在减少匹配次数的同时能够显著加快匹配速度，进而提升匹配的精准度，使得整个检索过程相较现有技术在效率和效果上皆具有明显的改善。

38.

发明公开
变声检测方法及装置有权

公开(公告)号：CN108198574A

公开(公告)日：2018-06-22

申请号：CN201711475093.3

申请日：2017-12-29

Applicant: 科大讯飞股份有限公司

Inventor： 李晋 , 殷兵 , 柳林 , 胡国平

IPC: G10L25/51 , G10L17/02

Abstract: 本发明提供的变声检测方法及装置，获取待与目标对象进行认证匹配的待测语音数据；利用预置的变声检测模型，确定与所述待测语音数据匹配的待测声纹特征信息，以及语音伪造判决结果；确定所述待测声纹特征信息与所述目标对象已注册的声纹特征信息的相似度，得到声纹相似度；根据所述语音伪造判决结果以及所述声纹相似度，确定所述待测语音数据是否为人工伪造的变声语音数据。本发明利用变声检测模型来确定与所述待测语音数据匹配的待测声纹特征信息，以及语音伪造判决结果，进而来实现待测语音数据的检测，大幅提高了待测语音数据的检测效率以及检测结果的精准度。

39.

发明公开
语音翻译处理方法及装置有权

公开(公告)号：CN107886940A

公开(公告)日：2018-04-06

申请号：CN201711107222.3

申请日：2017-11-10

Applicant: 科大讯飞股份有限公司

Inventor： 刘俊华 , 魏思 , 胡国平 , 柳林 , 王建社 , 方昕 , 李永超 , 孟廷

IPC: G10L15/00 , G10L15/02 , G10L15/26 , G06F17/28

CPC classification number: G10L15/005 , G06F17/2827 , G06F17/289 , G10L15/02 , G10L15/26

Abstract: 本发明实施例提供一种语音翻译处理方法及装置，属于语言处理技术领域。该方法包括：若判断获知上一轮次的第一语音信号与当前轮次待翻译的第二语音信号均对应相同的语种类型，则基于第一语音信号对应的文本数据对第二语音信号对应的文本数据进行调整，得到第二语音信号对应调整后的文本数据；获取调整后的文本数据对应的合成语音信号，并播报合成语音信号。由于上一轮次的第一语音信号与当前轮次待翻译的第二语音信号在内容上可能是有关联的，从而基于第一语音信号对应的文本数据对第二语音信号对应的文本数据进行调整，可使得翻译结果会更加切合场景且更加精准。

40.

发明公开
单通检测方法及装置有权

公开(公告)号：CN107846520A

公开(公告)日：2018-03-27

申请号：CN201711015585.4

申请日：2017-10-26

Applicant: 科大讯飞股份有限公司

Inventor： 黄健源 , 常永波 , 殷兵 , 胡国平 , 程甦 , 魏思 , 柳林

IPC: H04M3/22 , H04W24/04 , H04W24/08 , H04L12/26 , H04L29/06

Abstract: 本发明实施例提供一种单通检测方法及装置，属于移动通信领域。该方法包括：获取进行语音通话的第一终端和第二终端，所分别对应的第一通话记录和第二通话记录；基于语音通话参数分别对第一通话记录及第二通话记录进行检测，根据检测结果确定第二终端是否发生感知单通。本发明实施例通过获取进行语音通话的第一终端和第二终端，所分别对应的第一通话记录和第二通话记录。基于语音通话参数分别对第一通话记录及第二通话记录进行检测，根据检测结果确定第二终端是否发生感知单通。由于可按照多种类型的语音通话参数，在语音语义层面上对用户行为进行分析，从而在降低单通误判率的同时，提升了单通检测效果。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification