-
公开(公告)号:CN108345679B
公开(公告)日:2021-03-23
申请号:CN201810159175.5
申请日:2018-02-26
Applicant: 科大讯飞股份有限公司
Abstract: 本申请提供了一种音视频检索方法、装置、设备及可读存储介质,方法包括:获取输入的检索词;在预先构建的文本文档库中确定包含检索词的目标文本文档,文本文档库中的每一文本文档由对应的音视频文件转写得到;对于每篇目标文本文档,从目标文本文档中确定与检索词相关的文本内容,获得每篇目标文本文档对应的文本内容;通过每篇目标文本文档对应的文本内容与检索词的相关度,以及各目标文本文档对应的音视频文件,确定检索结果。本申请去除了与检索词无关的内容对检索结果的影响,大大提高了检索准确度。
-
公开(公告)号:CN109599096A
公开(公告)日:2019-04-09
申请号:CN201910074372.1
申请日:2019-01-25
Applicant: 科大讯飞股份有限公司
IPC: G10L15/06 , G10L15/14 , G10L15/183
Abstract: 本申请公开了一种数据筛选方法及装置,该方法包括:基于对数据特征的学习需求,采用预设的筛选策略在待筛选的数据集合中进行数据筛选,得到筛选数据,其中,该筛选数据中携带了未学习到的数据特征。可见,基于对数据特征的学习需求,预先制定数据筛选策略,以在待筛选的数据集合中进行数据筛选,使筛选出的数据携带有当前未学习到的数据特征,进而,可以基于这些筛选出的有限数据资源进行特征学习,即,实现了在低资源条件下的特征学习。
-
公开(公告)号:CN111128223B
公开(公告)日:2022-08-05
申请号:CN201911424875.3
申请日:2019-12-30
Applicant: 科大讯飞股份有限公司
IPC: G10L21/0272 , G10L25/03
Abstract: 本申请实施例公开了一种基于文本信息的辅助说话人分离方法及相关装置,方法包括:获取待分离的第一语音信息;对待分离的第一语音信息进行第一分离处理,得到第一分离结果,第一分离处理是指对第一语音信息中的不同说话人进行初步分割和聚类;对第一分离结果进行语音处理,得到第二语音信息,语音处理包括语音识别或语音表征信息采集;将第二语音信息输入预先训练好的说话人转变点识别模型,确定第二语音信息中的说话人的转变点;根据说话人的转变点和第一分离结果得到目标分离结果。可见,本申请通过获取的第一语音信息获取文本信息,融合底层声学特征与文本信息进行说话人分离,提高说话人分离的准确性。
-
公开(公告)号:CN115630274A
公开(公告)日:2023-01-20
申请号:CN202211399016.5
申请日:2022-11-09
Applicant: 科大讯飞股份有限公司
IPC: G06F18/00 , G06N3/0464 , G06N3/08
Abstract: 本申请公开了一种通信辐射源的识别方法、装置、存储介质及计算设备,涉及通信技术领域,该方法包括:采集来自于通信辐射源的第一原始波形信号;利用特征提取网络从第一原始波形信号提取通信辐射源的特征,该特征提取网络包括深度神经网络,该深度神经网络包括过滤层,该过滤层包括用于获取设定频率范围的电磁信号的一组带通滤波器;将通信辐射源的特征输入分类器,获得通信辐射源的识别结果。该方法从原始波形信号中直接提取通信辐射源的特征,使得提取的特征能够适用于不同的场景和任务,同时,深度神经网络的过滤层包括用于获取设定频率范围的电磁信号的一组带通滤波器,从而增加提取的特征的可解释性,提升通信辐射源识别的准确度。
-
公开(公告)号:CN108345679A
公开(公告)日:2018-07-31
申请号:CN201810159175.5
申请日:2018-02-26
Applicant: 科大讯飞股份有限公司
IPC: G06F17/30
Abstract: 本申请提供了一种音视频检索方法、装置、设备及可读存储介质,方法包括:获取输入的检索词;在预先构建的文本文档库中确定包含检索词的目标文本文档,文本文档库中的每一文本文档由对应的音视频文件转写得到;对于每篇目标文本文档,从目标文本文档中确定与检索词相关的文本内容,获得每篇目标文本文档对应的文本内容;通过每篇目标文本文档对应的文本内容与检索词的相关度,以及各目标文本文档对应的音视频文件,确定检索结果。本申请去除了与检索词无关的内容对检索结果的影响,大大提高了检索准确度。
-
公开(公告)号:CN109599096B
公开(公告)日:2021-12-07
申请号:CN201910074372.1
申请日:2019-01-25
Applicant: 科大讯飞股份有限公司
IPC: G10L15/06 , G10L15/14 , G10L15/183
Abstract: 本申请公开了一种数据筛选方法及装置,该方法包括:基于对数据特征的学习需求,采用预设的筛选策略在待筛选的数据集合中进行数据筛选,得到筛选数据,其中,该筛选数据中携带了未学习到的数据特征。可见,基于对数据特征的学习需求,预先制定数据筛选策略,以在待筛选的数据集合中进行数据筛选,使筛选出的数据携带有当前未学习到的数据特征,进而,可以基于这些筛选出的有限数据资源进行特征学习,即,实现了在低资源条件下的特征学习。
-
公开(公告)号:CN111128223A
公开(公告)日:2020-05-08
申请号:CN201911424875.3
申请日:2019-12-30
Applicant: 科大讯飞股份有限公司
IPC: G10L21/0272 , G10L25/03
Abstract: 本申请实施例公开了一种基于文本信息的辅助说话人分离方法及相关装置,方法包括:获取待分离的第一语音信息;对待分离的第一语音信息进行第一分离处理,得到第一分离结果,第一分离处理是指对第一语音信息中的不同说话人进行初步分割和聚类;对第一分离结果进行语音处理,得到第二语音信息,语音处理包括语音识别或语音表征信息采集;将第二语音信息输入预先训练好的说话人转变点识别模型,确定第二语音信息中的说话人的转变点;根据说话人的转变点和第一分离结果得到目标分离结果。可见,本申请通过获取的第一语音信息获取文本信息,融合底层声学特征与文本信息进行说话人分离,提高说话人分离的准确性。
-
-
-
-
-
-