-
公开(公告)号:CN108345679B
公开(公告)日:2021-03-23
申请号:CN201810159175.5
申请日:2018-02-26
Applicant: 科大讯飞股份有限公司
Abstract: 本申请提供了一种音视频检索方法、装置、设备及可读存储介质,方法包括:获取输入的检索词;在预先构建的文本文档库中确定包含检索词的目标文本文档,文本文档库中的每一文本文档由对应的音视频文件转写得到;对于每篇目标文本文档,从目标文本文档中确定与检索词相关的文本内容,获得每篇目标文本文档对应的文本内容;通过每篇目标文本文档对应的文本内容与检索词的相关度,以及各目标文本文档对应的音视频文件,确定检索结果。本申请去除了与检索词无关的内容对检索结果的影响,大大提高了检索准确度。
-
公开(公告)号:CN110489761B
公开(公告)日:2021-02-02
申请号:CN201810463138.3
申请日:2018-05-15
Applicant: 科大讯飞股份有限公司
IPC: G06F40/58 , G06F40/151
Abstract: 本申请公开了一种篇章级文本翻译方法及装置,该方法包括:将待翻译的篇章级文本中的每一文本单位,分别作为待翻译文本,然后,从篇章级文本中获取待翻译文本的关联文本,并根据该关联文本对待翻译文本进行翻译。可见,在对待翻译文本进行翻译时,不但考虑了待翻译文本的当前语境,还考虑了待翻译文本的关联文本内容,能够提高待翻译文本的翻译结果的准确性,因而提升了用户体验。
-
公开(公告)号:CN110491393A
公开(公告)日:2019-11-22
申请号:CN201910817491.1
申请日:2019-08-30
Applicant: 科大讯飞股份有限公司 , 咪咕数字传媒有限公司
Abstract: 本申请实施例公开了一种声纹表征模型的训练方法及装置,所述方法包括如下步骤:将语音数据集的多条语音数据执行特征提取操作,得到多个原始语音特征;将所述多个原始语音特征执行声纹表征操作、内容识别操作以及语音合成操作得到多个合成语音特征;依据所述多个合成语音特征和所述多个原始语音特征构建损失函数,依据所述损失函数对初始声纹表征模型的参数进行更新得到训练后的声纹表征模型。本申请提供的技术方案具有成本低的优点。
-
公开(公告)号:CN106384587B
公开(公告)日:2019-11-15
申请号:CN201510447962.6
申请日:2015-07-24
Applicant: 科大讯飞股份有限公司 , 讯飞智元信息科技有限公司
Abstract: 本发明公开了一种语音识别方法及系统,包括:接收待识别语音信号,并提取所述语音信号的声学特征;根据所述声学特征及预先训练的声学模型,获取各建模单元的后验概率;对所述建模单元后验概率进行压缩平滑处理,获取各建模单元处理后的后验概率;对所述语音信号所有帧的建模单元处理后的后验概率进行解码,得到语音识别结果。本发明由于在获得建模单元后验概率后,对其分布进行压缩平滑处理,增大了建模单元的后验概率对应的多个候选序列对正确语音识别结果的覆盖率,进而提升语音识别效果。
-
公开(公告)号:CN110263149A
公开(公告)日:2019-09-20
申请号:CN201910457327.4
申请日:2019-05-29
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种文本展示方法及装置,该方法包括:当接收到待翻译的目标语音之后,先识别该目标语音得到识别文本,再从该识别文本中提取各个第一关键词,以便在对识别文本进行展示时能够将各个第一关键词与该识别文本中除了各个第一关键词以外的其他词汇进行区别展示,使得在后续翻译过程中翻译人员能够从该展示的识别文本中快速地获取到各个第一关键词。由于各个第一关键词是翻译人员对目标语音进行即时翻译时应特别关注的词,因而,将识别文本中的各个第一关键词与其他词语进行区别展示,能够使翻译人员快速的关注到识别文本中的这些重要信息,从而可以提升翻译人员的翻译速度以及提升翻译结果的准确性。
-
公开(公告)号:CN110245361A
公开(公告)日:2019-09-17
申请号:CN201910514293.8
申请日:2019-06-14
Applicant: 科大讯飞股份有限公司
Abstract: 本申请提供一种短语对提取方法、装置、电子设备及可读存储介质,所述方法包括:获取源语言文本以及所述源语言文本对应的目标语言文本;从所述源语言文本和所述目标语言文本中提取至少一个候选短语对,每个所述候选短语对中包括一个源语言候选短语和一个目标语言候选短语,所述源语言候选短语和所述目标语言候选短语的语义相同;对所述至少一个候选短语对进行筛选,得到至少一个目标短语对。该方法能够自动从源语言文本和目标语言文本中提取出实际所需要的目标短语对,将该方法应用于基于神经网络的机器翻译系统时,能够使得机器翻译系统的效率得到极大提升。
-
公开(公告)号:CN110083837A
公开(公告)日:2019-08-02
申请号:CN201910344875.6
申请日:2019-04-26
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种关键词生成方法及装置,该方法包括:当生成了目标语音的识别文本之后,从该识别文本中提取出各个历史关键词,以及生成与各个历史关键词具有强关联性的联想关键词。其中,与历史关键词具有强相关性的联想关键词能够提示翻译人员在未来待翻译内容中可能出现的关键词,从而节省了翻译人员投入到预测未来待翻译内容所需的精力。如此,当翻译人员在联想关键词的辅助下进行翻译时,能够投入更多的精力在语言的组织和表达上,从而提升了翻译速度和翻译质量。
-
公开(公告)号:CN105991288B
公开(公告)日:2019-07-30
申请号:CN201510100196.6
申请日:2015-03-06
Applicant: 科大讯飞股份有限公司
Abstract: 本发明公开了一种声纹密码文本生成方法及系统,该方法包括:确定各声纹密码文本字符的说话人区分性能;选择说话人区分性能满足要求的字符构建声纹密码文本候选字符集;从所述声纹密码文本候选字符集挑选字符生成声纹密码文本。利用本发明,可以提高声纹认证的准确性。
-
公开(公告)号:CN105991290B
公开(公告)日:2019-07-09
申请号:CN201510100856.0
申请日:2015-03-06
Applicant: 科大讯飞股份有限公司
Abstract: 本发明公开了一种伪随机声纹密码文本生成方法及系统,该方法包括:在用户注册阶段生成一个或多个注册声纹密码文本;将所述多个注册声纹密码文本进行拆分,并将拆分后得到的所有声纹密码子文本作为注册声纹密码子文本集合;从所述注册声纹密码子文本集合中选择声纹密码子文本;将选择的声纹密码子文本组合后作为所述用户认证时的声纹密码文本。利用本发明,可以提升声纹认证的准确度。
-
公开(公告)号:CN109657250A
公开(公告)日:2019-04-19
申请号:CN201811518142.1
申请日:2018-12-12
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种文本翻译方法、装置、设备及可读存储介质,本申请首先确定待翻译文本中的稀疏词,获取所述稀疏词的解释信息,所述解释信息为使用通用词汇对所述稀疏词的通用性解释,进一步根据所述解释信息,确定所述稀疏词在所述待翻译文本中的词向量表示,最后将所述待翻译文本中所述稀疏词的词向量及除稀疏词外的其余词的词向量进行编解码翻译。由此可见,本申请根据稀疏词的解释信息确定稀疏词的词向量,由此对待翻译文本中所有词的词向量进行编解码,得到的翻译结果能够正确且清楚的表达待翻译文本完整的语义内容,克服了现有机器翻译方法中由于稀疏词难以训练得到词向量导致的语义表达不正确或不完整的缺点。
-
-
-
-
-
-
-
-
-