-
公开(公告)号:CN108228576B
公开(公告)日:2021-07-02
申请号:CN201711488585.6
申请日:2017-12-29
Applicant: 科大讯飞股份有限公司
Abstract: 本发明实施例提供一种文本翻译方法及装置,属于语言处理技术领域。该方法包括:基于源文本的特征向量及每种聚类类别对应的聚类中心特征向量,确定源文本所属的聚类类别;将源文本所属的聚类类别进行向量化,得到源文本对应的聚类类别向量,将源文本中分词的词向量与源文本对应的聚类类别向量进行整合,将整合结果输入至翻译模型,输出至少一个候选目标文本及每个候选目标文本对应的翻译分值;基于每个候选目标文本的翻译分值,从所有候选目标文本中选取一个候选目标文本作为源文本的翻译结果。由于在翻译过程中可结合源文本的整体语义及其它翻译隐藏参考要素对源文本进行翻译。因此,提高了翻译模型的领域鲁棒性及翻译准确度。
-
公开(公告)号:CN112668346A
公开(公告)日:2021-04-16
申请号:CN202011554126.5
申请日:2020-12-24
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种翻译方法、装置、设备及存储介质,本申请同时获取源语言文本、源语言文本的语音信息及源语言文本中每一文本子单元的结构信息,分别对源语言文本、语音信息及结构信息进行特征提取,得到源语言文本对应的文本特征、语音信息对应的语音特征以及源语言文本对应的结构特征,进而基于三种特征进行翻译,得到翻译后的目标语言文本。由此可见,本申请在翻译过程中,将文本、发音及结构作为同一源语言文本的不同认知层面来综合考虑,基于三种特征进行翻译,实现了资源信息的充分利用,同时,由于翻译时所参考的信息更加丰富,既能够提高翻译过程的鲁棒性,又可以提高翻译结果的质量。
-
公开(公告)号:CN108345679B
公开(公告)日:2021-03-23
申请号:CN201810159175.5
申请日:2018-02-26
Applicant: 科大讯飞股份有限公司
Abstract: 本申请提供了一种音视频检索方法、装置、设备及可读存储介质,方法包括:获取输入的检索词;在预先构建的文本文档库中确定包含检索词的目标文本文档,文本文档库中的每一文本文档由对应的音视频文件转写得到;对于每篇目标文本文档,从目标文本文档中确定与检索词相关的文本内容,获得每篇目标文本文档对应的文本内容;通过每篇目标文本文档对应的文本内容与检索词的相关度,以及各目标文本文档对应的音视频文件,确定检索结果。本申请去除了与检索词无关的内容对检索结果的影响,大大提高了检索准确度。
-
公开(公告)号:CN110489761B
公开(公告)日:2021-02-02
申请号:CN201810463138.3
申请日:2018-05-15
Applicant: 科大讯飞股份有限公司
IPC: G06F40/58 , G06F40/151
Abstract: 本申请公开了一种篇章级文本翻译方法及装置,该方法包括:将待翻译的篇章级文本中的每一文本单位,分别作为待翻译文本,然后,从篇章级文本中获取待翻译文本的关联文本,并根据该关联文本对待翻译文本进行翻译。可见,在对待翻译文本进行翻译时,不但考虑了待翻译文本的当前语境,还考虑了待翻译文本的关联文本内容,能够提高待翻译文本的翻译结果的准确性,因而提升了用户体验。
-
公开(公告)号:CN106384587B
公开(公告)日:2019-11-15
申请号:CN201510447962.6
申请日:2015-07-24
Applicant: 科大讯飞股份有限公司 , 讯飞智元信息科技有限公司
Abstract: 本发明公开了一种语音识别方法及系统,包括:接收待识别语音信号,并提取所述语音信号的声学特征;根据所述声学特征及预先训练的声学模型,获取各建模单元的后验概率;对所述建模单元后验概率进行压缩平滑处理,获取各建模单元处理后的后验概率;对所述语音信号所有帧的建模单元处理后的后验概率进行解码,得到语音识别结果。本发明由于在获得建模单元后验概率后,对其分布进行压缩平滑处理,增大了建模单元的后验概率对应的多个候选序列对正确语音识别结果的覆盖率,进而提升语音识别效果。
-
公开(公告)号:CN110263149A
公开(公告)日:2019-09-20
申请号:CN201910457327.4
申请日:2019-05-29
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种文本展示方法及装置,该方法包括:当接收到待翻译的目标语音之后,先识别该目标语音得到识别文本,再从该识别文本中提取各个第一关键词,以便在对识别文本进行展示时能够将各个第一关键词与该识别文本中除了各个第一关键词以外的其他词汇进行区别展示,使得在后续翻译过程中翻译人员能够从该展示的识别文本中快速地获取到各个第一关键词。由于各个第一关键词是翻译人员对目标语音进行即时翻译时应特别关注的词,因而,将识别文本中的各个第一关键词与其他词语进行区别展示,能够使翻译人员快速的关注到识别文本中的这些重要信息,从而可以提升翻译人员的翻译速度以及提升翻译结果的准确性。
-
公开(公告)号:CN110245361A
公开(公告)日:2019-09-17
申请号:CN201910514293.8
申请日:2019-06-14
Applicant: 科大讯飞股份有限公司
Abstract: 本申请提供一种短语对提取方法、装置、电子设备及可读存储介质,所述方法包括:获取源语言文本以及所述源语言文本对应的目标语言文本;从所述源语言文本和所述目标语言文本中提取至少一个候选短语对,每个所述候选短语对中包括一个源语言候选短语和一个目标语言候选短语,所述源语言候选短语和所述目标语言候选短语的语义相同;对所述至少一个候选短语对进行筛选,得到至少一个目标短语对。该方法能够自动从源语言文本和目标语言文本中提取出实际所需要的目标短语对,将该方法应用于基于神经网络的机器翻译系统时,能够使得机器翻译系统的效率得到极大提升。
-
公开(公告)号:CN110083837A
公开(公告)日:2019-08-02
申请号:CN201910344875.6
申请日:2019-04-26
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种关键词生成方法及装置,该方法包括:当生成了目标语音的识别文本之后,从该识别文本中提取出各个历史关键词,以及生成与各个历史关键词具有强关联性的联想关键词。其中,与历史关键词具有强相关性的联想关键词能够提示翻译人员在未来待翻译内容中可能出现的关键词,从而节省了翻译人员投入到预测未来待翻译内容所需的精力。如此,当翻译人员在联想关键词的辅助下进行翻译时,能够投入更多的精力在语言的组织和表达上,从而提升了翻译速度和翻译质量。
-
公开(公告)号:CN105991288B
公开(公告)日:2019-07-30
申请号:CN201510100196.6
申请日:2015-03-06
Applicant: 科大讯飞股份有限公司
Abstract: 本发明公开了一种声纹密码文本生成方法及系统,该方法包括:确定各声纹密码文本字符的说话人区分性能;选择说话人区分性能满足要求的字符构建声纹密码文本候选字符集;从所述声纹密码文本候选字符集挑选字符生成声纹密码文本。利用本发明,可以提高声纹认证的准确性。
-
公开(公告)号:CN105991290B
公开(公告)日:2019-07-09
申请号:CN201510100856.0
申请日:2015-03-06
Applicant: 科大讯飞股份有限公司
Abstract: 本发明公开了一种伪随机声纹密码文本生成方法及系统,该方法包括:在用户注册阶段生成一个或多个注册声纹密码文本;将所述多个注册声纹密码文本进行拆分,并将拆分后得到的所有声纹密码子文本作为注册声纹密码子文本集合;从所述注册声纹密码子文本集合中选择声纹密码子文本;将选择的声纹密码子文本组合后作为所述用户认证时的声纹密码文本。利用本发明,可以提升声纹认证的准确度。
-
-
-
-
-
-
-
-
-