-
公开(公告)号:CN113409792A
公开(公告)日:2021-09-17
申请号:CN202110694320.1
申请日:2021-06-22
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种语音识别方法及其相关设备,该方法包括:在获取到当前语音段和该当前语音段对应的参考语音后,先依据待使用状态数据和该当前语音段对应的参考语音,对该当前语音段进行编码处理,得到该当前语音段的语音编码和该当前语音段的编码状态数据;再对该当前语音段的语音编码进行解码处理,得到该当前语音段对应的语音文本,并利用该当前语音段的编码状态数据,更新该待使用状态数据。如此能够实现边采集用户语音边进行语音识别的目的,可以提高语音识别的实时性。又因当前语音段的历史语音信息(也就是,待使用状态数据)在历史语音识别过程中已计算过,使得在当前轮语音识别过程中直接使用即可,如此有利于提高语音识别的实时性。
-
公开(公告)号:CN113178189A
公开(公告)日:2021-07-27
申请号:CN202110461596.5
申请日:2021-04-27
Applicant: 科大讯飞股份有限公司
Abstract: 本发明提供了一种信息分类方法和装置、信息分类模型的训练方法和装置。首先对第一模型进行训练。在训练过程中,对第一模型的第一参数进行迭代的第一调整和迭代的第二调整。其中,第一调整的每次迭代包括该迭代的第二调整,第二调整的每次迭代基于第一模型对第一样本集的处理,第一调整的每次迭代基于经迭代的第二调整的第一模型对第二样本集的处理。其中,第一样本集包含一个或多个第一样本,第二样本集包含一个或多个第二样本,各第二样本均具有对应的第一原始标签,该第一原始标签用于表征第二样本的类别。然后,调用已训练的第一模型处理待分类样本得到其第一特征,调用第二模型处理第一特征,以得到待分类样本的第一标签。
-
公开(公告)号:CN108228576B
公开(公告)日:2021-07-02
申请号:CN201711488585.6
申请日:2017-12-29
Applicant: 科大讯飞股份有限公司
Abstract: 本发明实施例提供一种文本翻译方法及装置,属于语言处理技术领域。该方法包括:基于源文本的特征向量及每种聚类类别对应的聚类中心特征向量,确定源文本所属的聚类类别;将源文本所属的聚类类别进行向量化,得到源文本对应的聚类类别向量,将源文本中分词的词向量与源文本对应的聚类类别向量进行整合,将整合结果输入至翻译模型,输出至少一个候选目标文本及每个候选目标文本对应的翻译分值;基于每个候选目标文本的翻译分值,从所有候选目标文本中选取一个候选目标文本作为源文本的翻译结果。由于在翻译过程中可结合源文本的整体语义及其它翻译隐藏参考要素对源文本进行翻译。因此,提高了翻译模型的领域鲁棒性及翻译准确度。
-
公开(公告)号:CN112668346A
公开(公告)日:2021-04-16
申请号:CN202011554126.5
申请日:2020-12-24
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种翻译方法、装置、设备及存储介质,本申请同时获取源语言文本、源语言文本的语音信息及源语言文本中每一文本子单元的结构信息,分别对源语言文本、语音信息及结构信息进行特征提取,得到源语言文本对应的文本特征、语音信息对应的语音特征以及源语言文本对应的结构特征,进而基于三种特征进行翻译,得到翻译后的目标语言文本。由此可见,本申请在翻译过程中,将文本、发音及结构作为同一源语言文本的不同认知层面来综合考虑,基于三种特征进行翻译,实现了资源信息的充分利用,同时,由于翻译时所参考的信息更加丰富,既能够提高翻译过程的鲁棒性,又可以提高翻译结果的质量。
-
公开(公告)号:CN108345679B
公开(公告)日:2021-03-23
申请号:CN201810159175.5
申请日:2018-02-26
Applicant: 科大讯飞股份有限公司
Abstract: 本申请提供了一种音视频检索方法、装置、设备及可读存储介质,方法包括:获取输入的检索词;在预先构建的文本文档库中确定包含检索词的目标文本文档,文本文档库中的每一文本文档由对应的音视频文件转写得到;对于每篇目标文本文档,从目标文本文档中确定与检索词相关的文本内容,获得每篇目标文本文档对应的文本内容;通过每篇目标文本文档对应的文本内容与检索词的相关度,以及各目标文本文档对应的音视频文件,确定检索结果。本申请去除了与检索词无关的内容对检索结果的影响,大大提高了检索准确度。
-
公开(公告)号:CN110489761B
公开(公告)日:2021-02-02
申请号:CN201810463138.3
申请日:2018-05-15
Applicant: 科大讯飞股份有限公司
IPC: G06F40/58 , G06F40/151
Abstract: 本申请公开了一种篇章级文本翻译方法及装置,该方法包括:将待翻译的篇章级文本中的每一文本单位,分别作为待翻译文本,然后,从篇章级文本中获取待翻译文本的关联文本,并根据该关联文本对待翻译文本进行翻译。可见,在对待翻译文本进行翻译时,不但考虑了待翻译文本的当前语境,还考虑了待翻译文本的关联文本内容,能够提高待翻译文本的翻译结果的准确性,因而提升了用户体验。
-
公开(公告)号:CN110491393A
公开(公告)日:2019-11-22
申请号:CN201910817491.1
申请日:2019-08-30
Applicant: 科大讯飞股份有限公司 , 咪咕数字传媒有限公司
Abstract: 本申请实施例公开了一种声纹表征模型的训练方法及装置,所述方法包括如下步骤:将语音数据集的多条语音数据执行特征提取操作,得到多个原始语音特征;将所述多个原始语音特征执行声纹表征操作、内容识别操作以及语音合成操作得到多个合成语音特征;依据所述多个合成语音特征和所述多个原始语音特征构建损失函数,依据所述损失函数对初始声纹表征模型的参数进行更新得到训练后的声纹表征模型。本申请提供的技术方案具有成本低的优点。
-
公开(公告)号:CN106384587B
公开(公告)日:2019-11-15
申请号:CN201510447962.6
申请日:2015-07-24
Applicant: 科大讯飞股份有限公司 , 讯飞智元信息科技有限公司
Abstract: 本发明公开了一种语音识别方法及系统,包括:接收待识别语音信号,并提取所述语音信号的声学特征;根据所述声学特征及预先训练的声学模型,获取各建模单元的后验概率;对所述建模单元后验概率进行压缩平滑处理,获取各建模单元处理后的后验概率;对所述语音信号所有帧的建模单元处理后的后验概率进行解码,得到语音识别结果。本发明由于在获得建模单元后验概率后,对其分布进行压缩平滑处理,增大了建模单元的后验概率对应的多个候选序列对正确语音识别结果的覆盖率,进而提升语音识别效果。
-
公开(公告)号:CN110263149A
公开(公告)日:2019-09-20
申请号:CN201910457327.4
申请日:2019-05-29
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种文本展示方法及装置,该方法包括:当接收到待翻译的目标语音之后,先识别该目标语音得到识别文本,再从该识别文本中提取各个第一关键词,以便在对识别文本进行展示时能够将各个第一关键词与该识别文本中除了各个第一关键词以外的其他词汇进行区别展示,使得在后续翻译过程中翻译人员能够从该展示的识别文本中快速地获取到各个第一关键词。由于各个第一关键词是翻译人员对目标语音进行即时翻译时应特别关注的词,因而,将识别文本中的各个第一关键词与其他词语进行区别展示,能够使翻译人员快速的关注到识别文本中的这些重要信息,从而可以提升翻译人员的翻译速度以及提升翻译结果的准确性。
-
公开(公告)号:CN110245361A
公开(公告)日:2019-09-17
申请号:CN201910514293.8
申请日:2019-06-14
Applicant: 科大讯飞股份有限公司
Abstract: 本申请提供一种短语对提取方法、装置、电子设备及可读存储介质,所述方法包括:获取源语言文本以及所述源语言文本对应的目标语言文本;从所述源语言文本和所述目标语言文本中提取至少一个候选短语对,每个所述候选短语对中包括一个源语言候选短语和一个目标语言候选短语,所述源语言候选短语和所述目标语言候选短语的语义相同;对所述至少一个候选短语对进行筛选,得到至少一个目标短语对。该方法能够自动从源语言文本和目标语言文本中提取出实际所需要的目标短语对,将该方法应用于基于神经网络的机器翻译系统时,能够使得机器翻译系统的效率得到极大提升。
-
-
-
-
-
-
-
-
-