-
公开(公告)号:CN112951209B
公开(公告)日:2023-12-01
申请号:CN202110110872.3
申请日:2021-01-27
Applicant: 中国科学技术大学 , 科大讯飞股份有限公司
Abstract: 本申请提供了一种语音识别方法、装置、设备及计算机可读存储介质,其中,语音识别方法包括:基于预先建立的语音识别模型,依次获取待识别语音中每个语音帧对应的特征向量;在每获得一语音帧对应的特征向量后,基于语音识别模型、当前获得的特征向量和前一解码位置对应的识别结果,确定当前获得的特征向量处是否为解码位置;若是,则基于语音识别模型、当前获得的特征向量和当前获得的特征向量之前的所有特征向量,确定当前解码位置对应的识别结果。本申请提供的语音识别方法可实现实时流式解
-
公开(公告)号:CN110245361B
公开(公告)日:2023-04-18
申请号:CN201910514293.8
申请日:2019-06-14
Applicant: 科大讯飞股份有限公司
IPC: G06F40/58 , G06F40/211
Abstract: 本申请提供一种短语对提取方法、装置、电子设备及可读存储介质,所述方法包括:获取源语言文本以及所述源语言文本对应的目标语言文本;从所述源语言文本和所述目标语言文本中提取至少一个候选短语对,每个所述候选短语对中包括一个源语言候选短语和一个目标语言候选短语,所述源语言候选短语和所述目标语言候选短语的语义相同;对所述至少一个候选短语对进行筛选,得到至少一个目标短语对。该方法能够自动从源语言文本和目标语言文本中提取出实际所需要的目标短语对,将该方法应用于基于神经网络的机器翻译系统时,能够使得机器翻译系统的效率得到极大提升。
-
公开(公告)号:CN110705317B
公开(公告)日:2023-04-07
申请号:CN201910802302.3
申请日:2019-08-28
Applicant: 科大讯飞股份有限公司
Abstract: 本申请实施例公开了一种翻译方法及相关装置,方法包括:获取第一语言语音;处理所述第一语言语音得到待翻译的第一文本片段,所述第一文本片段为第一语言语境中的文本,所述第一文本片段至少包括一个未翻译过的文本单元;判断所述第一文本片段是否为第一个文本片段;若是,则根据所述第一文本片段,生成所述第一语言语音在第二语言语境中的第一翻译结果;若否,则获取至少一个第二文本片段;根据至少一个第二文本片段和所述第一文本片段,生成所述第一语言语音在第二语言语境中的第二翻译结果,所述第二文本片段为已有翻译结果对应于所述第一语言语境中的文本片段。通过本申请实施例,可以有效的降低翻译的时延。
-
公开(公告)号:CN110298046B
公开(公告)日:2023-04-07
申请号:CN201910595220.6
申请日:2019-07-03
Applicant: 科大讯飞股份有限公司
IPC: G06F40/47
Abstract: 本申请公开了一种翻译模型训练方法、文本翻译方法及相关装置,在该方法中,将至少一个样本文本中输入双向翻译模型,以便根据双向翻译模型的输出结果对双向翻译模型进行参数更新,其中,双向翻译模型的输出结果包括每一样本文本的预测翻译文本以及每一样本文本对应的预测词袋,且该预测词袋是朝着对应样本文本的实际词袋的方向预测得到的,该实际词袋包括对应样本文本的实际翻译文本中的各个不同词,因此,在对模型进行参数更新时,需要基于每一样本文本的预测词袋与其实际词袋之间的差异进行参数更新,使得该实际词袋可以用于指导翻译方向,故而,训练完成的双向翻译模型能够朝着输入样本文本的实际词袋的方向进行准确翻译。
-
公开(公告)号:CN115221918A
公开(公告)日:2022-10-21
申请号:CN202210706674.8
申请日:2022-06-21
Applicant: 科大讯飞股份有限公司
Abstract: 本申请提出一种通信辐射源识别方法、装置、设备及存储介质,该方法包括:获取无线电信号的信号特征;将所述信号特征输入预先训练的通信辐射源识别模型,得到与所述无线电信号对应的通信辐射源识别结果;其中,所述通信辐射源识别模型包括特征重建子网络以及特征分类子网络,所述特征重建子网络通过将无线电信号样本的信号特征分别作为训练样本和训练标签进行特征重建训练得到。该通信辐射源识别方法大大降低了对标注样本的数量要求,能够在少量标注样本条件下达到通信辐射源识别目的,从而使得该方法能够胜任更多的通信辐射源识别任务。
-
-
公开(公告)号:CN113409792A
公开(公告)日:2021-09-17
申请号:CN202110694320.1
申请日:2021-06-22
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种语音识别方法及其相关设备,该方法包括:在获取到当前语音段和该当前语音段对应的参考语音后,先依据待使用状态数据和该当前语音段对应的参考语音,对该当前语音段进行编码处理,得到该当前语音段的语音编码和该当前语音段的编码状态数据;再对该当前语音段的语音编码进行解码处理,得到该当前语音段对应的语音文本,并利用该当前语音段的编码状态数据,更新该待使用状态数据。如此能够实现边采集用户语音边进行语音识别的目的,可以提高语音识别的实时性。又因当前语音段的历史语音信息(也就是,待使用状态数据)在历史语音识别过程中已计算过,使得在当前轮语音识别过程中直接使用即可,如此有利于提高语音识别的实时性。
-
公开(公告)号:CN113178189A
公开(公告)日:2021-07-27
申请号:CN202110461596.5
申请日:2021-04-27
Applicant: 科大讯飞股份有限公司
Abstract: 本发明提供了一种信息分类方法和装置、信息分类模型的训练方法和装置。首先对第一模型进行训练。在训练过程中,对第一模型的第一参数进行迭代的第一调整和迭代的第二调整。其中,第一调整的每次迭代包括该迭代的第二调整,第二调整的每次迭代基于第一模型对第一样本集的处理,第一调整的每次迭代基于经迭代的第二调整的第一模型对第二样本集的处理。其中,第一样本集包含一个或多个第一样本,第二样本集包含一个或多个第二样本,各第二样本均具有对应的第一原始标签,该第一原始标签用于表征第二样本的类别。然后,调用已训练的第一模型处理待分类样本得到其第一特征,调用第二模型处理第一特征,以得到待分类样本的第一标签。
-
公开(公告)号:CN108228576B
公开(公告)日:2021-07-02
申请号:CN201711488585.6
申请日:2017-12-29
Applicant: 科大讯飞股份有限公司
Abstract: 本发明实施例提供一种文本翻译方法及装置,属于语言处理技术领域。该方法包括:基于源文本的特征向量及每种聚类类别对应的聚类中心特征向量,确定源文本所属的聚类类别;将源文本所属的聚类类别进行向量化,得到源文本对应的聚类类别向量,将源文本中分词的词向量与源文本对应的聚类类别向量进行整合,将整合结果输入至翻译模型,输出至少一个候选目标文本及每个候选目标文本对应的翻译分值;基于每个候选目标文本的翻译分值,从所有候选目标文本中选取一个候选目标文本作为源文本的翻译结果。由于在翻译过程中可结合源文本的整体语义及其它翻译隐藏参考要素对源文本进行翻译。因此,提高了翻译模型的领域鲁棒性及翻译准确度。
-
公开(公告)号:CN112668346A
公开(公告)日:2021-04-16
申请号:CN202011554126.5
申请日:2020-12-24
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种翻译方法、装置、设备及存储介质,本申请同时获取源语言文本、源语言文本的语音信息及源语言文本中每一文本子单元的结构信息,分别对源语言文本、语音信息及结构信息进行特征提取,得到源语言文本对应的文本特征、语音信息对应的语音特征以及源语言文本对应的结构特征,进而基于三种特征进行翻译,得到翻译后的目标语言文本。由此可见,本申请在翻译过程中,将文本、发音及结构作为同一源语言文本的不同认知层面来综合考虑,基于三种特征进行翻译,实现了资源信息的充分利用,同时,由于翻译时所参考的信息更加丰富,既能够提高翻译过程的鲁棒性,又可以提高翻译结果的质量。
-
-
-
-
-
-
-
-
-