-
公开(公告)号:CN108228576A
公开(公告)日:2018-06-29
申请号:CN201711488585.6
申请日:2017-12-29
Applicant: 科大讯飞股份有限公司
Abstract: 本发明实施例提供一种文本翻译方法及装置,属于语言处理技术领域。该方法包括:基于源文本的特征向量及每种聚类类别对应的聚类中心特征向量,确定源文本所属的聚类类别;将源文本所属的聚类类别进行向量化,得到源文本对应的聚类类别向量,将源文本中分词的词向量与源文本对应的聚类类别向量进行整合,将整合结果输入至翻译模型,输出至少一个候选目标文本及每个候选目标文本对应的翻译分值;基于每个候选目标文本的翻译分值,从所有候选目标文本中选取一个候选目标文本作为源文本的翻译结果。由于在翻译过程中可结合源文本的整体语义及其它翻译隐藏参考要素对源文本进行翻译。因此,提高了翻译模型的领域鲁棒性及翻译准确度。
-
公开(公告)号:CN108170686A
公开(公告)日:2018-06-15
申请号:CN201711480227.0
申请日:2017-12-29
Applicant: 科大讯飞股份有限公司
IPC: G06F17/28
Abstract: 本发明实施例提供一种文本翻译方法及装置,属于语言处理技术领域。该方法包括:获取源文本对应的音素序列编码向量及词序列向量;其中,源文本对应的音素序列编码向量中包含的音素编码向量数与源文本对应的词序列向量中包含的词向量数相同;将源文本对应的音素序列编码向量与词序列向量输入至翻译模型,输出得到源文本对应的目标文本。由于在机器翻译的解码阶段之前,结合了词序列和音素序列进行编码,从而可利用音素序列对语音识别结果作容错处理,使得翻译后的目标文本能够更加准确地对应源语音信号。因此,翻译结果更加准确。
-
公开(公告)号:CN107767858A
公开(公告)日:2018-03-06
申请号:CN201710805626.3
申请日:2017-09-08
Applicant: 科大讯飞股份有限公司
Abstract: 本公开提供一种发音词典生成方法及装置、存储介质、电子设备。该方法包括:获取待确定发音词语对应的语音片段,并针对所述待确定发音词语构建发音识别网络,所述发音识别网络中包括所述待确定发音词语的正确发音单元以及音变发音单元;利用所述发音识别网络对所述语音片段进行解码,确定出所述语音片段对应的发音路径,所述发音路径由所述正确发音单元和/或所述音变发音单元构成;计算所述发音路径表示的发音的置信度,并利用置信度高于预设值的发音路径表示的发音,生成所述待确定发音词语的发音词典。如此方案,可以使生成的发音词典更符合用户的实际发音,准确性更高。
-
公开(公告)号:CN106708806A
公开(公告)日:2017-05-24
申请号:CN201710031626.2
申请日:2017-01-17
Applicant: 科大讯飞股份有限公司
IPC: G06F17/27
Abstract: 本申请提出一种样本确认方法和装置及系统,该方法包括:获取待确认样本集合中每个待确认样本的置信度;确定待确认样本集合中每个待确认样本的相似样本;根据所述相似样本对每个待确认样本的置信度进行修正,得到每个待确认样本的修正后的置信度;根据每个待确认样本的修正后的置信度对每个待确认样本进行确认。该方法能够提高样本确认的准确度,进而提高应用效果。
-
公开(公告)号:CN106384587A
公开(公告)日:2017-02-08
申请号:CN201510447962.6
申请日:2015-07-24
Applicant: 科大讯飞股份有限公司 , 讯飞智元信息科技有限公司
Abstract: 本发明公开了一种语音识别方法及系统,包括:接收待识别语音信号,并提取所述语音信号的声学特征;根据所述声学特征及预先训练的声学模型,获取各建模单元的后验概率;对所述建模单元后验概率进行压缩平滑处理,获取各建模单元处理后的后验概率;对所述语音信号所有帧的建模单元处理后的后验概率进行解码,得到语音识别结果。本发明由于在获得建模单元后验概率后,对其分布进行压缩平滑处理,增大了建模单元的后验概率对应的多个候选序列对正确语音识别结果的覆盖率,进而提升语音识别效果。
-
公开(公告)号:CN209086799U
公开(公告)日:2019-07-09
申请号:CN201821930720.8
申请日:2018-11-22
Applicant: 科大讯飞股份有限公司
Abstract: 本实用新型公开了一种电子笔录设备,包括显示主机以及与显示主机数据连接的触控手写板;显示主机设有通讯模块;所述显示主机通过所述通讯模块获取文本数据;触控手写板设有相互独立的触控操作区和手写录入区;显示主机还用于显示所述文本数据、触控及手写内容。本实用新型结合实际应用所需,不仅能够减轻译员的工作强度,还可以缓解传译时短时记忆以及纸笔速记所带来的心理压力,进而能够有效地解决漏记、错记等问题,大大提升交替传译的完整度和准确度。
-
-
-
-
-