-
公开(公告)号:CN112560510B
公开(公告)日:2023-12-01
申请号:CN202011454443.X
申请日:2020-12-10
Applicant: 科大讯飞股份有限公司
Abstract: 模型训练数据,提升了翻译模型的训练效果。本申请公开了一种翻译模型训练方法、装置、设备及存储介质,本申请针对源语言和/或目标语言,获取其各自的近似语言下的训练语料,以及训练语料的平行语料,其中,若训练语料的语言与源语言近似,该平行语料是目标语言,若训练语料的语言与目标语言近似,该平行语料是源语言,针对训练语料中至少一文本单元,利用该文本单元在与训练语料近似的源语言或目标语言下的平行文本单元进行替换,得到混合语言训练语料,由混合语言训练语料与平行语料组成平行语料对,以平行语料对加入训练样本集,训
-
公开(公告)号:CN116682158A
公开(公告)日:2023-09-01
申请号:CN202310651309.6
申请日:2023-06-01
Applicant: 科大讯飞股份有限公司
IPC: G06V40/16 , G10L25/63 , G10L25/30 , G06V40/70 , G06V20/40 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/084
Abstract: 本申请公开了一种情绪识别方法、装置、存储介质及设备,该方法包括:首先获取待识别的目标视频,并从中分离出音频信号流和图像信号流,然后将音频信号流和图像信号流分别输入预先构建的情绪识别模型,预测得到目标视频中目标用户对应的第一初步情绪识别结果和第二初步情绪识别结果;其中,情绪识别模型是在利用样本音频信号流和样本图像信号流进行交替训练后,再通过梯度融合的参数更新方式训练得到的;接着根据第一初步情绪识别结果和第二初步情绪识别结果,确定目标用户的最终情绪识别结果。由于本申请是先利用模态相关的训练方法和梯度融合的参数更新方式构建了情绪识别模型,从而在利用该模型进行情绪识别时,能够提高识别结果的准确率。
-
公开(公告)号:CN111460149B
公开(公告)日:2023-07-25
申请号:CN202010230887.9
申请日:2020-03-27
Applicant: 科大讯飞股份有限公司
IPC: G06F16/35 , G06F16/36 , G06F40/295 , G06F40/30 , G06F40/232 , G06F40/253
Abstract: 本申请公开了一种文本分类方法、相关设备及可读存储介质,首先,获取待分类文本,及预置的待测类别对应的类别文本;再确定由每一类别文本和所述待分类文本组成的文本对的文本语义信息;然后,针对每一文本对,基于该文本对的文本语义信息,确定该文本对是否匹配;最后,将匹配的文本对中的类别文本对应的待测类别作为所述待分类文本的类别。基于上述方案,能够将海量的文本划分为不同的类别,得到文本类别的划分结果,基于文本类别的划分结果,可以将不同类别下的文本推荐到相应人员,从而帮助用户在海量文本中选择出有价值的文本。
-
公开(公告)号:CN116466314A
公开(公告)日:2023-07-21
申请号:CN202310350067.7
申请日:2023-03-31
Applicant: 科大讯飞股份有限公司
IPC: G01S7/41
Abstract: 本申请公开了一种雷达个体分选方法、装置、存储介质及设备,该方法包括:首先将雷达脉冲序列划分为P个节拍;并在其中第n个节拍内获取每一脉冲描述字的预设维度的特征参数向量;然后对其进行聚类处理,得到第n个节拍包含的异常聚类簇和M个有效聚类簇;接着分别构建M个有效聚类簇对应的混合高斯模型;并依次从异常聚类簇中选取目标异常脉冲描述字,以计算其分别在这M个混合高斯模型中的最大似然度得分;进而从中选取最大得分,并判断其是否高于预设第一阈值;若是,则将目标异常脉冲描述字分选为最大得分对应的有效聚类簇;若否,则将其分选为异常聚类簇,依次类推,直至得到这P个节拍中所有脉冲描述字的分选结果,以有效提高分选准确率。
-
公开(公告)号:CN110162801B
公开(公告)日:2023-05-30
申请号:CN201910456776.7
申请日:2019-05-29
Applicant: 科大讯飞股份有限公司
IPC: G06F40/58 , G06F16/33 , G06F16/335
-
公开(公告)号:CN114742514A
公开(公告)日:2022-07-12
申请号:CN202210199273.8
申请日:2022-03-02
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了同传延迟检测方法及相关装置、电子设备、存储介质,其中,同传延迟检测方法包括:检测同传过程中各个语句对的语句同传延迟;其中,语句对包括源语种的第一语句和目标语种的第二语句,语句对的语句同传延迟包括语句对的帧级延迟;基于所述语句同传延迟,统计得到篇章同传延迟。上述方案,能够自动检测同传延迟,相较于人工检测有助于大幅减少检测时间和检测成本。
-
公开(公告)号:CN112767917B
公开(公告)日:2022-05-17
申请号:CN202011641751.3
申请日:2020-12-31
Applicant: 科大讯飞股份有限公司
Abstract: 本申请实施例公开了一种语音识别方法、装置及存储介质,方法包括:对待识别语音数据进行编码,得到第一特征向量序列;对预设热词库中每一热词进行编码,得到第二特征向量序列;对所述预设热词库中每个热词的音频片段进行编码,得到第三特征向量序列;将所述第一特征向量序列和所述第三特征向量序列进行第一注意力操作,得到第四特征向量序列;根据所述第二特征向量序列、所述第三特征向量序列和所述第四特征向量序列进行解码操作,得到识别结果。采用本申请实施例能够提升热词识别精度。
-
公开(公告)号:CN114492469A
公开(公告)日:2022-05-13
申请号:CN202111630203.5
申请日:2021-12-28
Applicant: 科大讯飞股份有限公司
IPC: G06F40/58 , G06F40/30 , G06F40/289 , G06K9/62
Abstract: 本申请公开了一种翻译方法、翻译装置和计算机可读存储介质,该翻译方法包括:获取待处理数据,将待处理数据输入第一翻译模型,得到翻译数据;其中,第一翻译模型的训练方法包括:获取训练完的第二翻译模型、原始平行语料以及多个新词集,新词集包括第一新词以及至少一个第二新词,第二新词为第一新词的译文;对新词集进行处理,得到包含新词集的第一训练平行语料;对第一训练平行语料进行清洗处理,得到第二训练平行语料;采用原始平行语料与第二训练平行语料,对第二翻译模型进行更新训练,得到第一翻译模型。通过上述方式,本申请能够提升新词的翻译效果。
-
公开(公告)号:CN107977364B
公开(公告)日:2022-02-25
申请号:CN201711489210.1
申请日:2017-12-30
Applicant: 科大讯飞股份有限公司
IPC: G06F40/289 , G06F16/35
-
公开(公告)号:CN110634489B
公开(公告)日:2022-01-14
申请号:CN201810663588.7
申请日:2018-06-25
Applicant: 科大讯飞股份有限公司
Abstract: 本申请提供了一种声纹确认方法、装置、设备及可读存储介质,其中,方法包括:针对第一对象和第二对象中的每一目标对象,基于目标对象的语音生成带有注意力特征的特征矢量,作为目标对象的目标特征矢量,其中,注意力特征能够表征不同对象对确认结果的影响;基于第一对象的目标特征矢量和第二对象的目标特征矢量,确定第一对象和第二对象是否为同一对象。本申请提供的声纹确认方法、装置、设备及可读存储介质考虑了不同对象对确认结果的影响,引入了注意力机制,针对不同的对象生成了不同的带有注意力特征的特征矢量,通过该特征矢量进行判别,能够有效提高判别准确度。
-
-
-
-
-
-
-
-
-