-
公开(公告)号:CN119885118A
公开(公告)日:2025-04-25
申请号:CN202411753584.X
申请日:2024-12-02
Applicant: 科大讯飞股份有限公司
Abstract: 本申请提出一种水印添加方法、水印检测方法、水印处理装置以及计算机存储介质。所述水印添加方法包括:将用户交互内容与历史输出文字输入文本生成式大模型,获取原始文本概率分布;获取预设的概率转移矩阵;利用所述概率转移矩阵对所述原始文本概率分布进行修正,获取修正文本概率分布;将所述修正文本概率分布中的最大概率值对应的文字,作为添加水印后的当前输出文字。通过上述水印添加方法,避免使用哈希函数或者其他方式直接以单字设定红绿集合强硬划分破坏生成内容的准确性和可用性,利用概率转移矩阵对大模型的输出进行修正,以提高添加水印的准确性。
-
公开(公告)号:CN118098290A
公开(公告)日:2024-05-28
申请号:CN202410151287.1
申请日:2024-02-02
Applicant: 科大讯飞股份有限公司
Abstract: 本申请提出一种朗读评测方法、装置、设备、存储介质及计算机程序产品,该方法包括:获取朗读文本对应的目标音素序列;所述目标音素序列中对应多发音单词的目标音素位置具有多个音素;基于每个音素位置上所有音素的嵌入向量表示,生成所述目标音素序列的嵌入向量表示;对所述目标音素序列的嵌入向量表示和朗读语音的声学特征进行联合解码,确定标准朗读音素序列;基于所述标准朗读音素序列进行朗读评测。整个过程不再依赖于强制切分,避免了不良切分效果所造成的影响,提升了评测结果的稳定性。
-
公开(公告)号:CN118053448A
公开(公告)日:2024-05-17
申请号:CN202410174889.9
申请日:2024-02-07
Applicant: 科大讯飞股份有限公司
Abstract: 本发明提供一种口语评测方法、装置及系统,所述方法包括:确定待评测语音以及待评测语音对应的题目文本;对待评测语音进行语音识别,得到语音识别文本;基于题目文本对应的特征提取模型,提取语音识别文本的潜在评分特征;对语音识别文本的原始评分特征以及潜在评分特征进行融合,得到融合特征;将融合特征发送至服务端,以使服务端基于融合特征确定待评测语音的评测结果。本发明通过潜在评分特征对原始评分特征进行补充,避免传统方法中在人工制作答案无法覆盖所有正确答案情况下影响评测效果的问题。本发明减轻了服务端的运算压力,不仅可以提高服务端的评测响应速度,而且降低了服务端的硬件性能要求,节约了评测成本。
-
公开(公告)号:CN117935863A
公开(公告)日:2024-04-26
申请号:CN202311708186.1
申请日:2023-12-12
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种朗读评测方法和装置、电子设备、存储介质,该方法包括获取待评测文本的发音序列和朗读音频;其中,朗读音频是用户对待评测文本进行朗读得到;对朗读音频进行句子划分,得到各目标句子的句子朗读音频;基于各目标句子在发音序列中的句子发音序列对句子朗读音频进行评测,得到各目标句子的句子评测结果;基于各句子评测结果,得到朗读音频的目标评测结果。通过上述方式,本申请能够自动对待评测文本的朗读音频进行评测,提高评测效率和准确度。
-
公开(公告)号:CN117789756A
公开(公告)日:2024-03-29
申请号:CN202311810523.8
申请日:2023-12-25
Applicant: 科大讯飞股份有限公司
IPC: G10L25/18 , G10L25/03 , G10L25/30 , G06N3/0442
Abstract: 本发明提供一种特征提取方法、装置、电子设备和存储介质,其中方法包括:获取多帧流式数据的初始特征;逐帧对所述多帧流式数据的初始特征进行前向特征提取,得到多帧前向特征;对所述多帧流式数据的初始特征进行切分,得到多个分段帧,并对所述多个分段帧进行反向特征提取,得到多帧反向特征;将所述多帧前向特征和所述多帧反向特征进行拼接,并基于拼接后特征,确定所述多帧流式数据的目标特征。本发明提供的方法、装置、电子设备和存储介质,可以更加准确、高效地进行特征提取,提高特征的表达能力和鲁棒性。
-
公开(公告)号:CN119962541A
公开(公告)日:2025-05-09
申请号:CN202510437524.5
申请日:2025-04-09
Applicant: 科大讯飞股份有限公司
IPC: G06F40/30 , G06F40/284 , G06F40/242 , G06N5/04 , G06N3/0455
Abstract: 本发明提供一种水印添加方法、水印检测方法及水印添加模型训练方法,涉及计算机视觉技术领域,引入拆分模型,用于根据历史词元确定词元分类参数,使文本生成模型的不同次输出对应的词元字典中相同类别的词元的占比不同,可以适用于多种情况下的生成文本,避免强硬地设置固定占比破坏文本生成模型的生成内容的准确性和可用性,使水印添加效果稳定,进而保证了后续的水印检测效果。而且,还引入偏差模型,以根据历史词元确定词元字典中不同词元类别的概率偏差参数,进而使水印添加模块结合概率偏差参数和词元分类参数对第一词元概率分布进行更新,可以改变词元字典中不同词元类别的词元被选中的概率值,进一步提升后续的水印检测效果。
-
公开(公告)号:CN118194861A
公开(公告)日:2024-06-14
申请号:CN202410366308.1
申请日:2024-03-28
Applicant: 科大讯飞股份有限公司
IPC: G06F40/284 , G06F40/216
Abstract: 本申请公开了一种词序列语言模型优化方法、装置、设备及可读存储介质,先利用通用场景的语料训练得到通用词序列语言模型,以及利用特定领域场景的语料训练得到领域词序列语言模型,通过对对通用词序列语言模型和领域词序列语言模型进行融合,能够将通用词序列语言模型在通用场景的预测能力以及领域词序列语言模型在特定领域场景的预测能力组合起来,可以综合利用通用词序列语言模型和领域词序列语言模型各自的优势,在保证高频词的预测能力的同时,能够提升低频词的预测能力,从而改善语言模型在不同场景下的泛化能力,提升预测结果的准确性。
-
公开(公告)号:CN110797049B
公开(公告)日:2022-06-07
申请号:CN201910987884.7
申请日:2019-10-17
Applicant: 科大讯飞股份有限公司
IPC: G10L25/60
Abstract: 本申请实施例公开了一种语音评测方法及相关装置。其中,所述方法包括:获取用户朗读目标文本所得的目标语音,以及获取所述目标文本的基准语音;根据所述基准语音和预先设定的评分容忍度确定所述目标语音的评测得分,其中,所述目标语音中的至少一个语音单元的发音混淆事件的评分容忍度不为零,所述发音混淆事件是指一语音单元混淆为其他语音单元的事件;输出所述评测得分。可见,通过实施本申请提供的技术方案,有利于提高电子设备进行语音评测的灵活性和兼容性。
-
公开(公告)号:CN111105813A
公开(公告)日:2020-05-05
申请号:CN201911424069.6
申请日:2019-12-31
Applicant: 科大讯飞股份有限公司
Abstract: 本申请实施例公开了一种朗读评分方法、装置、设备及可读存储介质,根据待评测语音的语音特征和至少一个评分员的评分尺度特征,确定与每一个评分员对应的待评测语音的初始评分;根据各个评分员对应的待评测语音的初始评分,确定待评测语音的评分。本申请实施例提供朗读评分方法,除了考虑语音本身的语音特征外,还考虑了评分员的评分尺度对评分的影响,从而所确定的待评测语音的评分是与评分员的评分尺度相对应的评分,提高了待评测语音的评分的准确性。
-
公开(公告)号:CN119942858A
公开(公告)日:2025-05-06
申请号:CN202510029197.X
申请日:2025-01-08
Applicant: 科大讯飞股份有限公司
IPC: G09B7/02 , G06N3/0475 , G06N3/047 , G06N3/0455 , G06N3/088 , G06N20/00
Abstract: 本申请公开了一种口语评测方法、装置、相关设备及计算机程序产品,方法包括:获取考生的答题数据,答题数据包括问题、考生的答题音频及参考答案;识别答题音频对应的答题文本,结合答题文本和答题数据,通过配置的推理评分模型得到考生的推理评分;获取配置的定标模型,定标模型为基于定标考生的答题文本、定标考生的推理评分及专家评分预训练得到,定标考生为从参与本次口语考试的全部考生中抽取的部分考生;根据每一考生的答题文本及推理评分,利用定标模型进行评分,得到每一考生的最终评分。相比于现有技术单纯计算答题文本与参考答案间的相似度来确定评分的方式,本申请方案得到的口语评测结果更加准确。
-
-
-
-
-
-
-
-
-