-
公开(公告)号:CN119885118A
公开(公告)日:2025-04-25
申请号:CN202411753584.X
申请日:2024-12-02
Applicant: 科大讯飞股份有限公司
Abstract: 本申请提出一种水印添加方法、水印检测方法、水印处理装置以及计算机存储介质。所述水印添加方法包括:将用户交互内容与历史输出文字输入文本生成式大模型,获取原始文本概率分布;获取预设的概率转移矩阵;利用所述概率转移矩阵对所述原始文本概率分布进行修正,获取修正文本概率分布;将所述修正文本概率分布中的最大概率值对应的文字,作为添加水印后的当前输出文字。通过上述水印添加方法,避免使用哈希函数或者其他方式直接以单字设定红绿集合强硬划分破坏生成内容的准确性和可用性,利用概率转移矩阵对大模型的输出进行修正,以提高添加水印的准确性。
-
公开(公告)号:CN117935863A
公开(公告)日:2024-04-26
申请号:CN202311708186.1
申请日:2023-12-12
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种朗读评测方法和装置、电子设备、存储介质,该方法包括获取待评测文本的发音序列和朗读音频;其中,朗读音频是用户对待评测文本进行朗读得到;对朗读音频进行句子划分,得到各目标句子的句子朗读音频;基于各目标句子在发音序列中的句子发音序列对句子朗读音频进行评测,得到各目标句子的句子评测结果;基于各句子评测结果,得到朗读音频的目标评测结果。通过上述方式,本申请能够自动对待评测文本的朗读音频进行评测,提高评测效率和准确度。
-
公开(公告)号:CN117789756A
公开(公告)日:2024-03-29
申请号:CN202311810523.8
申请日:2023-12-25
Applicant: 科大讯飞股份有限公司
IPC: G10L25/18 , G10L25/03 , G10L25/30 , G06N3/0442
Abstract: 本发明提供一种特征提取方法、装置、电子设备和存储介质,其中方法包括:获取多帧流式数据的初始特征;逐帧对所述多帧流式数据的初始特征进行前向特征提取,得到多帧前向特征;对所述多帧流式数据的初始特征进行切分,得到多个分段帧,并对所述多个分段帧进行反向特征提取,得到多帧反向特征;将所述多帧前向特征和所述多帧反向特征进行拼接,并基于拼接后特征,确定所述多帧流式数据的目标特征。本发明提供的方法、装置、电子设备和存储介质,可以更加准确、高效地进行特征提取,提高特征的表达能力和鲁棒性。
-
公开(公告)号:CN119942858A
公开(公告)日:2025-05-06
申请号:CN202510029197.X
申请日:2025-01-08
Applicant: 科大讯飞股份有限公司
IPC: G09B7/02 , G06N3/0475 , G06N3/047 , G06N3/0455 , G06N3/088 , G06N20/00
Abstract: 本申请公开了一种口语评测方法、装置、相关设备及计算机程序产品,方法包括:获取考生的答题数据,答题数据包括问题、考生的答题音频及参考答案;识别答题音频对应的答题文本,结合答题文本和答题数据,通过配置的推理评分模型得到考生的推理评分;获取配置的定标模型,定标模型为基于定标考生的答题文本、定标考生的推理评分及专家评分预训练得到,定标考生为从参与本次口语考试的全部考生中抽取的部分考生;根据每一考生的答题文本及推理评分,利用定标模型进行评分,得到每一考生的最终评分。相比于现有技术单纯计算答题文本与参考答案间的相似度来确定评分的方式,本申请方案得到的口语评测结果更加准确。
-
公开(公告)号:CN118335120A
公开(公告)日:2024-07-12
申请号:CN202410256289.7
申请日:2024-03-06
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种语言评测方法及相关装置、设备和存储介质,其中,语言评测方法包括:获取目标对象朗读目标文本的音频信息,作为待测音频;获取目标文本的第一发音序列,以及获取待测音频中顺序排列的各个语音段的第二发音序列;基于第一发音序列与语音段的第二发音序列之间的匹配结果,确定语音段对应于目标文本中的位置信息;基于各个语音段和语音段对应于目标文本中的位置信息,得到待测音频的评测结果。上述方案,能够提升语言评测的准确性。
-
公开(公告)号:CN117995219A
公开(公告)日:2024-05-07
申请号:CN202410141340.X
申请日:2024-01-31
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种音质检测方法及相关装置、设备和存储介质,其中,音质检测方法包括:基于待测音频中的语音段,提取得到目标频谱图;基于目标频谱图,生成代表语音段的第一音频特征;基于第一音频特征中各个元素位置的重要度,编码得到第二音频特征;其中,元素位置的重要度表征元素位置的特征元素相对于各个元素位置的特征元素而言对于音质检测的重要程度;基于第二音频特征进行分类预测,得到表征待测音频质量情况的分类结果。上述方案,能够提升音质检测的准确性和鲁棒性。
-
公开(公告)号:CN117670600A
公开(公告)日:2024-03-08
申请号:CN202311792950.8
申请日:2023-12-22
Applicant: 科大讯飞股份有限公司
IPC: G06Q50/18 , G06F16/34 , G06F16/335
Abstract: 本发明提供一种判决辅助方法、装置、电子设备和存储介质,其中方法包括:获取待判决的案情文本;确定与所述案情文本的文本内容相关联的参考法条;基于所述案情文本,以及所述参考法条,确定所述案情文本的辅助判决结果。本发明提供的方法、装置、电子设备和存储介质,通过确定与案情文本的文本内容相关联的参考法条,基于案情文本,以及参考法条,确定案情文本的辅助判决结果,在辅助判决过程中引入了专业且相关联的法律知识,提升了辅助判决结果的准确性、可靠性和充实性,进而使得司法智能化在司法领域的应用更加广泛和可靠。
-
公开(公告)号:CN119962541A
公开(公告)日:2025-05-09
申请号:CN202510437524.5
申请日:2025-04-09
Applicant: 科大讯飞股份有限公司
IPC: G06F40/30 , G06F40/284 , G06F40/242 , G06N5/04 , G06N3/0455
Abstract: 本发明提供一种水印添加方法、水印检测方法及水印添加模型训练方法,涉及计算机视觉技术领域,引入拆分模型,用于根据历史词元确定词元分类参数,使文本生成模型的不同次输出对应的词元字典中相同类别的词元的占比不同,可以适用于多种情况下的生成文本,避免强硬地设置固定占比破坏文本生成模型的生成内容的准确性和可用性,使水印添加效果稳定,进而保证了后续的水印检测效果。而且,还引入偏差模型,以根据历史词元确定词元字典中不同词元类别的概率偏差参数,进而使水印添加模块结合概率偏差参数和词元分类参数对第一词元概率分布进行更新,可以改变词元字典中不同词元类别的词元被选中的概率值,进一步提升后续的水印检测效果。
-
公开(公告)号:CN117995196A
公开(公告)日:2024-05-07
申请号:CN202410033784.1
申请日:2024-01-09
Applicant: 科大讯飞股份有限公司
Abstract: 本发明提供一种文本位置匹配方法、装置、电子设备和存储介质,其中方法包括:获取待匹配文本的音频,对音频中当前时段的音频段进行发音识别,得到当前时段的识别发音;将当前时段的识别发音与发音图网络中的各节点进行匹配,得到识别发音在待匹配文本中所处位置的匹配结果,发音图网络中的各节点基于待匹配文本中各文字的发音构建;基于发音图网络,对历史匹配结果进行回溯和修正,得到文本位置匹配结果,历史匹配结果包括当前时段的匹配结果和当前时段之前时段的匹配结果。本发明提供的方法、装置、电子设备和存储介质,可以支持文本位置在线实时匹配,并支持匹配结果动态修正,从而提高文本位置匹配的准确性和稳定性。
-
-
-
-
-
-
-
-