-
公开(公告)号:CN112417896B
公开(公告)日:2024-02-02
申请号:CN202011210710.9
申请日:2020-11-03
Applicant: 中国科学技术大学 , 科大讯飞股份有限公司
Abstract: 本申请提供了一种领域数据获取方法、机器翻译方法及相关设备,领域数据获取方法可确定出通用领域的训练语料集中训练语料对应的第一目标值,由于第一目标值能够表征对应的训练语料与指定领域的匹配程度,因此,基于通用领域的训练语料集中训练语料对应的第一目标值,能够从通用领域的训练语料集中筛选出指定领域的训练语料。在此基础上,本申请还提供了一种机器翻译方法,该方法可利用预先建立的领域翻译模型实现指定领域文本的翻译,由于领域翻译模型采用大量指定领域的训练语料对通用翻译模型进行微调得到,因此,其为能够适应于指定领域的翻译模型,利用该翻译模型对指定领域的文本进行翻译,能够获得比较准确的翻译结果。
-
公开(公告)号:CN112668345B
公开(公告)日:2024-06-04
申请号:CN202011552924.4
申请日:2020-12-24
Applicant: 中国科学技术大学 , 科大讯飞股份有限公司
IPC: G06F40/58 , G06F40/42 , G06F40/216 , G06F40/253 , G06N3/0442 , G06N3/08
Abstract: 本申请公开了一种语法缺陷数据识别模型构建方法和语法缺陷数据识别方法,该构建方法包括:在获取到第一训练源文本、第一标准翻译文本及其对应的第一实际识别结果、和第一语法缺陷翻译文本及其对应的第二实际识别结果后,将第一训练源文本、第一标准翻译文本和第一语法缺陷翻译文本输入第一模型,得到第一标准翻译文本对应的第一预测识别结果和第一语法缺陷翻译文本对应的第二预测识别结果;再根据第一预测识别结果、第二预测识别结果、第一实际识别结果和第二实际识别结果更新第一模型,并返回执行将第一训练源文本、第一标准翻译文本和第一语法缺陷翻译文本输入第一模型的步骤,直至在达到第一停止条件时根据第一模型构建语法缺陷数据识别模型。
-
公开(公告)号:CN112686059B
公开(公告)日:2024-04-16
申请号:CN202011593142.5
申请日:2020-12-29
Applicant: 中国科学技术大学 , 科大讯飞股份有限公司
Abstract: 本发明提供一种文本翻译方法、装置、电子设备和存储介质,其中方法包括:确定源语言文本,以及与源语言文本相匹配的翻译文本对;将源语言文本以及翻译文本对输入至机器翻译模型,得到机器翻译模型输出的目标语言文本;机器翻译模型是基于样本源语言文本、与样本源语言文本相匹配的样本翻译文本对,以及样本源语言文本的样本目标语言文本训练得到的。本发明提供的方法、装置、电子设备和存储介质,机器翻译模型能够将翻译文本对的信息作为对源语言文本进行翻译的参考,从而优化翻译效果。且无需重新对机器翻译模型进行迭代优化,且当实际场景发生变化时,仅需累积实际场景变化后的翻译文本对即可保证机器翻译及时满足场景变化需求。
-
公开(公告)号:CN112132628B
公开(公告)日:2024-07-09
申请号:CN202011044166.5
申请日:2020-09-28
Applicant: 中国科学技术大学 , 科大讯飞股份有限公司
IPC: G06Q30/0202 , G06Q30/0251 , G06Q30/0241 , G06F16/9535 , G06F40/35
Abstract: 本申请提供了一种用户意图预测方法、信息推荐方法及相关设备,其中,用户意图预测方法可以包括:获取目标用户的第一输入数据和第二输入数据,其中,第二输入数据为在第一输入数据之前输入的数据;基于第一输入数据,预测目标用户意图的目标;获取目标用户意图的目标所对应的需求标签集,其中,需求标签集中的每个标签为目标用户对其意图的目标的一种可能需求;基于第一输入数据、第二输入数据和需求标签集,预测目标用户对其意图的目标的需求,将预测出的目标和对该目标的需求作为目标用户的具体意图。本申请提供的用户意图预测方法可基于用户的输入数据预测出用户的具体意图。
-
公开(公告)号:CN112686060B
公开(公告)日:2024-04-30
申请号:CN202011593186.8
申请日:2020-12-29
Applicant: 中国科学技术大学 , 科大讯飞股份有限公司
Abstract: 本发明提供一种文本翻译方法、装置、电子设备和存储介质,其中方法包括:确定源语言文本及其所属领域;将源语言文本输入至所属领域对应的领域机器翻译模型中,得到领域机器翻译模型输出的目标语言文本;领域机器翻译模型是基于对应领域下的样本源语言文本及其样本目标语言文本训练得到的;领域机器翻译模型用于基于源语言文本在所属领域和通用场景下的文本特征,进行文本翻译。本发明提供的方法、装置、电子设备和存储介质,结合特定领域和通用场景下的文本特征进行机器翻译,在提升特定领域文本的翻译效果的同时,保障通用场景文本的翻译效果不下降,从而避免由于领域分类错误导致的文本翻译效果大幅下降的问题。
-
公开(公告)号:CN119295896B
公开(公告)日:2025-05-13
申请号:CN202411839808.9
申请日:2024-12-13
Applicant: 科大讯飞股份有限公司
IPC: G06V10/82 , G06N3/0495 , G06N3/0464 , G06N3/084 , G06N3/0985
Abstract: 本申请公开了一种计算机视觉处理方法、装置、设备和存储介质,该方法包括:处理设备获取图像数据;利用处理设备存储的目标模型对图像数据进行计算机视觉处理,得到计算机视觉处理结果;其中,目标模型是通过如下处理得到的:获取原始模型对应的量化精度;从原始模型中获取若干第一子结构,确定各第一子结构对应的均衡因子;分别基于各均衡因子对对应的第一子结构的模型参数进行调整,以得到待量化模型;均衡因子是用于调整模型参数的分布区间的参数;基于量化精度对待量化模型的模型参数进行目标量化处理,得到目标模型。上述方案,能够降低计算机视觉处理对硬件设备的要求。
-
公开(公告)号:CN119917608A
公开(公告)日:2025-05-02
申请号:CN202411763276.5
申请日:2024-12-03
Applicant: 科大讯飞股份有限公司
IPC: G06F16/3329 , G06F18/214 , G06F18/24
Abstract: 本申请公开了一种问答方法、问答模型训练方法及相关装置,该方法包括:获取目标问题;利用经训练的问答模型基于目标问题,给出目标答案;其中,问答模型基于第一样本问题的至少两个预测答案进行迭代训练,至少两个预测答案的得分不同;预测答案的得分由经训练的分类模型得到,分类模型基于第二样本问题的样本参考答案和第二样本问题的样本预测答案进行迭代训练。通过上述方式,本申请能够提高目标答案的准确度。
-
公开(公告)号:CN119862924A
公开(公告)日:2025-04-22
申请号:CN202510345570.2
申请日:2025-03-24
Applicant: 科大讯飞股份有限公司
IPC: G06N3/082 , G06N3/0495
Abstract: 本申请提出一种模型剪枝方法、装置、电子设备及程序产品,该方法包括:对预先训练好的目标模型内各网络层中的通道进行迭代稀疏处理,直至目标模型的模型精度与当前次迭代中目标模型对应的稀疏模型的模型精度的差值大于或等于预定阈值,以得到目标模型对应的目标稀疏模型,并基于目标稀疏模型内各网络层中的通道的稀疏处理结果,确定目标模型内各网络层中的待剪枝通道,并对各待剪枝通道进行物理剪枝,以移除目标模型内各网络层中的待剪枝通道,得到目标模型的剪枝模型。上述的模型剪枝方法能够在降低目标模型剪枝后的资源占用量的前提下,有效保证目标模型剪枝后的模型精度。
-
公开(公告)号:CN119474351A
公开(公告)日:2025-02-18
申请号:CN202411584829.0
申请日:2024-11-07
Applicant: 科大讯飞股份有限公司
IPC: G06F16/335 , G06F16/334 , G06F40/194 , G06F8/41
Abstract: 本申请公开了一种代码补全方法、装置、存储介质及设备,该方法包括:首先从待补全的目标代码文件中提取目标代码上下文,并从目标代码上下文中提取目标代码片段;然后提取目标代码片段的目标嵌入向量,并基于目标嵌入向量从预先构建的代码片段候选库中获取与目标代码片段相似的候选代码片段;接着利用目标代码上下文和候选代码片段构建prompt,输入至代码生成大语言模型,得到模型输出的代码补全后的目标代码文件。由于本申请是基于目标代码文件所在的IDE工程中包含的所有代码文件构建的代码片段候选库来检索与目标代码片段相似的候选代码片段,扩大了检索范围,从而提高了检索效率和准确率,进而有助于提高最终的代码补全效果。
-
公开(公告)号:CN114662501B
公开(公告)日:2025-01-07
申请号:CN202210307703.3
申请日:2022-03-25
Applicant: 科大讯飞股份有限公司
IPC: G06F40/30 , G06F40/216 , G06F16/35 , G06N3/045 , G06Q10/04 , G06N3/0442 , G06N3/047
Abstract: 本申请公开了一种试题讲解生成方法及相关装置、电子设备、存储介质,其中,试题讲解生成方法包括:获取待处理试题文本,且待处理试题文本包括题干文本和若干答案文本,再基于题干文本和若干答案文本进行预测,得到待处理试题文本所涉及的目标考察点和各目标考察点的重要度。在此基础上,基于目标考察点的重要度和讲解数据,生成待处理试题文本的讲解数据。上述方案,能够生成更为详细、针对性更强的讲解数据。
-
-
-
-
-
-
-
-
-