-
公开(公告)号:CN119337109A
公开(公告)日:2025-01-21
申请号:CN202411227489.6
申请日:2024-09-03
Applicant: 科大讯飞股份有限公司
Abstract: 本申请提供了一种模型优化方法、数据处理方法、装置、设备及程序产品,该模型优化方法包括:在获取到任务模型对第一任务数据进行处理得到的第i处理结果时,将所述第一任务数据和所述第i处理结果输入用于对所述任务模型的处理结果进行评价的评价模型,得到对应所述第i处理结果的第i评价结果;所述第一任务数据包括文本数据、图像数据、语音数据中的至少一种,所述任务模型用于执行文本处理任务、图像处理任务、语音处理任务中的至少一种任务;在基于所述第i评价结果确定需要对所述第i处理结果进行优化时,将所述第i评价结果输入所述任务模型,以使所述任务模型基于所述第i评价结果,对所述第一任务数据进行处理得到第i+1处理结果。
-
公开(公告)号:CN106157953B
公开(公告)日:2020-02-07
申请号:CN201510181631.2
申请日:2015-04-16
Applicant: 科大讯飞股份有限公司 , 中国科学技术大学
Abstract: 本发明公开了一种连续语音识别方法及系统,该方法包括:预先训练语音去噪与声学分类相融合的神经网络;接收待识别的连续语音信号;提取所述语音信号的声学特征;根据所述声学特征和所述神经网络得到语音建模单元的后验概率;对所述语音信号连续语音段的所有帧语音的建模单元后验概率进行维特比解码,得到语音识别结果。利用本发明,可以提高连续语音识别结果的正确率。
-
公开(公告)号:CN119990313A
公开(公告)日:2025-05-13
申请号:CN202510056782.9
申请日:2025-01-14
Applicant: 科大讯飞股份有限公司
Abstract: 本申请涉及数据处理技术领域,具体涉及一种题目解答方法、装置、设备及程序产品。方法包括:将目标题目输入答题模型,获得答题模型输出的初始答复,其中,初始答复包括至少一个答题步骤;将目标题目和初始答复输入评语模型,获得评语模型输出的评语,其中,评语包括对初始答复中各个答题步骤的评价信息;基于评语对初始答复进行修正,获得目标题目对应的目标答复,其中,答题模型为大语言模型基于至少一对第一问答对进行训练后得到的,第一问答对中的第一答案包括基于评语模型输出的第一评语进行修正后得到的答案。本申请能够通过评语,实现在答题步骤的层面对模型输出的答案进行修正,获得正确度更高的题目答案。
-
公开(公告)号:CN118520085A
公开(公告)日:2024-08-20
申请号:CN202410648333.9
申请日:2024-05-23
Applicant: 科大讯飞股份有限公司
IPC: G06F16/332 , G06F16/33 , G06F16/338
Abstract: 本申请实施例公开了一种题目解答方法、装置、设备、存储介质及程序产品,在获得目标题目后,基于生成式模型对目标题目进行处理,以获得目标题目的解题结果;解题结果以自然语言表述目标题目的解题步骤;其中,在解题结果中包括算术表达式及其计算结果的情况下,计算结果通过调用计算器计算得到,解题结果中除计算结果外的内容由生成式模型生成,由于算术表达式的计算结果不再由生成式模型生成,而是由计算器计算得到,从而提高解答目标题目过程中的计算能力,进一步保证了解答目标题目过程中的逻辑推理能力的提高。
-
公开(公告)号:CN119990314A
公开(公告)日:2025-05-13
申请号:CN202510056814.5
申请日:2025-01-14
Applicant: 科大讯飞股份有限公司
Abstract: 本申请提供一种题目解答方法、装置、设备、介质及程序产品,该题目解答方法包括:基于决策树的根节点选择下一个子节点,直至到达一个叶子节点;决策树的节点包括由待解答题目的至少一个解答步骤组成的解答内容;在叶子节点不是终端节点的情况下,扩展叶子节点的各个子节点;确定叶子节点的各个子节点各自对应的特征,并基于各个特征,删除叶子节点的部分子节点,获得叶子节点的被保留子节点;基于叶子节点的被保留子节点,进行模拟和回溯,确定根节点的目标子节点,将目标子节点确定为决策树的根节点,返回执行基于决策树的根节点选择下一个子节点的步骤,直至生成待解答题目的完整解答内容。本申请能够提升多步骤题目解答的效率和准确率。
-
公开(公告)号:CN106157953A
公开(公告)日:2016-11-23
申请号:CN201510181631.2
申请日:2015-04-16
Applicant: 科大讯飞股份有限公司 , 中国科学技术大学
Abstract: 本发明公开了一种连续语音识别方法及系统,该方法包括:预先训练语音去噪与声学分类相融合的神经网络;接收待识别的连续语音信号;提取所述语音信号的声学特征;根据所述声学特征和所述神经网络得到语音建模单元的后验概率;对所述语音信号连续语音段的所有帧语音的建模单元后验概率进行维特比解码,得到语音识别结果。利用本发明,可以提高连续语音识别结果的正确率。
-
公开(公告)号:CN117690144A
公开(公告)日:2024-03-12
申请号:CN202311580044.1
申请日:2023-11-21
Applicant: 科大讯飞股份有限公司
Abstract: 本申请公开了一种文本问答方法、视觉语言模型的训练方法及其相关装置,该方法包括:获取目标文本图像以及关于目标文本图像的目标问题;利用视觉语言模型中的视觉编码器对目标文本图像进行视觉编码,得到第一目标特征;以及,利用视觉语言模型中的文本编码网络对目标文本图像进行文本编码,得到第二目标特征;利用视觉语言模型基于第一目标特征、第二目标特征和目标问题,得到目标问题的目标答案。通过上述方式,本申请能够提高问答准确率。
-
-
-
-
-
-