-
公开(公告)号:CN119398161A
公开(公告)日:2025-02-07
申请号:CN202410562170.2
申请日:2024-05-08
Applicant: 上海处理器技术创新中心
Abstract: 本申请公开了一种构建数据集的方法、设备和计算机可读存储介质,包括:获取原始数据集的推理路径;提取所述推理路径中的主路径和剩余路径;根据所述主路径和剩余路径进行数据生成,以获取增强数据;以及合并所有增强数据作为新的数据集。通过本申请的方案,可以自动构建数据集,增强构建数据集的鲁棒性,提高数据集的质量。
-
公开(公告)号:CN119398162A
公开(公告)日:2025-02-07
申请号:CN202410563556.5
申请日:2024-05-08
Applicant: 上海处理器技术创新中心
Abstract: 本申请公开了一种数据集构建方法、电子设备及存储介质。该方法包括:获取预设开源模型和多个待求解问题类型对应的多个原始数据集;基于多个原始数据集和预设开源模型确定多个原始数据集对应的多个初始监督数据集和多个原始数据集对应的多个问题词向量表示;分别对多个初始监督数据集进行清洗处理,得到多个中间监督数据集;基于多个问题词向量表示确定多个中间监督数据集中的多个待混合数据集;将多个待混合数据集进行合并,得到目标监督数据集。利用本申请提供的技术,能够形成高质量的监督数据来进行监督微调,提升问题求解模型的鲁棒性和泛化能力。
-
公开(公告)号:CN119398056A
公开(公告)日:2025-02-07
申请号:CN202311220587.2
申请日:2023-09-20
Applicant: 上海处理器技术创新中心 , 中国科学技术大学
Abstract: 本披露公开了一种用于自动求解数学题目的相关方法和装置。本披露的一些实施例通过将数学题目的自然语言分为两部分以先后用不同方式将其转换为形式化语言,可更简单且精确地为数学题目构建易于机器理解的表示。所述转换的形式化语言进而由本披露的一些实施例通过使用通用人工智能大模型来分析,可更轻松准确地理解题意,从而促进所述大模型对题目的自动求解。
-
-