数据集构建方法、电子设备及存储介质

    公开(公告)号:CN119398162A

    公开(公告)日:2025-02-07

    申请号:CN202410563556.5

    申请日:2024-05-08

    Abstract: 本申请公开了一种数据集构建方法、电子设备及存储介质。该方法包括:获取预设开源模型和多个待求解问题类型对应的多个原始数据集;基于多个原始数据集和预设开源模型确定多个原始数据集对应的多个初始监督数据集和多个原始数据集对应的多个问题词向量表示;分别对多个初始监督数据集进行清洗处理,得到多个中间监督数据集;基于多个问题词向量表示确定多个中间监督数据集中的多个待混合数据集;将多个待混合数据集进行合并,得到目标监督数据集。利用本申请提供的技术,能够形成高质量的监督数据来进行监督微调,提升问题求解模型的鲁棒性和泛化能力。

    用于自动求解数学题目的相关方法和装置

    公开(公告)号:CN119398056A

    公开(公告)日:2025-02-07

    申请号:CN202311220587.2

    申请日:2023-09-20

    Inventor: 陈叶增 周熠 董翔

    Abstract: 本披露公开了一种用于自动求解数学题目的相关方法和装置。本披露的一些实施例通过将数学题目的自然语言分为两部分以先后用不同方式将其转换为形式化语言,可更简单且精确地为数学题目构建易于机器理解的表示。所述转换的形式化语言进而由本披露的一些实施例通过使用通用人工智能大模型来分析,可更轻松准确地理解题意,从而促进所述大模型对题目的自动求解。

Patent Agency Ranking