一种多维度大语言模型能力框架搭建的方法及装置

    公开(公告)号:CN119918585A

    公开(公告)日:2025-05-02

    申请号:CN202510383331.6

    申请日:2025-03-28

    Abstract: 本发明提供一种多维度大语言模型能力框架搭建的方法及装置,涉及大语言模型技术领域。该方法包括:基于CHC理论模型的认知能力,定义大语言模型的认知维度能力;基于FLASK领域分类体系定义大语言模型的领域维度能力;定义大语言模型的任务维度能力;根据大语言模型的认知维度能力、领域维度能力以及任务维度能力,构建多维度大语言模型能力框架;获取能力标注训练集,采用GPT‑4o模型对训练集进行标注,获得标注后的数据集;根据标注后的数据集,对能力框架进行训练,获得训练好的多维度能力标注模型;获取待筛选的大语言模型的微调数据;将微调数据输入训练好的多维度能力标注模型中,获得高质量微调数据。采用本发明可获得高质量微调数据。

    基于示例感知的机器翻译大语言模型的翻译方法及装置

    公开(公告)号:CN118468899B

    公开(公告)日:2024-09-24

    申请号:CN202410933627.6

    申请日:2024-07-12

    Abstract: 本发明涉及机器翻译领域,特别是指一种基于示例感知的机器翻译大语言模型的翻译方法及装置,方法包括:构造句子级感知示例以及文档级感知示例;根据句子级感知示例、文档级感知示例构造的示例感知训练数据,根据训练数据以及低秩适应LoRA微调技术,得到训练好的机器翻译大语言模型;构造领域翻译示例以及文档级翻译示例;根据领域翻译示例以及文档级翻译示例,对训练好的机器翻译大语言模型进行优化,得到构建好的示例感知能力提升的机器翻译大语言模型,进而得到翻译结果。本发明不仅能够为特定领域翻译和文档级翻译等特定需求提供定制化解决方案,还能够在不牺牲翻译质量的前提下,显著提高翻译效率和性能。

    一种基于多语言预训练大模型的伪语言族聚类方法及装置

    公开(公告)号:CN117688176B

    公开(公告)日:2024-09-24

    申请号:CN202311653724.1

    申请日:2023-12-04

    Abstract: 本发明涉及文本机器翻译技术领域,特别是指一种基于多语言预训练大模型的伪语言族聚类方法及装置,方法包括:建立共享语言池;基于多语言预训练大模型,计算共享语言池中的语言对的费舍信息矩阵,获得共享语言池中的语言对的表征结果;根据表征结果对语言对之间的相似度进行计算,获得相似度值;根据相似度值,对语言对之间的相似性进行排序,根据预设边界值选择符合边界值的辅助语言对,完成基于多语言预训练大模型的伪语言族聚类。本发明使用多语言预训练本身的能力对语言对进行表征,更有效地选择并聚类辅助语言并提高其在不同模型和数据集之间的泛化性,最终提高低资源语言对在多语言协同训练下的翻译质量。

    一种对用于问答的大语言模型进行样本筛选的方法及装置

    公开(公告)号:CN117493890A

    公开(公告)日:2024-02-02

    申请号:CN202410007433.3

    申请日:2024-01-03

    Abstract: 本发明涉及文本处理技术领域,特别是指一种对用于问答的大语言模型进行样本筛选的方法及装置,方法包括:从样本数据集中筛选出特定样本,基于特定样本对待训练大语言模型进行训练,得到前置模型;基于样本数据集以及前置模型,得到样本数据集中的每个样本数据的多个不同评分,进而确定出每个样本数据的一致性分数以及自信度分数,进而确定每个样本数据的质量评估分数;基于质量评估分数,筛选出微调样本数据;基于微调样本数据,对待训练大语言模型进行训练,得到训练好的大语言模型;基于待回答的用户问题以及训练好的大语言模型,得到更加对齐人类偏好的问题回答。采用本发明,可以提升模型处理和预测的准确性,提高用户问题回答的准确性。

    一种中文翻译方法和装置

    公开(公告)号:CN115496079B

    公开(公告)日:2023-02-03

    申请号:CN202211463449.2

    申请日:2022-11-22

    Abstract: 本发明涉及自然语言的处理及转换技术领域,特别是指一种中文翻译方法,所述方法包括:S1、对训练集的中文源数据进行外语化笔画序列建模,得到所述中文源数据的外语化笔画序列;S2、对所述外语化笔画序列进行密文数据增强,得到密文;S3、对所述外语化笔画序列的数据集和所述密文的数据集,以及对应译文的数据集进行联合子词学习,并对文本进行切分,得到后续模型训练的最终数据集;S4、用所述最终数据集,对变换器Transformer模型进行多源一致性训练,得到中文神经机器翻译模型;S5、使用所述中文神经机器翻译模型,将待翻译语句翻译成目标语句。采用本发明,明显地提升了翻译效果并减少了模型参数量。

    一种针对大语音模型的指令感知训练方法及装置

    公开(公告)号:CN118038870B

    公开(公告)日:2024-06-11

    申请号:CN202410440333.X

    申请日:2024-04-12

    Abstract: 本发明涉及自然语言处理技术领域,特别是指一种针对大语音模型的指令感知训练方法及装置。针对大语音模型的指令感知训练方法包括:使用麦克风采集音频,获取目标原始数据以及指令音频;根据目标原始数据,获得目标文本数据以及目标音频数据;根据指令音频,获得第一指令文本;根据目标文本数据以及第一指令文本,通过文本大模型进行数据生成,获得指令感知文本数据;对第一指令文本进行差异化处理,获得第二指令文本;根据指令感知文本数据、目标音频数据和第二指令文本,对大语音模型进行优化训练,获得优化大语音模型。本发明是一种面向大语音模型的有效缓解指令跟随能力缺陷的大语音模型训练方法。

    一种对用于问答的大语言模型进行样本筛选的方法及装置

    公开(公告)号:CN117493890B

    公开(公告)日:2024-05-31

    申请号:CN202410007433.3

    申请日:2024-01-03

    Abstract: 本发明涉及文本处理技术领域,特别是指一种对用于问答的大语言模型进行样本筛选的方法及装置,方法包括:从样本数据集中筛选出特定样本,基于特定样本对待训练大语言模型进行训练,得到前置模型;基于样本数据集以及前置模型,得到样本数据集中的每个样本数据的多个不同评分,进而确定出每个样本数据的一致性分数以及自信度分数,进而确定每个样本数据的质量评估分数;基于质量评估分数,筛选出微调样本数据;基于微调样本数据,对待训练大语言模型进行训练,得到训练好的大语言模型;基于待回答的用户问题以及训练好的大语言模型,得到更加对齐人类偏好的问题回答。采用本发明,可以提升模型处理和预测的准确性,提高用户问题回答的准确性。

    一种中文翻译方法和装置

    公开(公告)号:CN115496079A

    公开(公告)日:2022-12-20

    申请号:CN202211463449.2

    申请日:2022-11-22

    Abstract: 本发明涉及自然语言的处理及转换技术领域,特别是指一种中文翻译方法,所述方法包括:S1、对训练集的中文源数据进行外语化笔画序列建模,得到所述中文源数据的外语化笔画序列;S2、对所述外语化笔画序列进行密文数据增强,得到密文;S3、对所述外语化笔画序列的数据集和所述密文的数据集,以及对应译文的数据集进行联合子词学习,并对文本进行切分,得到后续模型训练的最终数据集;S4、用所述最终数据集,对变换器Transformer模型进行多源一致性训练,得到中文神经机器翻译模型;S5、使用所述中文神经机器翻译模型,将待翻译语句翻译成目标语句。采用本发明,明显地提升了翻译效果并减少了模型参数量。

    一种针对大语音模型的指令感知训练方法及装置

    公开(公告)号:CN118038870A

    公开(公告)日:2024-05-14

    申请号:CN202410440333.X

    申请日:2024-04-12

    Abstract: 本发明涉及自然语言处理技术领域,特别是指一种针对大语音模型的指令感知训练方法及装置。针对大语音模型的指令感知训练方法包括:使用麦克风采集音频,获取目标原始数据以及指令音频;根据目标原始数据,获得目标文本数据以及目标音频数据;根据指令音频,获得第一指令文本;根据目标文本数据以及第一指令文本,通过文本大模型进行数据生成,获得指令感知文本数据;对第一指令文本进行差异化处理,获得第二指令文本;根据指令感知文本数据、目标音频数据和第二指令文本,对大语音模型进行优化训练,获得优化大语音模型。本发明是一种面向大语音模型的有效缓解指令跟随能力缺陷的大语音模型训练方法。

Patent Agency Ranking