-
公开(公告)号:CN119917965A
公开(公告)日:2025-05-02
申请号:CN202411795963.5
申请日:2024-12-09
Applicant: 复旦大学
IPC: G06F18/2433 , G06F18/10 , G06F18/214 , G06F40/30 , G06F18/22
Abstract: 本发明属于钢铁生产设备故障诊断技术领域,具体为一种基于大语言模型的钢铁生产设备故障诊断系统。本发明系统包括数据处理模块、大语言模型训练模块、检索增强生成模块;通过对领域数据的处理和模型训练,构建专用于钢铁生产设备的智能诊断平台;数据处理模块负责对采样数据进行特征提取并构建向量数据库,确保模型能够进行高效的语义匹配;训练模块对大语言模型进行领域适应性调整,提升其在特定领域的推理能力;检索增强生成模块通过集成向量数据库和生成式回答的方式,实现针对性强、精确度高的故障分析与技术指导;系统运行在本地或私有化服务器上进行,确保所有数据处理、模型计算和生成过程都在受控环境中完成,充分保护用户数据的隐私。
-
公开(公告)号:CN118626330A
公开(公告)日:2024-09-10
申请号:CN202410592483.2
申请日:2024-05-14
Applicant: 复旦大学
IPC: G06F11/30
Abstract: 本发明属于自然语言处理技术领域,具体为一种基于大语言模型的日志分析方法。本发明包括:使用网络爬虫技术从多个数据源自动收集日志问题相关的问答数据;使用ChatGPT扩充数据量;去除数据集中冗余的数据;将数据集分割为训练集和测试集;利用训练集对本地通用大语言模型进行微调;利用测试集对本地通用大语言模型进行评估;针对不同细分任务给出各自相对应的指标;利用待分析的新的日志数据进行评估,实现对新的日志数据的分析,得到分析结果与评估指标。本发明并简化了通用大语言模型应用到日志处理数据上的微调和部署过程,方便易用、准确性高,特别适用于需要处理大量日志数据的任务。
-