-
公开(公告)号:CN120067325A
公开(公告)日:2025-05-30
申请号:CN202510544115.5
申请日:2025-04-28
Applicant: 福建亿榕信息技术有限公司
IPC: G06F16/35 , G06F16/34 , G06F18/2415
Abstract: 本发明涉及一种基于多模态数据分析技术的档案管理方法及系统,包括以下步骤:S1:收集与电力相关的档案数据,并采用自适应去噪技术,提高各类型文件的处理质量;S2:基于去噪处理后的电力相关的档案数据,使用tokenizer将文本转换为整数索引序列,使用padding将序列标准化为相同长度,并采用文本分类模型进行数据自动分类和标签生成;S3:基于分类后的文本数据,对技术文件和报告,采用序列到序列生成模型自动化生成摘要;S4:根据用户行为分析制定个性化的档案归档策略,以满足不同部门或需要的特定要求。本发明不仅改善了数据的可访问性和可用性,还有效提高档案管理质量和效率。