-
公开(公告)号:CN119808706A
公开(公告)日:2025-04-11
申请号:CN202411910941.9
申请日:2024-12-24
Applicant: 福建亿榕信息技术有限公司 , 国网信息通信产业集团有限公司
IPC: G06F40/103 , G06F40/226 , G06F16/31 , G06F16/334 , G06N3/0455
Abstract: 本发明涉及人工智能技术领域,尤其涉及一种多格式数据智能结构化平台。本发明包括以下步骤步骤一:摄取本地存储数据,并进行源数据验证验证其格式有效性;步骤二:若数据格式有效,根据源数据验证表示结果,对表示数据进行数据预处理;步骤三:根据预处理表示结果,使用智能分块技术对文本进行分块处理,将分块后文本转换为向量;步骤四:根据文档向量化表示结果,输出数据至数据存储库并进行目标数据验证验证其格式有效性;步骤五:若数据格式有效,根据目标数据表示结果,传输存储至用户设定的数据存储库。本发明的目的在于提供一种多格式数据智能结构化平台,能够提供综合解决方案,以支持生成式人工智能应用的发展,并降低技术应用的门槛。