一种重复数据自动提取方法及系统
摘要:
本发明公开了一种重复数据自动提取方法及系统,系统服务器通过Http协议向多个应用服务器发送Http服务请求,应用服务器接收到请求报文后进行逻辑处理,返回xml格式的系统网页源文件;系统服务器从源文件中取出包含数据的xml格式的数据包,系统服务器根据业务需求截取出有用的xml格式的源码文件,系统服务器对xml格式的文件进行解析封装;系统服务器将从各个应用服务器解析出来的数据,根据已设计好的数据结构进行存储;系统服务器利用数据库技术对重复的数据进行去重。本发明能够实现对多个系统间重复数据的提取,用于发现系统信息间数据重复的问题,同时可以基于此进行分析、发现数据流转和业务工作重复问题等。
0/0