发明公开
- 专利标题: 数据提取方法、装置及系统
- 专利标题(英): Data extraction method, data extraction device and data extraction system
-
申请号: CN201611080168.3申请日: 2016-11-30
-
公开(公告)号: CN106776901A公开(公告)日: 2017-05-31
- 发明人: 蔡自彬 , 何金良 , 李娟
- 申请人: 北京知道创宇信息技术有限公司
- 申请人地址: 北京市海淀区蓝靛厂南路55号金威大厦803
- 专利权人: 北京知道创宇信息技术有限公司
- 当前专利权人: 北京知道创宇信息技术股份有限公司
- 当前专利权人地址: 北京市海淀区蓝靛厂南路55号金威大厦803
- 代理机构: 北京思睿峰知识产权代理有限公司
- 代理商 谢建云; 赵爱军
- 主分类号: G06F17/30
- IPC分类号: G06F17/30
摘要:
本发明公开了一种提取来自一个或者多个数据源的数据的方法,一个或者多个数据源中的每个数据源包括多条数据,每条数据包括一个或者多个具有键‑值对形式的数据项,该数据提取方法包括步骤:对于一个或者多个数据源中的每个数据源,确定每个键对应的数据类型,生成数据类型表;解析一条数据并提取出该条数据所包括的一个或者多个数据项,对于每个数据项:提取构成该数据项的键‑值对,根据该条数据的数据源从数据类型表中确定出所提取的键对应的数据类型;以及利用该数据类型对应的数据校验方法对所提取的键‑值对中的值进行校验,若校验通过则提取成功,记录提取的键‑值对中的值。本发明还公开了相应的数据提取装置和系统。
公开/授权文献
- CN106776901B 数据提取方法、装置及系统 公开/授权日:2019-12-06