-
公开(公告)号:CN108268600A
公开(公告)日:2018-07-10
申请号:CN201711387626.2
申请日:2017-12-20
Applicant: 北京邮电大学 , 博元森禾信息科技(北京)有限公司
IPC: G06F17/30
Abstract: 本发明公开了一种基于AI的非结构化数据管理方法及装置,其中,方法包括:通过HDFS、HBase和Nosql存储大规模的非结构化数据对象;从非结构化数据对象中通过AI智能算法提取数据特征,并且将提取的数据特征存储在外部表,并构建非结构化数据模型;使用SQL检索非结构化数据对象的特征表,实现对非结构化数据的管理,而对于模型用于对非结构化数据进行相似性搜索。该方法可以有效提高对非结构化数据的查询准确度及扩展性,实现非机构化数据核心的数据特征价值提取,使得非结构化数据得以很方便地识别,检索和使用,充分体现了增值业务的多样性和灵活性。
-
公开(公告)号:CN108268600B
公开(公告)日:2020-09-08
申请号:CN201711387626.2
申请日:2017-12-20
Applicant: 北京邮电大学 , 博元森禾信息科技(北京)有限公司
IPC: G06F16/332
Abstract: 本发明公开了一种基于AI的非结构化数据管理方法及装置,其中,方法包括:通过HDFS和Nosql存储大规模的非结构化数据对象;从非结构化数据对象中通过AI智能算法提取数据特征,并且将提取的数据特征存储在外部表,并构建非结构化数据模型;使用SQL检索非结构化数据对象的特征表,实现对非结构化数据的管理,而所述非结构化数据模型用于对非结构化数据进行相似性搜索。该方法可以有效提高对非结构化数据的查询准确度及扩展性,实现非结构化数据核心的数据特征价值提取,使得非结构化数据得以很方便地识别,检索和使用,充分体现了增值业务的多样性和灵活性。
-