-
公开(公告)号:CN112000725A
公开(公告)日:2020-11-27
申请号:CN202010886887.4
申请日:2020-08-28
Applicant: 哈尔滨工业大学
IPC: G06F16/25 , G06F16/28 , G06F16/903 , G06F16/36
Abstract: 本发明公开了一种面向多源异构资源的本体融合前处理方法,所述方法包括如下步骤:S1、提取本体模型中的实体概念;S2、提取本体模型中的关系概念;S3、提取本体模型中的属性概念;S4、导出JSON数据文件;S5、发现所要获取的数据存在的明显结构,用正则表达式表示上述两种结构;S6、返回满足正则表达式结构的内容在源数据的下标;S7、获取满足条件的子字符串;S8、对子字符串进一步做字符串匹配;S9、对每个源数据的标签进行融合;S10、存储数据,保存格式为结构化的格式。本发明能够根据本体建模的结果,将其转成JSON叙述,并给出面向异构(半)结构化数据的一致化融合的语法结构定义。
-
公开(公告)号:CN112000725B
公开(公告)日:2023-03-21
申请号:CN202010886887.4
申请日:2020-08-28
Applicant: 哈尔滨工业大学
IPC: G06F16/25 , G06F16/28 , G06F16/903 , G06F16/36
Abstract: 本发明公开了一种面向多源异构资源的本体融合前处理方法,所述方法包括如下步骤:S1、提取本体模型中的实体概念;S2、提取本体模型中的关系概念;S3、提取本体模型中的属性概念;S4、导出JSON数据文件;S5、发现所要获取的数据存在的明显结构,用正则表达式表示上述两种结构;S6、返回满足正则表达式结构的内容在源数据的下标;S7、获取满足条件的子字符串;S8、对子字符串进一步做字符串匹配;S9、对每个源数据的标签进行融合;S10、存储数据,保存格式为结构化的格式。本发明能够根据本体建模的结果,将其转成JSON叙述,并给出面向异构(半)结构化数据的一致化融合的语法结构定义。
-