-
公开(公告)号:CN110189345A
公开(公告)日:2019-08-30
申请号:CN201910348725.2
申请日:2019-04-28
Applicant: 浙江大学
Abstract: 本发明公开了一种数据图中数据点坐标信息的提取方法,包括以下步骤:对数据图进行倾斜矫正和数据点区域提取;对每类数据图,对数据点区域进行数据点提取;按照预设的坐标属性和坐标阈值将每个数据点转化为数据点坐标信息。该提取方法能够自动准确地识别数据图中数据点坐标信息。
-
公开(公告)号:CN110222057A
公开(公告)日:2019-09-10
申请号:CN201910469969.6
申请日:2019-05-31
Applicant: 浙江大学
IPC: G06F16/22 , G06F16/2458 , G06F16/25 , G06F16/951
Abstract: 本发明公开了一种气溶胶文献格式化数据库的构建方法,包括:(1)收集全球气溶胶文献数据,确定气溶胶文献数据的文献相关属性、文本统计信息属性、数据图具体数值属性;(2)提取每个气溶胶文献的文献相关属性,形成文献相关属性数据表;(3)对每个气溶胶文献进行PDF到TXT文本格式转换、文本预处理以及正则模板匹配,形成文本统计数据表;(4)对数据图进行数据点坐标信息提取,形成数据图具体数值数据表;(5)建立文献相关属性数据表、文本统计数据表以及数据图具体数值数据表之间的索引关系,将对应的文献相关属性、文本统计信息以及数据图具体数值进行存储,形成气溶胶文献格式化数据库。此方法还包括提供众包平台和知识服务。
-