一种气溶胶文献格式化数据库的构建方法

    公开(公告)号:CN110222057A

    公开(公告)日:2019-09-10

    申请号:CN201910469969.6

    申请日:2019-05-31

    Applicant: 浙江大学

    Abstract: 本发明公开了一种气溶胶文献格式化数据库的构建方法,包括:(1)收集全球气溶胶文献数据,确定气溶胶文献数据的文献相关属性、文本统计信息属性、数据图具体数值属性;(2)提取每个气溶胶文献的文献相关属性,形成文献相关属性数据表;(3)对每个气溶胶文献进行PDF到TXT文本格式转换、文本预处理以及正则模板匹配,形成文本统计数据表;(4)对数据图进行数据点坐标信息提取,形成数据图具体数值数据表;(5)建立文献相关属性数据表、文本统计数据表以及数据图具体数值数据表之间的索引关系,将对应的文献相关属性、文本统计信息以及数据图具体数值进行存储,形成气溶胶文献格式化数据库。此方法还包括提供众包平台和知识服务。

Patent Agency Ranking