基于机器学习的变量自动分类方法及系统

    公开(公告)号:CN112381143A

    公开(公告)日:2021-02-19

    申请号:CN202011272803.4

    申请日:2020-11-13

    Abstract: 本发明公开了一种基于机器学习的变量自动分类方法及系统,涉及信息处理技术领域。该方法包括:获取待处理的报表,提取报表的文本信息;从本文对象中提取文本信息,利用预设的分词算法将文本信息拆分成词语,从词语中提取变量特征词;从词性识别对象中提取变量特征词,将提取的变量特征词与变量词库中的变量进行比较,形成用于抽取特征词的分类规则;根据分类规则将变量特征词抽取到对应的变量块中。本发明提供的变量自动分类方法基于机器学习实现,适用于统计类报表的变量自动分类,实现了利用机器学习创建变量自动分类的方法,可以解决在数据统计过程中繁琐复杂的变量识别工作。

    一种统计数据的整合方法及系统

    公开(公告)号:CN106547918B

    公开(公告)日:2020-06-09

    申请号:CN201611082227.0

    申请日:2016-11-30

    Abstract: 本发明涉及一种统计数据的整合方法及系统,该整合方法包括以下步骤:获取并整理元数据,按预设描述标准对元数据进行描述,得到描述信息;获取数据文件,将数据文件与描述信息进行关联,生成标准格式文件;解析标准格式文件,得到标准信息模型文件并保存。本发明的有益效果是:能够促进统计业务人员对数据进行标准化的描述,形成的描述信息又能够直接被各个计算机系统使用,从而大大提高统计数据整合的质量和效率。

Patent Agency Ranking