-
公开(公告)号:CN112381143A
公开(公告)日:2021-02-19
申请号:CN202011272803.4
申请日:2020-11-13
Applicant: 长城计算机软件与系统有限公司
IPC: G06K9/62 , G06F40/289 , G06F16/215 , G06N20/00
Abstract: 本发明公开了一种基于机器学习的变量自动分类方法及系统,涉及信息处理技术领域。该方法包括:获取待处理的报表,提取报表的文本信息;从本文对象中提取文本信息,利用预设的分词算法将文本信息拆分成词语,从词语中提取变量特征词;从词性识别对象中提取变量特征词,将提取的变量特征词与变量词库中的变量进行比较,形成用于抽取特征词的分类规则;根据分类规则将变量特征词抽取到对应的变量块中。本发明提供的变量自动分类方法基于机器学习实现,适用于统计类报表的变量自动分类,实现了利用机器学习创建变量自动分类的方法,可以解决在数据统计过程中繁琐复杂的变量识别工作。
-
公开(公告)号:CN106547918A
公开(公告)日:2017-03-29
申请号:CN201611082227.0
申请日:2016-11-30
Applicant: 长城计算机软件与系统有限公司
IPC: G06F17/30
CPC classification number: G06F16/254
Abstract: 本发明涉及一种统计数据的整合方法及系统,该整合方法包括以下步骤:获取并整理元数据,按预设描述标准对元数据进行描述,得到描述信息;获取数据文件,将数据文件与描述信息进行关联,生成标准格式文件;解析标准格式文件,得到标准信息模型文件并保存。本发明的有益效果是:能够促进统计业务人员对数据进行标准化的描述,形成的描述信息又能够直接被各个计算机系统使用,从而大大提高统计数据整合的质量和效率。
-
公开(公告)号:CN106547918B
公开(公告)日:2020-06-09
申请号:CN201611082227.0
申请日:2016-11-30
Applicant: 长城计算机软件与系统有限公司
IPC: G06F16/25
Abstract: 本发明涉及一种统计数据的整合方法及系统,该整合方法包括以下步骤:获取并整理元数据,按预设描述标准对元数据进行描述,得到描述信息;获取数据文件,将数据文件与描述信息进行关联,生成标准格式文件;解析标准格式文件,得到标准信息模型文件并保存。本发明的有益效果是:能够促进统计业务人员对数据进行标准化的描述,形成的描述信息又能够直接被各个计算机系统使用,从而大大提高统计数据整合的质量和效率。
-
-