-
公开(公告)号:CN107507038B
公开(公告)日:2021-03-19
申请号:CN201710780176.7
申请日:2017-09-01
Applicant: 美林数据技术股份有限公司
Abstract: 本发明公开了一种基于stacking和bagging算法的电费敏感用户分析方法,根据电费敏感的分类目标,基于电费敏感的原始数据表的几个核心业务指标,利用优区算法,解决非平衡和不相容问题,构建训练集和测试集。一方面,进一步细化基于电费敏感相关的核心业务结构化特征。另一方面,基于分词和词频统计的非结构化文本特征,利用stacking方法构建电费敏感的初级模型,为每个样本生成扩展的stacking特征。然后,将二者的特征进行合并作为整体输入。这样利用bagging和vote算法,在训练集和测试集上构建电费敏感的次级模型。利用训练好的模型,对验证集进行预测,并在实际业务中进行验证。从而,能提高了电力公司对用户的电费敏感度的掌握,有利于为电力客户提供差异化、针对性的优质供电服务。
-
公开(公告)号:CN107193876B
公开(公告)日:2020-10-09
申请号:CN201710267672.2
申请日:2017-04-21
Applicant: 美林数据技术股份有限公司
IPC: G06F16/215 , G06F16/23
Abstract: 本发明公开了一种基于最近邻KNN算法的缺失数据填补方法,包括:自动识别数据集中的存在缺失值的特征属性;遍历存在缺失值的特征属性利用近邻KNN算法逐步填充缺失值;在对每一个特征属性进行缺失值填充过程中,迭代KNN算法参数k,获得不同参数配置的KNN模型簇;根据优化目标函数遴选最优模型,并利用该模型对缺失数据进行缺失值填充。由于算法参数k对KNN算法影响较大,在此,我们采用寻优的策略运用到缺失值填充模型的建模中,可以很大程度提高模型的精度,填充数据的质量相应有了很大程度的提高。
-
公开(公告)号:CN110163381A
公开(公告)日:2019-08-23
申请号:CN201910343675.9
申请日:2019-04-26
Applicant: 美林数据技术股份有限公司
IPC: G06N20/20
Abstract: 本公开提供一种智能学习方法及装置,涉及信息技术领域,能够解决人工智能学习过程中,集成学习的数据自适应及集成方式不够灵活的问题。具体技术方案为:获取第一集成信息,第一集成信息用于指示一级算法内各个算法节点之间的逻辑关系;根据第一集成信息和至少一个基学习算法构建至少一个一级算法,一个一级算法包括至少一个基学习算法;获取第二集成信息,第二集成信息用于指示二级算法内各个算法节点之间的逻辑关系;根据至少一个一级算法构建二级算法,二级算法包括至少一个一级算法。本公开用于人工智能学习。
-
公开(公告)号:CN109933622A
公开(公告)日:2019-06-25
申请号:CN201910142861.6
申请日:2019-02-26
Applicant: 美林数据技术股份有限公司
IPC: G06F16/248 , G06F16/242 , G06F16/2455
Abstract: 本发明提供了一种数据可视化系统及实现方法,其中系统包括:可视化设计组件,被配置成用于生成可视化数据包,所述可视化数据包括目标数据与图形,所述目标数据与图形在系统后台建立映射关系,所述目标数据为系统经转化之后的数据;可视化界面,用于显示可视化设计组件的的数据包。本发明解决了以往过度依赖SQL运算的局面,能够适应较为复杂的数据计算逻辑。
-
公开(公告)号:CN109886623A
公开(公告)日:2019-06-14
申请号:CN201910089880.7
申请日:2019-01-30
Applicant: 美林数据技术股份有限公司
Abstract: 本公开提供一种产品数据的组包处理方法及装置,涉及数据处理领域,能够根据产品的物料范围实现对产品各个阶段数据的自动化组包,解决现有人工组包工作量大且易出错的问题。具体技术方案为:获取目标产品的物料范围;根据预先设置的配置信息和目标产品的物料范围,从至少一个数据列表中获取目标产品中每个待组包物料对应的数据信息;对目标产品的每个待组包物料对应的数据信息进行组包。本发明用于对产品数据的自动化组包。
-
公开(公告)号:CN109697238A
公开(公告)日:2019-04-30
申请号:CN201811599580.5
申请日:2018-12-26
Applicant: 美林数据技术股份有限公司
Abstract: 本公开提供一种数据处理方法及装置,涉及信息技术领域,能够直观地向用户展示图数据库中的数据。具体技术方案为:获取目标数据,所述目标数据包括图数据库所存储的K个节点,所述K个节点包括标签,K≥1;根据所述K个节点的标签,将所述K个节点划分为G个分组,G≥1;显示目标分组的节点,所述目标分组为所述G个分组中的任一分组。本公开用于数据处理。
-
公开(公告)号:CN106372152A
公开(公告)日:2017-02-01
申请号:CN201610767969.0
申请日:2016-08-30
Applicant: 西安美林数据技术股份有限公司
IPC: G06F17/30
CPC classification number: G06F16/958
Abstract: 本发明公开了一种在线表单开发系统,包括:由用户进行设定的自定义模块,所述自定义模块连接有数据库,所述自定义模块用于设定数据模型模块,业务模型模块以及视图模型模块的参数;与数据库连接的模型校验引擎模块,所述模型校验引擎模块用于将自定义模块设定的参数进行验证,筛选出符合规则的自定义模块;以及与所述模型校验引擎模块连接的视图模型模块,对应的数据模型模块,业务模型模块;所述视图模型模块通过视图渲染引擎模块进行数据展示,所述数据模型模块通过数据访问引擎模块连接数据库,所述业务模型模块通过业务逻辑引擎模块连接有数据访问引擎模块。此发明关键是基于领域模型语言技术,以在线的方式快速构建Web应用系统。
-
公开(公告)号:CN105243160A
公开(公告)日:2016-01-13
申请号:CN201510716380.3
申请日:2015-10-28
Applicant: 西安美林数据技术股份有限公司
IPC: G06F17/30
CPC classification number: G06F17/3005 , G06F17/30194
Abstract: 本发明公开了基于海量数据的分布式视频处理系统,包括:步骤一、视频的读取、分割、封装:首先从HDFS分布式文件系统中获取相应路径下的视频文件,然后对视频文件进行读取、分割,将分割后的视频片段数据封装为对象,以便对视频封进行传输;步骤二、视频分析算法封装:采用视频分析算法用来完成对视频片段数据的分析处理,且视频分析算法通过JNI接口和Hadoop平台进行交互;步骤三、结果整合及存储:采用Hadoop平台,在各节点调用封装的视频分析算法完成视频的分析处理,然后将视频片段数据整合成完整视频。解决了传统的集中式视频处理在存储能力和处理能力不足及不可扩展的问题,通过对Hadoop平台中MapReduce计算框架的数据结构及相关接口进行扩展,实现海量视频的分布式处理和分析。
-
公开(公告)号:CN104572849A
公开(公告)日:2015-04-29
申请号:CN201410777530.7
申请日:2014-12-17
Applicant: 西安美林数据技术股份有限公司
CPC classification number: G06F16/335 , G06F16/313 , G06F16/345
Abstract: 本发明涉及一种基于文本语义挖掘的标准化自动建档方法,其特征在于:从网上爬取文件,利用文本语义,对爬取的文件和本地文件进行信息抽取、关键词提取和自动摘要生成,最后存入信息化系统中。所述信息抽取,采用知识工程的方法建立规则集,自动将信息点从文档中抽取出来,形成结构化数据;所述关键词提取,主要是根据词语在文章的位置和语义,提取关键词,生成关键词索引;所述自动摘要,先设定摘要所要包含的内容,然后从文本中提取对应信息,计算句子间的相似度,抽取包含原文档中关键信息的文本。本发明之标准化自动建档方法,可以使业务人员免于阅读大量的文件,节省时间和人力,方便查询和使用。
-
公开(公告)号:CN116166686A
公开(公告)日:2023-05-26
申请号:CN202211570969.3
申请日:2022-12-08
Applicant: 美林数据技术股份有限公司
IPC: G06F16/242 , G06F16/2458 , G06F16/26
Abstract: 本发明公开了基于维度模型的指标计算引擎实现方法,包括以下步骤:构建多维模型表和维度表,形成数据来源;根据明细表,结合函数计算原子指标;使用原子指标,得到衍生指标;解析技术口径、维度以及运算公式生成动态SQL语句,得到衍生指标计算结果;基于衍生指标计算结果,解析引擎配置表中的技术口径,同时解析生成动态SQL语句,封装成对应程序模块并执行,得到复合指标计算结果;构建相同维度以及相同数据统计期的衍生指标和复合指标的汇总表;调度运行后生成指标表,在应用层中,显示汇总表,并通过人机交互,提供对外服务。本发明中,保证了指标统一归口管理,指标口径统一出去,指标统一运算和监控,从而有效支撑各应用报表用数需求。
-
-
-
-
-
-
-
-
-