-
公开(公告)号:CN107194754A
公开(公告)日:2017-09-22
申请号:CN201710233443.9
申请日:2017-04-11
申请人: 美林数据技术股份有限公司
CPC分类号: G06Q30/0631 , G06K9/6267
摘要: 本发明公开了基于混合协同过滤的券商产品推荐方法,包括:输入现有券商售卖中的金融产品信息以及若干用户购买相关金融产品记录及售后数据,并形成初始数据库;推广老产品时:提取初始数据库中若干用户购买相关金融产品记录,运用关联规则分析方法分析相关金融产品之间的关联关系;以及运用协同过滤算法计算相关金融产品之间的相似特征;将运用关联规则分析方法和协同过滤算法中得到的产品之间的关联性高和相似特征多的产品构成一个产品集合;对所述产品集合进行筛选后对用户进行推荐。
-
公开(公告)号:CN106383701A
公开(公告)日:2017-02-08
申请号:CN201610778484.1
申请日:2016-08-30
申请人: 西安美林数据技术股份有限公司
摘要: 本发明公开了基于通用多协议数据访问接口技术的数据服务系统,包括:语法校验模块,所述语法校验模块依次连接有解析引擎模块和执行引擎模块;还包括数据配置服务模块,所述数据配置服务模块接收执行引擎模块处理后的运行结果,并将相应结果反馈至用户。本发明通过上述结构构建出一种通用运行语言COMMON-SQL,为基于不同数据源的操作需求提供了一种中间交互语言,用户可通过同一数据服务来访问它,并将它转换为不同的数据源输出并使用。这些数据源可以是JDBC数据源、XML、JSON、webservice等。该语法为不同数据源访问提供了一种抽象能力,语法和标准SQL语言基本保持一致,无需学习多种数据源访问语言API。
-
公开(公告)号:CN106202700A
公开(公告)日:2016-12-07
申请号:CN201610532665.6
申请日:2016-07-07
申请人: 西安美林数据技术股份有限公司
摘要: 本发明公开了一种光伏发电出力预测的数据分析方法,具体包括获取某地区的发电出力历史数据与相应的影响因素数据;利用小波变换把历史出力曲线分解成一个历史主体出力曲线A3和三个历史细节出力曲线D1,D2,D3;对历史主体出力曲线A3和三个历史细节出力曲线D1,D2,D3利用PSO-RBF神经网络分别建立四个子预测模型;分别计算待测日的主体出力曲线 和三个细节出力曲线 对待测日的主体出力曲线和三个细节出力曲线利用小波重构得到待测日的出力曲线的预测值。本方法将小波变换和PSO-RBF神经网络结合在一起,对于光伏发电系统配合电力系统制定发电计划具有较高的使用价值。
-
公开(公告)号:CN105930353A
公开(公告)日:2016-09-07
申请号:CN201610216835.X
申请日:2016-04-08
申请人: 西安美林数据技术股份有限公司
CPC分类号: G06F16/285 , G06K9/6223 , G06Q10/06398
摘要: 本发明公开了一种海量数据下的呼叫中心客服工作人员特征细分方法,包括:获取预设量的工作人员;确定聚类指标,并确定呼叫中心每个工作人员与聚类指标对应的数据为该工作人员的聚类指标数据;根据每个工作人员的聚类指标数据利用并行K‑Means算法进行聚类,得到聚类结果;根据聚类结果将工作人员分成不同的类,得到分群结果。本申请公开的一种呼叫中心工作人员管理方法能够自动适应海量数据下的工作人员细分工作,准确度较高,避免了工作人员的依靠主观经验分类不符合工作人员的实际工作表现的情况发生。
-
公开(公告)号:CN109615555B
公开(公告)日:2023-05-05
申请号:CN201810859842.0
申请日:2018-08-01
申请人: 美林数据技术股份有限公司 , 国网陕西省电力公司 , 国网陕西省电力公司宝鸡供电公司
摘要: 本发明公开基于集成学习算法的用户异常用电行为识别方法及系统,其中识别方法包括步骤一、获取电网的所有电力数据;步骤二、将步骤一获得的电力数据进行筛选,剔除不符合数据协议格式要求的电力数据;步骤三、将步骤二合格的电力数据进行标注,标注方式包括区域,日期,消费额以及用户年龄;步骤四、构建学习模型,将上述标注的电力数据按照标注方式输入至学习模型中;步骤五、所述学习模型根据对应的学习算法定位出疑似异常用电用户。本发明根据电力数据中包含的区域,日期,消费额以及用户年龄等信息,利用学习算法,快速发现用电异常,准确率高,能有效帮助有关部门缩小排查范围,并为电力公司节约人力物力资源。
-
公开(公告)号:CN115827894A
公开(公告)日:2023-03-21
申请号:CN202211588194.2
申请日:2022-12-12
申请人: 美林数据技术股份有限公司
IPC分类号: G06F16/36 , G06F40/295 , G06F16/34
摘要: 本发明公开了一种基于知识图谱的可视化数据解释方法,包括以下步骤:抽取信息,得到结构化信息;利用结构化信息,结合知识图谱雏形构建方法以及知识图谱更新方法,构建通用型知识图谱;将通用型知识图谱与可视化系统连接,进而实时将新接入的数据的关系梳理并更新到所述通用型知识图谱中;用户利用可视化系统,发出解释数据的指令,进而通过通用型知识图谱找出对应的解释内容,并以可视化系统展示和进行更深层次的探索分析。本发明结合了两种方式的知识图谱构建方法,使得整个的数据实现方式更加灵活,进而构建的通用型知识图谱可以高效查询和存储,进行数据解释和分析的方法更加简单。
-
公开(公告)号:CN115809069A
公开(公告)日:2023-03-17
申请号:CN202211470269.7
申请日:2022-11-23
申请人: 美林数据技术股份有限公司
摘要: 本发明公开了一种Spark流水线模型的轻量化预测方法,包括:步骤一、基于Spark Transformer的算法模型开发,实现模型参数的配置、模型的训练、保存及预测功能,同时开发基于MLeap Bundle的模型算子序列化方法,以实现Spark模型的轻量化输出。步骤二,基于实现的各算法模型,构建Spark流水线模型,同时记录各算法模型间的依赖关系,进而调用各模型算子Bundle序列化方法,生成轻量化后的Spark流水线模型。步骤三、基于MLeap Runtime依据Bundle中各算法模型的依赖关系,加载轻量化后的Spark流水线模型,提供高性能的模型预测服务。从而实现Spark模型不依赖Spark框架,在不损失准确度的情况下,提供高性能、实时预测功能,同时降低了存储及计算资源的消耗,解决了Spark模型在实时预测场景下耗时长、吞吐量低的问题。
-
公开(公告)号:CN113947500A
公开(公告)日:2022-01-18
申请号:CN202111201407.7
申请日:2021-10-15
申请人: 美林数据技术股份有限公司
摘要: 本发明公开了一种基于设备拓扑与机器学习的多源网架台账融合方法,包括以下步骤:S101:接入各单系统的网架台账数据,所述网架台账数据包括但不限于实体及实体之间的关系;S102:将接入的各单系统网架台账数据按照所属组织机构进行分类;S103:对每一类实体,筛选出实体在各个系统中的共有属性;S104:根据步骤S103中共有属性值类型的不同,选择不同的相似度计算方法,计算最终的相似度;S105:将最终的相似度与设置的阈值比较,做出判断,两个实体能够融合或不能融合。本发明可以自动地对多系统中的网架台账数据进行自动融合,降低了人工比对的成本,可以有效地提升数据的贯通性,有助于数据管理与价值挖掘。
-
公开(公告)号:CN113920366A
公开(公告)日:2022-01-11
申请号:CN202111201242.3
申请日:2021-10-15
申请人: 美林数据技术股份有限公司
IPC分类号: G06V10/764 , G06N20/00
摘要: 本发明公开了一种基于机器学习的综合加权主数据识别方法,包括以下步骤:步骤1:梳理业务实体域并依据主数据的特点,选出主数据的最具代表性的特征,所述特征至少包括引用的出度及入度;步骤2:根据步骤1中获得的主数据提取出来的识别特征作为随机森林分类的特征,选取训练集,进行数据清洗,基于随机森林算法,选取最优参数构建决策树;步骤3:使用测试集,利用构建的多棵决策树进行测试,得到对应的分类类别;步骤4:采用综合加权法对决策树赋予不同的权重,采用投票法则得到最终分类结果。本发明可提升企业业务主数据查找的准确率及速率,有效提高企业主数据的管理效率。
-
公开(公告)号:CN109270372B
公开(公告)日:2021-04-30
申请号:CN201811071441.5
申请日:2018-09-14
申请人: 美林数据技术股份有限公司
摘要: 本发明公开一种基于线损和用户用电量变化关系的窃电识别系统及方法,系统包括:台区电力数据获取模块,收集所有台区的电力数据;筛选模块,结合所述台区电力数据获取模块的电力数据进行分析,以筛选并定位出线损超出正常值的潜在台区;用户电力数据获取模块,其收集所有用户的电力数据;用电量异动监测模块,根据所有用户的电力数据,并分析出同一用户的不同时间段的用电量变化,并筛选出用电量变化大的潜在用户;处理模块,将所述筛选模块筛选并定位出线损率超出正常值的台区,以及所述用电量异动监测模块筛选出用电量变化大的潜在客户进行整合,用于判别潜在用户是否疑似窃电用户,本发明能快速识别疑似窃电用户,为用电稽查工作提供依据。
-
-
-
-
-
-
-
-
-