-
公开(公告)号:CN116450704A
公开(公告)日:2023-07-18
申请号:CN202310345532.8
申请日:2023-04-03
申请人: 国家电网有限公司大数据中心
IPC分类号: G06F16/2458 , G06F40/30 , G06F40/289 , G06F18/22 , G06N3/084 , G06N3/048 , G06N7/01 , G06N5/04 , G06Q10/0633 , G06Q10/0639
摘要: 本发明公开了一种流程模型的自动化生成方法及生成装置,方法包括如下步骤:步骤1、流程模块主体提取;步骤2、流程绩效预测;步骤3、流程模块组合;装置包括:流程模块主体提取单元、流程绩效预测单元、流程模块组合单元。本发明基于LDA主题模型,通过提取最优的流程模块功能主题,揭示模块功能主题与案例描述的语义信息关系,有效提升模块主题挖掘的准确性;并且在自动化程序的帮助下,以BP神经网络得到的流程绩效模型进行计算,基于流程绩效预测值对推荐的流程模块组合进行构建和调优,其流程推荐效率也有了很大的提高。
-
公开(公告)号:CN112307227A
公开(公告)日:2021-02-02
申请号:CN202011326744.4
申请日:2020-11-24
申请人: 国家电网有限公司大数据中心
摘要: 本发明公开了一种数据分类方法,包括:获取待分类的原始媒体数据,对原始媒体数据进行预处理得到各时刻的节点特征矩阵;根据各节点特征矩阵,计算各时刻的第一目标权重值;根据各节点特征矩阵以及第一目标权重值,计算各时刻的媒体特征向量,根据各时刻的媒体特征向量,对原始媒体数据进行分类。本发明实施例的技术方案可以减少对数据分类的耗时,提高数据的分类效率。
-
公开(公告)号:CN115904703A
公开(公告)日:2023-04-04
申请号:CN202211369437.3
申请日:2022-11-03
申请人: 国家电网有限公司大数据中心
IPC分类号: G06F9/50 , G06F18/23213 , G06N3/006
摘要: 本发明提供了一种日志数据挖掘方法及系统,包括:获取所需的日志文件的数据;采用MapReduce模型对数据进行数据处理操作获得属性数据;采用粒子群优化算法对属性数据进行寻优操作获得属性数据初始最优聚类中心;采用K‑means算法结合属性数据初始最优聚类中心对属性数据进行聚类操作获得最优聚类结果。本发明采用MapReduce模型进行数据处理操作的技术特征,提升大数据情况下数据准备的效率和准确率,并且采用粒子群优化算法确定聚类中心进而采用K‑means算法进行聚类操作的技术特征,消除了K‑means算法对初始聚类中心的依赖,提高了传统聚类算法初始聚类中心选取的准确性,提升了聚类算法用于日志数据挖掘结果的准确性和效率,极大提高日志数据挖掘的整体处理效率。
-
公开(公告)号:CN112307227B
公开(公告)日:2023-08-29
申请号:CN202011326744.4
申请日:2020-11-24
申请人: 国家电网有限公司大数据中心
IPC分类号: G06F16/45 , G06N3/0442 , G06N3/0464 , G06N3/08
摘要: 本发明公开了一种数据分类方法,包括:获取待分类的原始媒体数据,对原始媒体数据进行预处理得到各时刻的节点特征矩阵;根据各节点特征矩阵,计算各时刻的第一目标权重值;根据各节点特征矩阵以及第一目标权重值,计算各时刻的媒体特征向量,根据各时刻的媒体特征向量,对原始媒体数据进行分类。本发明实施例的技术方案可以减少对数据分类的耗时,提高数据的分类效率。
-
公开(公告)号:CN115688853A
公开(公告)日:2023-02-03
申请号:CN202211333392.4
申请日:2022-10-28
申请人: 国家电网有限公司大数据中心
摘要: 一种流程挖掘方法及系统,包括:获取所需的流程模型的事件日志信息;采用启发式算法计算所述事件日志信息的因果依赖关系启发式规则,获得各流程模型的因果矩阵;采用遗传算法对所有因果矩阵进行寻优操作,获得最佳因果矩阵;将所述最佳因果矩阵转化流程模型作为最佳流程模型。本发明采用启发式算法获得因果矩阵并采用遗传算法确定最佳因果矩阵的技术特征,缩短了搜索时间,增强了局部搜索能力,在流程挖掘问题上具有一定的优势,能够处理流程中不可见任务和非自由选择等特殊结构,提高了流程挖掘的效果。
-
公开(公告)号:CN114547231A
公开(公告)日:2022-05-27
申请号:CN202011328158.3
申请日:2020-11-24
申请人: 国家电网有限公司大数据中心
IPC分类号: G06F16/33 , G06F16/31 , G06F40/295 , G06F40/30 , G06F40/194 , G06F40/169
摘要: 本发明提供了一种数据溯源的方法和系统,包括:获取功能点清单、功能点操作后显示文本、功能点操作涉及的数据表调用记录以及所有数据表清单和数据表;基于功能点清单、功能点操作后的显示文本、功能点操作涉及的数据表调用记录以及所有数据表清单和数据表,采用多种匹配方法得到每个匹配方法下各数据表与功能点的关联系数;基于每个匹配方法下各数据表与功能点的关联系数,确定与功能点关联的数据表,本发明兼顾了功能点与各数据表在多个维度的数据匹配关系,可以准确度找到功能点和对应的数据表之间的关联关系,实现系统前端业务功能与后台数据库表的自动关联,提升数据资产管理效率、减少人工工作量、助力软件应用开发能力、简化后期维护代价。
-
公开(公告)号:CN112417220A
公开(公告)日:2021-02-26
申请号:CN202011313193.8
申请日:2020-11-20
IPC分类号: G06F16/901 , G06F16/903 , G06F16/906
摘要: 本发明公开了一种异构数据的整合方法,其技术方案包括:读取原始异构数据作为实体并进行预处理分类,随后将预处理分类后的数据进行概念关键词提取并将该关键词作为标签对实体进行一次分类,将进行一次分类后的实体进行结构类型分类,得到图像、文本以及音频三种类别的数据,然后提取每个数据的生成时间和生成位置并保存,随后建立模型提取实体的属性,并基于机器学习建立可以自主学习的关系分析模型对实体进行分析推理来得出实体的关系,然后以生成时间和生成位置对一次分类后的实体进行排序,并以实体为支点、关系为连接线、属性为引线内容,来建立可供人访问的图数据库。本发明可以高效处理异构数据,具有较强实用性。
-
-
-
-
-
-