-
公开(公告)号:CN110569920B
公开(公告)日:2022-05-10
申请号:CN201910876897.7
申请日:2019-09-17
Applicant: 国家电网有限公司 , 国网山东省电力公司威海供电公司
Abstract: 一种多任务机器学习的预测方法,本发明涉及多任务机器学习的预测方法。本发明的目的是为了解决现有用户画像模型预测准确率低,特征提取负担大的问题。过程为:一、采集各信息源数据,对各信息源数据做预处理,得到预处理后的文本;二、采用预处理后的各信息源数据训练各信息源各自的学习模型,对各信息源分别进行特征提取,得到各信息源的特征;三、将各信息源的特征编码为矢量,融合多源数据,构建多任务学习框架;四、对各个子任务设置不同的全连接层和损失函数,得到各个子任务的预测结果;五、将四中各个子任务的预测结果进行加权投票,输出最终预测结果。本发明用于机器学习预测领域。
-
公开(公告)号:CN111680020A
公开(公告)日:2020-09-18
申请号:CN202010385043.1
申请日:2020-05-09
Applicant: 国网山东省电力公司威海供电公司 , 国家电网有限公司
IPC: G06F16/21 , G06F16/22 , G06F16/242 , G06F3/06 , G06Q50/06
Abstract: 本发明涉及数据处理技术领域,具体地说是一种特别适用于供电企业营销业务的应用于一体化缴费管理系统的数据库优化方法,通过使用数据库的压缩技术具有以下技术优势:(1)节省大量的磁盘:根据存储数据的不同,数据库压缩将大量节省磁盘空间;(2)更快的全表扫描、区间扫描:因为数据存储在更少的数据块中,全表扫描和索引区间扫描能够使用更少的快提取行;(3)减少网络负载:因为数据仅在数据库内压缩和解压缩,所以外部网络仅传输压缩的数据块。
-
公开(公告)号:CN110602105A
公开(公告)日:2019-12-20
申请号:CN201910876871.2
申请日:2019-09-17
Applicant: 国家电网有限公司 , 国网山东省电力公司威海供电公司
Abstract: 一种基于k-means的大规模并行化网络入侵检测方法,属于网络安全入侵检测技术领域。本发明是为了解决现有的入侵检测方法受孤立点、噪声点以及初始聚类中心影响较大的问题以及速度有待于提高的问题。本发明首先读取网络请求数据的流量特征进行预处理,采用Isolation Forest算法进行样本异常度系数计算,通过设定的异常度系数阈值进行样本过滤;然后将处理后的数据进行分片,利用中间值插值法生成对应维度上的初始聚类中心,之后利用spark-k-means进行局部聚类分析,将各聚类后所得的簇作为数据点进行再次集中聚类,利用投票法决定对应簇内的节点是否是异常请求。主要用于网络入侵检测。
-
-