发明公开
摘要:
本发明公开了一种大规模硬盘故障预测领域中的数据预处理算法,包括时间序列维度缺失值填充、数据打标建模、数据增强,面对输入的缺失值占比非常庞大的硬盘故障数据,采用SDF算法对数据进行时间序列纬度上的缺失值填充,采用SMART‑GAN模型对少样本进行数据增强操作,当学习给定数据集的分布时,生成性对抗网络显示出强大的通用性。本发明涉及计算机技术领域,该大规模硬盘故障预测领域中的数据预处理算法,通过采用ROZ算法进行数据打标建模,使得ROZ算法可以很好地处理两个连续时间点之间的突变情况,从而有效地增加了模型的区分能力,SDF算法可以有效地处理带有时间序列属性的数据的异常值所带来的数值急剧变化,以及大面积缺失的情况。