-
公开(公告)号:CN118733980A
公开(公告)日:2024-10-01
申请号:CN202410870363.4
申请日:2024-07-01
Applicant: 中国电器科学研究院股份有限公司
IPC: G06F18/15 , G06F18/2415 , G06F18/2411 , G06F18/22 , G06N3/0499 , G06N3/084
Abstract: 本发明提供了一种基于支持向量机的缺失数据补全的方法,包括将待进行数据补全的原始数据进行数据清洗;将完成数据清洗的原始数据模板化,作为原始数据集;将原始数据集中的数据作为训练样本,训练Word2Vec模型;通过训练好的Word2Vec模型,对原始数据集中的所有数据进行向量化,得到数据向量数据集;通过基于支持向量机的预测模型,预测生成原始数据集中的数据缺失项的向量值;在数据向量数据集中搜索得到与向量值相似的数据项,在原始数据集中生成与数据项匹配的缺失的数据值;缺失的数据值都补全完成时,将数据补全完成的原始数据集录入数据库。结合支持向量机和Word2Vec技术,进行清单缺失数据的补全,提高了数据补全的效率和准确性。