-
公开(公告)号:CN115794405A
公开(公告)日:2023-03-14
申请号:CN202211595525.5
申请日:2022-12-13
Applicant: 重庆邮电大学
IPC: G06F9/50 , G06N3/006 , G06F18/214
Abstract: 本发明属于大数据流处理技术领域,具体涉及一种基于SSA‑XGboost算法的大数据处理框架的动态资源分配方法,包括:构建目标函数;获取Spark Streaming作业的成本模型的运行数据,并对运行数据进行清洗;采用优化后的XGboost算法对目标函数进行优化求解,得到Spark Streaming每一批次时间内所需的最佳资源大小;根据求得的最佳资源大小采用BFD算法进行Spark Streaming执行器的放置;本发明采用麻雀搜索算法SSA对XGboost算法的超参数进行选取高了算法的预测精度。