-
公开(公告)号:CN115170177A
公开(公告)日:2022-10-11
申请号:CN202210716718.5
申请日:2022-06-23
Applicant: 东南大学
Abstract: 本发明公开了一种基于SAS软件数据统计过程的电影票房预测方法。首先通过豆瓣、IMDB等电影评分网站收集电影的豆瓣评分、豆瓣评分人数、短评数量、影评数量、IMDB评分、IMDB评分人数和电影实际票房等数据,并基于此建立训练集和测试集。随后针对训练集数据基于SAS中的数据统计过程利用数据分析方法对数据进行分析,进一步,针对聚类分析且因子降维后的电影数据建立不同类别电影中票房与降维因子之间的回归方程模型。最后,对于不包含实际票房数据的测试集基于聚类分析结果进行Bayes判别,依据判别结果和所在类别的回归方程即可预测电影票房。本发明对于电影投资价值预估和电影院排片预测具有一定参考价值。