关于免费电影论文范文在这里免费下载与阅读,为您的电影相关论文写作提供资料。
基于SPSS的电影聚类分析
龚晓 郭进利
摘 要:本文基于SPSS利用层次聚类方法对20部影片进行聚类分析,并提出建议.
关键词:SPSS;层次聚类;电影
近年来,随着人们生活水平的提高,娱乐消费在日常消费中所占比例越来越大,看电影也是人们主要的消费之一,同时也逐渐成为一种消费习惯.如今,电影院所放映的影片多种多样,各种电影宣传也如火如荼,上映几天便票房破亿的电影比比皆是,网络上有些电影网友点赞无数,但有些电影网友也吐槽无数.那么这些电影到底如何呢?本文就以2015年票房排行榜前20部在国内上映的影片为研究样本,利用层次聚类方法对其进行聚类分析.
一、数学模型及SPSS 简介
本课题研究所采用的聚类分析数学模型:
欧氏距离平方
其中,K表示每个样本有k个变量;xi 表示第一个样本在第i 个变量上的取值;yi 表示第二个样本在第i个变量上的取值.
SPSS 的基本功能包括数据管理、统计分析、图表分析等,几乎无所不包.它名为社会科学统计软件包,强调了其社会科学应用的一面,实际上在社会科学、自然科学的各个领域都能发挥巨大的作用,并已经应用于经济学、生物学、教育学、心理学、医学以及体育、工业、农业、林业、商业和金融等各个领域.
1. 用SPSS 对2015 年内地上映电影状况进行差异分析
用SPSS对2015年内地上映电影状况进行差异分析的步骤是:
第一步,建立2015 年内地上映电影excel样本文档(如表1).
第二步,启动并进入SPSS系统,将上述表中数据导入系统.
第三步,对数据进行标准化(如表2).
第四步,进入系统分析功能,在“分析”菜单“分类”中选择“系统聚类”.
第五步,在弹出的系统聚类分析对话框中,从对话框左侧的变量列表中选择“票房”“制作成本”“豆瓣评分”“百度搜索结果”“最高日微博热度”等变量,使之添加到右边的变量框中.
第六步,单击方法按钮,选择聚类方法为组之间的链接,即两类距离为两类元素两两之间平均平方距离.区间选为pearson相关性.
第七步,单击绘图按钮,选中谱系图,并选择纵向输出聚类全过程的冰柱图.第八步,单击statistics 按钮,选中合并进程表和近似值矩阵项,选中聚类成员中的单一方案,设置聚类数为3,显示将变量分成3类时各个变量的归属情况.
第九步,单击确定按钮,SPSS自动完成分析过程.
二、SPSS 分析结果及状况分析
1.SPSS 分析结果
(1)第一部分输出的是层次Q型聚类的分析结果(表3),从结果中可以看出20个样本都进入了聚类分析.
(2)输出SPSS 层次聚类分析各变量的距离矩阵(表4).从中可以看出各个变量之间的距离,并按“距离”的长短进行分类.
(3)凝聚状态表(表5).表格的第一列表示聚类分析的第几步;第二列、第三列表示聚类中哪两个样本或小类聚成一类;第四列是相应的样本距离或小类距离;第五列、第六列表示本步骤类中,参与聚类的是样本还是小类.0表示样本,数据n(非0)表示由第几步聚类产生的小类参与本步聚类;第七列表示本步骤类的结果将在下面聚类的第几步中用到.
(4)表6是变量层次聚类分析聚成3个类时变量的类归属情况.从表6中可以推出表7所示的分类,并逐一定义.
(5)由层次聚类分析的冰柱图,可以非常清楚地看到各变量按3类归属的情况.
(6)图1 为聚类分析的树形图,表明每一步中被合并的类及其系数值,把各类之间的距离转换成1~25的数值.
2.状况分析
根据以上分类来看,第二类以国外电影为主,此类电影制作成本普遍高于其他两类,其评分偏高,网络热度低于其他两类,可见其主要依靠自身的优良制作来吸引观众;第三类电影主要特征为低成本高口碑,评分及网络热度都较高,主要依靠电影内容来吸引观众;第一类电影以国产片为主,其既非小成本也非大制作,口碑褒贬不一,总体评分偏低,但普遍具有较高网络热度和票房,可见其网络宣传为影响其票房的主要因素,主要依靠好的网络宣传来吸引观众.
可以将第二类电影定义为优秀电影,第三类电影定义为成功电影,第一类电影定义为圈钱电影.第二类电影大部分在全球上映,其制作成本过高,如果仅仅依靠内地票房难以收回成本,因此国产电影目前并不能效仿国外大制作电影.第三类电影以内容取胜,既保证了较好的电影品质,又得到了高的票房,是以后国产电影效仿的范本.第一类电影中有部分电影也在试图向第二、三类电影靠近,但最后的效果并不尽如人意;另一部分电影内容空洞、制作水平低,沦为烂片.由分类结果可以看到,第一类电影为现今国产电影主流,第三类国产电影不可多得,第二类国产电影寥寥无几.从这些电影中我们既可以看到有人精心制作,有人诚心探索,也有人努力圈钱.希望评判一部电影的成功与否不只看其票房的高低,而应利用多元统计学方法对其各方面数据进行综合考量,分辨出哪些才是真正好的电影.
三、结论
本文利用层次聚类法,选取票房、制作成本、豆瓣评分、百度搜索结果和最高日微博热度作为指标,对2015年大陆上映的20部电影进行聚类分析,最后分出三类,该分类结果能够较准确地反映电影实际观众评价情况,该分类方法操作便捷、效果好,能适用于分析更多电影,具有较好实用性.同时从分类中可以得出,首先国产电影想要做好,应依据自身情况做好自我定位,资金足够可选择以第二类电影为标准,资金欠缺则可选择以第三类电影为目标;其次,电影好坏的评价标准并不只看票房或制作成本,观众通过本文聚类方法可以从众多电影中选出好的电影来观看,而不会被宣传噱头所蒙蔽.
参考文献
[1]罗家国,罗浩,仲佳嘉.基于SPSS的学生能力倾向聚类分析研究[J].高等工程教育研究,2012(06):101-104+135.
[2]韩胜娟.SPSS聚类分析中数据无量纲化方法比较[J].科技广场,2008(03):229-231.
[3]吕卫平,张晓梅.基于SPSS 的聚类分析应用[J].福建电脑,2013(09):20-23.
[4]王鑫,王洪国,张建喜,胡宝芳.聚类分析方法及工具应用研究[J].计算机科学,2006(02):197-200.
[5]张月霞,毛金龙.层次聚类分析法在水质监测点优化中的应用[J].环境科学导刊,2016(01):20-25.
[基金项目:国家自然科学基金(批准号:71571119)]
(作者单位:上海理工大学管理学院)
电影论文范文结:
关于本文可作为电影方面的大学硕士与本科毕业论文电影论文开题报告范文和职称论文论文写作参考文献下载。
1、看电影杂志订阅
2、世界电影杂志
3、看电影杂志
4、电影世界杂志
5、电影文学期刊
6、电影杂志