用Python爬取暑期档大火的《哪吒》,20W+评论数据,我们分析一波

发布时间:2020-08-09 00:03:03 作者:千锋Python唐小强
来源:ITPUB博客 阅读:186

说起这个暑期档的动画片,非《哪吒之魔童降世》莫属了!

上映第 1 天:89分钟,中国动画最快破 1亿纪录

上映第 2 天:中国影史首部单日票房破 2亿的动画电影

上映第 4 天:中国影史第66部破 10亿影片

上映第 8 天:正式登顶!破 16亿,超过《疯狂动物城》,创中国影史动画电影票房新纪录

上映第 9 天:成为中国影史第 17 部破 20亿 影片

上映第 10 天:破 23亿!连续10天单日票房过亿,连续10天获得单日票房冠军

而,最令人振奋的是,猫眼给出的最终票房预测已经飙到 44.87亿!

不仅仅是票房,《哪吒》在豆瓣上的评分也到了 8.6 分以上(《大圣归来》的豆瓣评分是 8.3 分),众多影迷观看后给出的评价也非常直观,就是好看二字。

那么,这部动画,到底大家对其评价如何?

大量票房背后的数据里又隐藏了哪些东西?

本文抓取了猫眼 20W+ 的短评,并进行了简单的数据分析,带大家一起看下,观众的真实想法。

一、电影总体评价如何?

用Python爬取暑期档大火的《哪吒》,20W+评论数据,我们分析一波

猫眼电影的评分为 0-10 分,从上图可以看到,有 97.3% 的观众给出了 8 分以上的高分,给出满分 10 分的更是达到了 85%。

只有极小一部分观众(1%)打了 4 分以下的低分。

总体来说,观众还是很喜欢这部电影的,票房好的同时,口碑也好,名利双收!

二、总体评价的时间走向如何?

下面来分析一下自首映以来的每天的评分变化趋势。

用Python爬取暑期档大火的《哪吒》,20W+评论数据,我们分析一波

从图中可以看出,从首映开始,评分就一直居高不下,而且没有下滑的趋势,始终在 9.5 以上,这几天的总体平均分维持在 9.63 分,说明大家对该片的肯定。

至于后续大家对其的评价如何,是否会出现滑铁卢?还需要时间来检验。

三、该片的观众分布

地理位置分布

用Python爬取暑期档大火的《哪吒》,20W+评论数据,我们分析一波

从上图可以看出,《哪吒》的观影人群主要集中在沿海一带,这些地方经济相对发达,城市人口基数庞大,极多的荧幕数量和座位、极高密度的排片场次,让观众便捷观影,活跃的观众评论也多,自然也就成为票房的主要贡献者。

其实这条线和胡焕庸线是非常契合的

用Python爬取暑期档大火的《哪吒》,20W+评论数据,我们分析一波

这条 1935 首次提出的概念,到今天依然符合国情。

用Python爬取暑期档大火的《哪吒》,20W+评论数据,我们分析一波

观众来源排名前 20 的城市依次为:北京、深圳、广州、成都、上海、重庆、东莞、长沙、武汉、西安、天津、郑州、南京、佛山、杭州、昆明、沈阳、长春、青岛、大连。

电影消费是城市文化消费的一部分,从某种角度来看,可以反映出一个城市的购买力。

当然,这里没有考虑城市的总人数,存在一定的不严谨。

性别分布

用Python爬取暑期档大火的《哪吒》,20W+评论数据,我们分析一波

从上图可以看出,猫眼上的观众大多没有公开自己的性别信息,也有可能是注册时默认就是未知性别。

男女相比的话,也没有很大的区分,二者相差并不多,男生稍稍多于女生。

总之,《哪吒》是一部男女皆宜的片子。

四、AI 分析评论的情感倾向

该片的评分甚高,但是评论透露出观众的情感到底是怎样的呢?

下面我调用了腾讯 AI 开放平台的情感倾向分析接口,得出了每条评论的情感倾向值,及其分布情况。

情感分析接口能够对带有情感色彩的主观性文本进行分析、处理、归纳和推理,识别出用户的情感倾向,是积极还是消极,并且提供各自概率。

接口返回中,有两个有用的信息。

一个是正向情感指数,该值越大,代表文本的情感倾向越积极,否则越消极。

另外,接口会直接给出文本的情感分级结果,有负向、正向两种。

先来看一下分级结果统计:

用Python爬取暑期档大火的《哪吒》,20W+评论数据,我们分析一波

感觉腾讯 AI 接口的评论分析统计结果,有 84% 的观众的评论是正向的。

当然,这里腾讯的分析结果和普通人的理解还是有点差距的。

比如,以下评论都被腾讯接口归到了负向情感中。

笑点居多!准备二刷

我夸爆!!!

别的不想说!!!都给我看!!!!

看哭了,看哭了

下面再来看一下情感值的分布情况:

用Python爬取暑期档大火的《哪吒》,20W+评论数据,我们分析一波
用Python爬取暑期档大火的《哪吒》,20W+评论数据,我们分析一波

从评论内容分析结果来看,正向情感指数的观众是远高于负向的,这也有观众的评分情况契合。

用Python爬取暑期档大火的《哪吒》,20W+评论数据,我们分析一波

从评论情感指数走势图可以看出,情感指数一直在 0.77 上下徘徊,也算是一直处于正向情感中了。

五、为什么那么多高分?

绝大部分观众都对这部电影打出了高分,那么大家是因为什么喜欢这部电影的呢?

为此我整理出打了 8 分以上的观众评论,并制作了评论词云图,字体越大,说明这个词在评论中被提及得越多。

用Python爬取暑期档大火的《哪吒》,20W+评论数据,我们分析一波

1、大大的好看二字,说明大家都觉得这部电影真的很不错,超级非常好看!

2、另外,剧情、特效、搞笑、画面、情节、感动等字眼,也说明了该片得到大家的认可之处;

3、国产、崛起等字眼,也说明了该片在国产片中算是一匹黑马,并且其票房已经登上国产动画电影票房第一的宝座。

打低分的观众都说了些什么?

用Python爬取暑期档大火的《哪吒》,20W+评论数据,我们分析一波

1、大大的好看二字说明有些观众打分的随意性,但是评论还是真实的。

2、垃圾、不好、难看等字眼,也说明了确实有一部分观众不喜欢该片;

总结

总得来说,《哪吒》在猫眼的认可度还是很高的,从其评分、评论都可见一斑。

虽然存在一些评价不高的情况,但是瑕不掩瑜,从来就没有让每个人都满意的东西。

希望国产电影可以涌现出更多类似哪吒的电影,这样才有希望。

推荐阅读:
  1. python爬取携程和蚂蜂窝的景点评论数据\python爬取携程评论数据\python旅游网站评论数
  2. 如何爬取美团的店铺评论数据

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

20w+ 暑期 python

上一篇:scanf不能接收的字符串不能成功赋值给指针的问题

下一篇:打造立体化监控体系的最佳实践

相关阅读

您好,登录后才能下订单哦!

密码登录
登录注册
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》