电影票房与评分的关系

想看电影的票房和大家对其评分的关系。是否是评分越高的电影票房也越好。

先用爬虫抓取了豆瓣上排名前250的片子。

程序是根据《Python网络爬虫从入门到实践(唐松)》修改的。

豆瓣上没有票房,但是有评分人数量,于是姑且把评分人数当做票房看它和评分的相关性。

评分和人数都用最大最小值做了标准化。

结论是:无相关性(r=0.306896,p=0.759),对于得分相同的片子,其观看人数的变化是很大的。

再去IMBD上爬取豆瓣前250的片子在IMBD上的排名。

电脑速度太慢,中途Spyder总是死掉。于是手动抓了不少。

整体而言,豆瓣的评分(平均分8.83)都比IMBD(8.05)上要高一点。但是这两个网站上的评分也无相关性(r=0.5587,p=0.577)。

同样,在豆瓣上评分相同的片子到了IMBD上结果就会千差万别。

IMBD上评分和票房的关系

由于豆瓣上的前250名的片子很多都是国产的,于是就手动从豆瓣前200的片子中把国产的以及日韩等非美国片剔除掉,并且去除了1990年之前的片子,然后总共选取了120部片子(几乎都是美国片),然后跟这些片子的全美票房(Gross USA)进行了比较。结果如下,并没有显示出评分越高票房越好的特点。

考虑到物价上涨的因素,想看看剔除掉年份的要素之后会不会好一点,于是用年份(year)和评分(ranking)做自变量做了一个回归,看它们对票房的影响。

结果是这两个自变量的P值都不显著(尤其是年份),评分对于票房会稍微有一点影响,但没有明显的相关

原文地址:https://www.cnblogs.com/hankoui/p/8463460.html

时间: 2024-10-09 22:12:13

电影票房与评分的关系的相关文章

【python数据分析实战】电影票房数据分析(二)数据可视化

目录 图1 每年的月票房走势图 图2 年票房总值.上映影片总数及观影人次 图3 单片总票房及日均票房 图4 单片票房及上映月份关系图 在上一部分<[python数据分析实战]电影票房数据分析(一)数据采集> 已经获取到了2011年至今的票房数据,并保存在了mysql中. 本文将在实操中讲解如何将mysql中的数据抽取出来并做成动态可视化. 图1 每年的月票房走势图 第一张图,我们要看一下每月的票房走势,毫无疑问要做成折线图,将近10年的票房数据放在一张图上展示. 数据抽取: 采集到的票房数据是

统计电影票房排名前10的电影并存入另一个文件

今天看到一个笔试题,是这样的:给定一个文件(m.dat),里面保存了各个电影票房统计,格式如下: <2012>                                索尼                $769.7 <哈利波特与死亡圣器(上)>              华纳兄弟            $952.0 <星球大战>                            二十世纪福克斯      $775.4 <怪物史莱克4>      

电影票房

电影票房,票房榜 文章来源:http://www.haoservice.com/docs/29 支持格式: JSON/XML 请求方式: GET/POST 明文方式请求参数:   名称 类型 必填 说明   key string 是 API KEY   area String 是 票房榜的区域,CN-内地,US-北美,HK-香港 密文方式请求参数:   名称 类型 必填 说明   IsEncrypt bool 是 是否密文传输方式   key string 是 API KEY   params

1-2 爬取猫眼票房网上的电影票房信息

1 piaofang.py 2 #-*- coding:utf-8 -*- 3 ''' 4 该脚本可以抓取猫眼票房网站上的电影票房数据 5 使用的数据为豆瓣上爬取的电影,见文件:doubanMovies_IMDBScore.csv 6 ''' 7 import requests 8 import lxml.html 9 import time 10 from pandas import DataFrame 11 import pandas as pd 12 13 headers={'User-A

内地电影票房总排行榜

WORLDWIDE GROSSES#1-100 - #101-200 - #201-300 - #301-400 - #401-500 - #501-600 - #601-700 - #701-705 Pink highlight = official revisions of older moviesGold highlight = now playing or recent movies Rank Title Studio Worldwide Domestic / % Overseas / 

python实现的、带GUI界面电影票房数据可视化程序

代码地址如下:http://www.demodashi.com/demo/14588.html 详细说明: Tushare是一个免费.开源的python财经数据接口包.主要实现对股票等金融数据从数据采集.清洗加工 到 数据存储的过程,能够为金融分析人员提供快速.整洁.和多样的便于分析的数据. 完成本项目后,可以进一步通过类似的方法实现股票数据的可视化操作. (代码在python2.7或python3.6下均能正常运行,已在以下环境中进行过测试: python2.7 + tushare0.9.8

【python数据分析实战】电影票房数据分析(一)数据采集

目录 1.获取url 2.开始采集 3.存入mysql 本文是爬虫及可视化的练习项目,目标是爬取猫眼票房的全部数据并做可视化分析. 1.获取url 我们先打开猫眼票房http://piaofang.maoyan.com/dashboard?date=2019-10-22 ,查看当日票房信息, 但是在通过xpath对该url进行解析时发现获取不到数据. 于是按F12打开Chrome DevTool,按照如下步骤抓包 再打开获取到的url:http://pf.maoyan.com/second-bo

盘点一下2019年票房前20的电影--电影票房排名

现在已经11月份了,离2020年仅仅只有两二个月了,时间真快. 今天小编带大家盘点一下2019年,票房前20的电影. 第一名<哪吒之魔童降世> 总票房 49.34亿这部电影展示了我国也能拍出好莱坞一线制作的电影,它不仅仅是一部电影,也是国产动漫的曙光,当之无愧的第一名. 第二名<流浪地球> 总票房 46.18亿看完<流浪地球>,第一感受就是超级震撼的特效,据了解,全片共有超过两千个特效镜头,约75%都是由国内特效公司完成的,大家都认为国产科幻电影元年的开启,第二名实至名

春节全国电影票房火爆再创纪录 两天收入13亿元ge

第三,民心是最大的政治,要把管党治党政治责任落实到基层,厚植党执政的政治基础.我们党最大的政治优势是密切联系群众,民心始终是我们党最深厚的执政之基.不讲政治.脱离群众,党的领导就会被虚化削弱.必须坚决纠正政治虚无主义倾向,旗帜鲜明讲政治.人民的心声.心愿.心念就是民心,增强人民群众对党中央的信心.信任和信赖,是最大的政治成就.落实党中央一系列为民务实的好政策,关键靠党的坚强领导,靠全面从严治党作保障.要推动主体责任和监督责任一级级向基层延伸,让广大群众在全面从严治党中增加获得感,不断巩固党的执政