A. 猫眼电影票房计算方式 简单给读者们介绍一下
喜欢看电影的读者朋友一定都想知道猫眼电影的电影票房是怎么统计的,接下来的这篇文章里就跟大家简单的聊聊这个话题让大家有更多的了解!
首先要给各位读者介绍一下猫眼电影,猫眼电影其实是美团旗下的一家集媒体内容、在线购票、用户互动社交、电影衍生品销售等服务的一站式电影互联网平台。早在2015年6月时猫眼电影就覆盖了影院超过4000家,这些影院的票房贡献占比超过总票房的90%。猫眼也就占网络购票70%的市场份额,每三张电影票就有至少一张出自猫眼电影 ,是影迷下载量较多、也是使用率较高的电影应用软件。同时猫眼电影为合作影院和电影制片发行方,提供覆盖海量电影消费者的最佳营销方案助力影片票房上升 。
而猫眼专业版就是由猫眼电影出品,为电影行业从业者提供及时、准确、专业的电影票房数据分析甚至能做到秒级实时票房、排片、影院经营数据等,也为影视从业者提供信息互通平台,提高影视作品的制作效率可以有剧组成员招募、行业精英对接、找剧组、投资、导演、演员、摄影等服务 。
最近这些年网络售票的异军突起,我国的电影票房统计工作进步可以说是一日千里。通过实时的网络售票选座信息和票价,再结合现场电影院所选的座位以及它们的售价,猫眼这类售票软件可以轻松的算出任意一个时间段的票房,这是很多其他国家都达不到的水准。
以上就是一些关于猫眼电影的介绍以及这个软件是如何来计算票房的,希望这篇文章能够加深大家对于这个行业的了解,也希望国内的电影行业发展的更快更好,感兴趣想要投资影视行业的更应该深入的了解一下!
B. 豆瓣电影数据分析
这篇报告是我转行数据分析后的第一篇报告,当时学完了Python,SQL,BI以为再做几个项目就能找工作了,事实上……分析思维、业务,这两者远比工具重要的多。一个多月后回过头来看,这篇报告虽然写得有模有样,但和数据分析报告还是有挺大差别的,主要原因在于:a.只是针对豆瓣电影数据分析太过宽泛了,具体关键指标到底是哪些呢?;b.没有一个确切有效的分析模型/框架,会有种东一块西一块的拼接感。
即便有着这些缺点,我还是想把它挂上来,主要是因为:1.当做Pandas与爬虫(Selenium+Request)练手,总得留下些证明;2.以豆瓣电影进行分析确实很难找到一条业务逻辑线支撑,总体上还是描述统计为主;3.比起网上能搜到的其他豆瓣电影数据分析,它更为详细,可视化效果也不错;
本篇报告旨在针对豆瓣电影1990-2020的电影数据进行分析,首先通过编写Python网络爬虫爬取了51375条电影数据,采集对象包括:电影名称、年份、导演、演员、类型、出品国家、语言、时长、评分、评论数、不同评价占比、网址。经过去重、清洗,最后得到29033条有效电影数据。根据电影评分、时长、地区、类型进行分析,描述了评分与时长、类型的关系,并统计了各个地区电影数量与评分。之后,针对演员、导演对数据进行聚合,给出产量与评分最高的名单。在分析过程中,还发现电影数量今年逐步增加,但评分下降,主要原因是中国地区今年低质量影视作品的增加。
另外,本篇报告还爬取了电影票房网( http://58921.com/ )1995-2020年度国内上映的影片票房,共采集4071条数据,其中3484条有效。进一步,本文分析了国内院线电影票房年度变化趋势,票房与评分、评价人数、时长、地区的关系,票房与电影类型的关联,并给出了票房最高的导演、演员与电影排名。
清洗、去重后,可以看到29033条数据长度、评分、评论数具有以下特点:
结合图1(a)(b)看,可以看到电影数据时长主要集中在90-120分钟之间,向两极呈现阶梯状递减,将数据按照短(60-90分钟),中(90-120分钟),长(120-150分钟),特长(>150分钟)划分,各部分占比为21.06%, 64.15%, 11.95%, 2.85%。
结合图2(a)看,可以看到我们采集到的电影数据评分主要集中在6.0-8.0之间,向两极呈现阶梯状递减,在此按照评分划分区间:2.0-4.0为口碑极差,4.0-6.0为口碑较差,6.0-7.0为口碑尚可,7.0-8.0为口碑较好,8.0-10.0为口碑极佳。
这5种电影数据的占比分别为:5.78%, 23.09%, 30.56%, 29.22%, 11.34%
再将评分数据细化到每年进行观察,可以发现,30年内电影数量与年度电影均分呈反相关,年度均分整体呈现下降趋势,2016年电影均分最低,电影数量最多。
进一步做出每个年份下不同评级等级的电影数据占比,可以发现,近年来,评分在[2.0,6.0)的电影数据占比有着明显提升,评分在[6.0,7.0)的数据占比不变,评分在[7.0,10.0)的数据占比减少,可能原因有:
对照图5,可以发现,评分与时长、评论人数的分布大致呈现漏斗状,高分电影位于漏斗上部,低分电影位于漏斗下部。这意味着,如果一部电影的评论人数很多(特别是超过30w人观影),时长较长(大于120min),那么它大概率是一部好电影。
根据各个国家的电影数量作图,可以得到图6,列出电影数量前十的国家可得表格2,发现美国在电影数量上占第一,达到8490部,中国其次,达6222部。此外,法国,英国,日本的电影数量也超过1000,其余各国电影数量相对较少。这可以说明美国电影有着较大的流量输入,在中国产生了较大的影响。
进一步分析各国电影的质量,依据评分绘制评分箱线图可得图7,在电影数量排名前20的国家中:
接着我们可以探索,哪个国家的电影对豆瓣评分随年份下降的贡献最大,考虑到电影数量对应着评分的权重。根据上述各国的电影评分表现,我们可以猜测电影数量较多的国家可能对年度均分的下降有较大影响。于是,我们再计算出这些国家的年度电影均分,并与整体均分进行比较分析。
再作出中国大陆,中国台湾,中国香港的均分箱线图图9(a),可以看到,大陆电影均分低于港台电影,且存在大量低分电影拉低了箱体的位置。
分析相关性可得,大陆、香港、台湾电影年度均分与全部评分关联度分别为R=0.979,0.919,0.822,说明滤去台湾和香港电影,大陆电影年度均分的变化趋势与全部评分变化更接近。图9(b)可以进一步反映这一点。
可以看到,大部分类型集中在X×Y=[10000,30000]×[6.00,7.50]的区间范围内,剧情、喜剧、爱情、犯罪、动作类电影数量上较多,说明这些题材的电影是近三十年比较热门的题材,其中剧情类电影占比最多,音乐、传记类电影平均得分更高,但在数量上较少,动作、惊悚类电影评论人数虽多,但评价普遍偏低。
除此之外,还有两块区域值得关注:
根据类型对电影数据进行聚合,整理得到各类型电影评分的时间序列,计算它们与整体均分时间序列的相关性,可得表格4与图11,可以看到剧情,喜剧,悬疑这三种类型片与总分趋势变化相关性最强,同时剧情、喜剧类电影在电影数量上也最多,因此可以认为这两类电影对于下跌趋势影响最大,但其余类别电影的相关性也达到了0.9以上,说明几种热门的电影得分的变化趋势与总体均分趋势一致。
前面已经得知,中美两国电影占比最高,且对于均分时间序列的影响最大。在此,进一步对两国电影进行类型分析,选取几种主要的类型(数量上较多,且相关性较高)进行分析,分别是剧情,喜剧,爱情,惊悚,动作,悬疑类电影,绘制近年来几类电影的数量变化柱状图与评分箱线图可得图12,13,14,15。
对导演与演员进行聚合,得到数据中共有15011名导演,46223名演员。按照作品数量在(0,2], (2,5], (5,10], (10,20], (20,999]进行分组统计导演数量,可以发现,15009名导演中有79.08%只拍过1-2部作品,46220名演员中有75.93%只主演过1-2部作品。忽略那些客串、跑龙套的演员,数据总体符合二八定律,即20%的人占据了行业内的大量资源。
在此,可以通过电影得分、每部电影评论人数以及电影数目寻找优秀的电影导演与演员。这三项指标分别衡量了导演/演员的创作水平,人气以及产能。考虑到电影数据集中可能有少量影视剧/剧场版动画,且影视剧/剧场版动画受众少于电影,但得分普遍要高于电影,这里根据先根据每部电影评论数量、作品数量来筛选导演/演员,再根据电影得分进行排名,并取前30名进行作图,可得图17,18。
结合电影票房网( http://58921.com/ )采集到的3353条票房数据,与豆瓣数据按照电影名称进行匹配,可以得到1995-2020年在中国大陆上映的电影信息,分别分析中国内地电影的数量、票房变化趋势,票房与评分、评价人数、时长、地区以及类型的关系,此外还给出了不同导演与演员的票房表现以及影片票房排名。
如图19所示,国内票房数据与上映的电影数量逐年递增,2020年记录的只是上半年的数据,且由于受疫情影响,票房与数量骤减。这说明在不发生重大事件的情况下,国内电影市场规模正在不断扩大。
对电影数据根据类型进行聚合,绘制散点图21,可以发现:
提取导演/演员姓名,对导演/演员字段进行聚合,计算每个导演/演员的票房总和,上映电影均分、以及执导/参与电影数目进行计算,作出票房总和前30名的导演/演员,可得图22,23,图中导演/演员标号反映了票房排名,具体每位导演/演员的上映影片数量、均分、每部电影评价人数、平均时长与总票房在表5、表6中给出。
最后根据电影票房进行排名,得到票房排名前20的电影如表格7所示,可以看到绝大部分上榜电影都是中国电影,索引序号为3、10、12、14、18、19为美国电影,这也反映了除国产电影之外,好莱坞大片占据较大的市场。
本篇报告采集了1990-2020年间豆瓣电影29033组有效数据,从豆瓣电影的评分、时长、地区、类型、演员、导演以及票房等信息进行分析评价,主要有以下结论:
C. 数据挖掘 | 数据理解和预处理
数据挖掘 | 数据理解和预处理
小编遇到过很多人(咳咳,请不要对号入座),拿到数据后不管三七二十一,先丢到模型中去跑,管它具体什么样呢,反正“大数据”嘛,总能整出点东西来。
但就像上次说过的,“大数据”很有可能带来“大错误”!所以在数据挖掘工作开始前,认真的理解数据、检查数据,对数据进行预处理是至关重要的。
很多人说,数据准备工作真是个“体力活”,耗时耗力不说,还异常的枯燥无味。这点小编承认,建模之前的数据处理确实是平淡的,它往往不需要多高的智商,多牛的编程技巧,多么高大上的统计模型。
但是,它却能时时触发你的兴奋点,因为它需要足够的耐心和细心,稍不留神就前功尽弃。
在这次的内容里,小编首先会从“数据理解”、“变量类型”和“质量检查”三个方面进行阐述,然后会以一个自己做过的实际数据为例进行展示。
一、数据理解
拿到数据后要做的第一步就是理解数据。
什么是理解数据呢?不是简单看下有多少Excel表,有多少行,多少列,而是要结合自己的分析目标,带着具体的业务需求去看。
首先,我们需要明确数据记录的详细程度,比方说某个网站的访问量数据是以每小时为单位还是每天为单位;一份销售数据记录的是每家门店的销售额还是每个地区的总销售额。
其次,我们需要确定研究群体。研究群体的确定一定和业务目标是密切相关的。
比方说,如果我们想研究用户对产品的满意度与哪些因素有关,就应该把购买该产品的所有客户作为研究群体;如果我们想研究用户的购买行为受哪些因素影响,就应该同时考察购买人群和非购买人群,在两类人群的对比中寻找关键因素。
研究群体的确定有时也和数据的详细程度有关。
比如我们想研究“观众影评”对“电影票房”的影响,我们既可以把“每部电影”看成一个个体,研究“影评总数”对“电影总票房”的影响,也可以把“每部电影每天的票房”看成一个个体,研究“每天的影评数”对“每天的电影票房”的影响。
具体选择哪一种取决于我们手上有什么样的数据,如果只有总票房和总影评数的数据,那我们只能选择第一种;如果有更详细的数据,那就可以考虑第二种方案。
需要注意的是,这两种方案还会影响我们对于模型的选择。
例如,如果研究“每天的影评数”对“每天电影票房”的影响,那每部电影又被细分为很多天,同一部电影不同时间的票房会有较高的相似性,这就形成了一种层次结构,可以考虑使用层次模型(hierarchical model)进行分析。
最后,当我们确定了研究目标和研究群体后,我们需要逐一理解每个变量的含义。有些变量和业务目标明显无关,可以直接从研究中剔除。
有些变量虽然有意义,但是在全部样本上取值都一样,这样的变量就是冗余变量,也需要从研究中剔除。
还有一些变量具有重复的含义,如“省份名称”和“省份简称”,这时只需要保留一个就可以了。
二、变量类型
所有变量按其测量尺度可以分成两大类,一类是“分类变量”,一类是“数值变量”。不同类型的变量在处理方法和后期的模型选择上会有显著差别。
【分类变量】
分类变量又称属性变量或离散变量,它的取值往往用有限的几个类别名称就可以表示了,例如“性别”,“教育程度”,“收入水平”,“星期几”等。细分的话,分类变量又可分为两类,一类是“名义变量”,即各个类别间没有顺序和程度的差别,就像“手机系统”中ios和安卓并没有明显的好坏差别,“电影类型”中“动作片”和“科幻片”也都是一样的,说不上哪个更好或更差。
另外一类是定序变量,即不同类别之间存在有意义的排序,如“空气污染程度”可以用“差、良、优”来表示、“教育程度”可以用“小学、初中、高中、大学”来表示。
当研究的因变量是分类变量时,往往对应特定的分析方法,我们在后面的章节会陆续讲到,这里暂且不谈。
当研究中的自变量是分类变量时,也会限制模型选择的范围。有些数据挖掘模型可以直接处理分类自变量,如决策树模型;但很多数据挖掘模型不能直接处理分类自变量,如线性回归、神经网络等,因此需要将分类变量转换成数值变量。
对于定序自变量,最常用的转换方法就是按照类别程度将其直接转换成数值自变量,例如将空气污染程度 “差、良、优”转换为“1,2,3”。
对于名义自变量,最常用的转换方法就是构造0-1型哑变量。例如,对于“性别”,可以定义“1=男,0=女”。
当某个名义变量有K个类别取值时,则需要构造K-1个哑变量。例如教育程度“小学,初中,高中,大学及以上”,可以构造三个哑变量分别为:x1:1=小学,0=其它;x2:1=初中,0=其它;x3:1=高中,0=其它。当x1,x2,x3三个哑变量取值都为0时,则对应着“大学及以上”。
需要注意的是,有时候名义变量的取值太多,会生成太多的哑变量,这很容易造成模型的过度拟合。
这时可以考虑只把观测比较多的几个类别单独拿出来,而把剩下所有的类别都归为“其它”。
例如,中国一共包含56个民族,如果每个民族都生成一个哑变量就会有55个,这时我们可以只考虑设置“是否为汉族”这一个0-1哑变量。
【数值变量】
我们再来看看数值变量。数值变量就是用数值描述,并且可以直接进行代数运算的变量,如“销售收入”、“固定资本”、“评论总数”、“访问量”、“学生成绩”等等都是数值变量。
需要注意的是,用数值表示的变量不一定就是数值型变量,只有在代数运算下有意义的变量才是数值型变量。
例如财务报表的年份,上市时间等,虽然也是用数值表示的,但我们通常不将它们按照数值型变量来处理。
上面我们讲到,分类变量通常要转换成数值型变量,其实有些时候,数值型变量也需要转换成分类变量,这就用到了“数据分箱”的方法。
为什么要进行数据分箱呢?通常有以下几个原因:
1. 数据的测量可能存在一定误差,没有那么准确,因此按照取值范围转换成不同类别是一个有效的平滑方法;
2.有些算法,如决策树模型,虽然可以处理数值型变量,但是当该变量有大量不重复的取值时,使用大于、小于、等于这些运算符时会考虑很多的情况,因此效率会很低,数据分箱的方法能很好的提高算法效率;
3.有些模型算法只能处理分类型自变量(如关联规则),因此也需要将数值变量进行分箱处理。
数据分箱后,可以使用每个分箱内的均值、中位数、临界值等作为这个类别的代表值,也可以直接将不同取值范围定义成不同的类别,如:将污染程度划分后定义为“低、中、高”等。
那如何进行数据分箱呢?常用的数据分箱的方法有:等宽分箱(将变量的取值范围划分成等宽的几个区间)、等频分箱(按照变量取值的分位数进行划分)、基于k均值聚类的分箱(将所有数据进行k均值聚类,所得的不同类别即为不同的分箱),还有一些有监督分箱方法,如:使分箱后的结果达到最小熵或最小描述长度等。这里不详细介绍了,有兴趣的童鞋可以自行网络。
三、质量检查
对数据中的各个变量有了初步了解后,我们还需要对数据进行严格的质量检查,如果数据质量不过关,还需要进行数据的清洗或修补工作。
一般来说,质量检查包括检查每个变量的缺失程度以及取值范围的合理性。
【缺失检查】
原始数据中经常会存在各种各样的缺失现象。
有些指标的缺失是合理的,例如顾客只有使用过某个产品才能对这个产品的满意度进行评价,一笔贷款的抵押物中只有存在房地产,才会记录相应的房地产的价值情况等。
像这种允许缺失的变量是最难搞的,因为我们很难判断它的缺失是合理的,还是由于漏报造成的。
但无论哪种情况,如果变量的缺失率过高,都会影响数据的整体质量,因为数据所反映的信息实在太少,很难从中挖掘到有用的东西。
对于不允许缺失的变量来说,如果存在缺失情况,就必须进行相应的处理。如果一个变量的缺失程度非常大,比方说达到了70%,那就考虑直接踢掉吧,估计没救了。
如果缺失比例还可以接受的话,可以尝试用缺失值插补的方法进行补救。
插补的目的是使插补值能最大可能的接近其真实的取值,所以如果可以从其他途径得到变量的真实值,那一定优先选择这种方法。
比如某个公司的财务信息中缺失了“最终控制人类型”和“是否国家控股”这两个取值,这些可以通过网上的公开信息得到真实值;再比如缺失了“净利润率”这个指标的取值,但是却有“净利润”和“总收入”的取值,那就可以通过变量间的关系得到相应的缺失值,即净利润率=净利润/总收入。
当然,更多的时候,我们无法得到缺失值的真实信息,这时就只能借用已有的数据来进行插补了。
对数值变量来说,可以用已观测值的均值、中位数来插补缺失值;对分类型变量来说,可以用已观测数据中出现比例最高的类别取值来进行插补。
这些方法操作起来非常简单,但它们都是对所有缺失值赋予了相同的取值,所以当缺失比例较大时,可能会扭曲被插补变量与其余变量的关系。
更复杂一点的,我们可以选择模型插补方法,即针对被插补变量和其它自变量之间的关系建立统计模型(如回归、决策树等),将模型预测值作为插补值。
如何处理缺失值是一个很大的研究课题,我们这里只是介绍了最简单可行的方法,有兴趣的读者可以参阅Little和Rubin 2002年的专著“Statistical Analysis with Missing Data”。
【变量取值合理性检查】
除了缺失外,我们还要考察每个变量的取值合理性。每个变量都会有自己的取值范围,比如“用户访问量”、“下载次数”一定是非负的,“投资收益率”一定在0~1之间。通过判断变量的取值是否超出它应有的取值范围,可以简单的对异常值进行甄别。
除了根据变量的取值范围来检查变量质量外,还可以根据变量之间的相互关系进行判断。例如一家公司的“净利润率”不应该大于“总利润率”等。
只有通过了各个方面检测的数据才是一份高质量的数据,才有可能带来有价值的模型结果。
四、实例分析——电影票房分析
最后,我们给出一个实例分析。在这个例子中,我们的目标是研究电影哪些方面的特征对电影票房有影响。
我们有两方面的数据,一是描述电影特征的数据,二是描述电影票房的数据。
由于我们关注的是北美的票房市场,所以描述电影特征的数据可以从IMDB网站得到,它是一个关于演员、电影、电视节目、电视明星和电影制作的在线数据库,里面可以找到每部上映电影的众多信息;电影每天的票房数据可以从美国权威的票房网站Box Office Mojo得到,上面记录了每部电影上映期间内每天的票房数据。
我们将从IMDB得到的数据放到“movieinfor.csv”文件中,将从Box Office Mojo中得到的数据放到“boxoffice.csv”文件中。
这里,我们以2012年北美票房市场最高的前100部电影为例进行讲解。下表给出了这两个数据集中包含的所有变量以及相应的解释。
在这两个数据中,movieinfor.csv数据的记录是精确到每部电影的,而boxoffice.csv数据精确到了每部电影中每天的票房数据,是精确到天的。上表中给出的变量中,除了电影名称和ID外,“电影类型”“MPAA评级”(美国电影协会对电影的评级)和“星期几”是分类型变量;“放映时长”、“制作预算”、“电影每天的票房”和“每天放映的影院数”是数值型变量。两份数据都不存在缺失值。
我们首先对两个数据集分别进行变量预处理,然后再根据电影ID将两个数据整合到一起。下面给出了每个变量的处理方法:
【电影类型】
电影类型是一个分类变量。在这个变量中我们发现每部电影都不止一个类型,例如“The Dark Knight Rises”这部电影就有“Action”、“Crime”和“Thriller”三个类型,并且它们以“|”为分隔符写在了一起。
同时,不同电影之间可能有相同的类型,也可能有不同的类型,例如票房排名第二的电影“Skyfall”,它的类型是“Action |Adventure |Thriller”。
因此,我们首先需要做的是把每部电影所属的类型逐一取出来,然后将所有出现过的类型分别形成一个0-1哑变量,如果这部电影在某个类型上出现了,则相应变量的取值就是1,否则是0.
通过上面一步,我们知道这个数据集中出现过的所有电影类型一共有11个。
那是不是按照之前所讲的,应该把它转换为10个哑变量呢?这里需要注意的是,所有的电影类型之间并不是互斥的(即有了action,就不能有其他的类型),所以我们无需因为共线性的原因去掉其中一个。
也就是说,如果把每一个电影类型单独作为一个独立的变量,可以衍生出11个新的0-1变量,这完全没有问题。但11个变量未免有点过多,所以我们根据不同电影类型的频数分布情况,只把出现次数明显较多的类型单独拿出来,最终生成了6个0-1型变量,分别为Adventure,Fantasy,Comedy,Action,Animation,Others。
【MPAA评级】
对于这个分类型变量,我们首先可以看一下数据中它所包含的全部取值,发现一共有“PG”,“PG-13”和“R”三个。
和上面的电影类型(Genre)不同,对于一部电影而言,它只能有一个MPAA取值。因此,在MPAA变量中,我们需要选择一个作为基准,将另外两个构造成哑变量。
例如,我们以“PG”为基准,构造的两个哑变量分别为PG13和R,如果这两个哑变量的取值同时为0,那就相当于电影的MPAA评级是PG。
【放映当天是星期几】
这个变量同MPAA评级一样,每部电影只能有一个取值。
如果它在星期一到星期日上都有取值的话,我们可以衍生出6个0-1型哑变量。
因为这里我们更关注周末和非周末对电影票房的影响,而并不关注具体是哪一天,所以我们将其进一步概括成一个变量,即“是否是周末”。
【放映时长和制作预算】
放映时长和制作预算这两个变量都是取值大于0的数值型变量,我们可以分别检查它们的取值是否在合理的范围内,然后直接保留它们的数值信息。
同时,对“制作预算”而言,假设我们这里关心的不是制作预算的具体数值,而是“小成本电影”和“大成本电影”的票房差异,那我们就可以将这个数值型变量进行分箱处理,转换为一个0-1型的分类变量,即 “是否为小成本电影”。
在决定按照什么标准来划分是否为小成本电影时,我们根据之前文献里的研究结果,将制作预算在100 million以下的电影看成是小成本电影。
上述所有变量的处理过程都可以使用R中最基本的语句(table,rep,which等)完成,由于篇幅限制,小编这里就不列出详细的code了,大家感兴趣的话,可以阅读狗熊会的“R语千寻”系列(戳这里),相信会在R语言的学习上受到更多启发。
最后,我们将所有新生成的变量按照电影ID整合到一起,就大功告成啦。
五、总结
最后总结一下,小编在这次内容中向大家介绍了拿到数据后的数据理解和预处理工作,内容虽然不难,但同样需要我们认真对待。就好像生活一样,只有踏踏实实走好前面的路,才有可能迎接后面的高潮迭起!
D. 中国电影票房排行榜是怎样的哪部电影最受欢迎
截止2021年2月26日,根据猫眼专业实时票房数据:
排名第一的是《你好,李焕英》,上映15天,票房累计44.97亿元。
排名第二的是《唐人街探案3》,上映15天,票房累计41.98亿元。
排名第三的是《刺杀小说家》,上映15天,累计票房8.18亿元。
其后的是《熊出没狂野大陆》、《人潮汹涌》、《新神榜:哪吒重生》
根据票房显示,最受欢迎的电影应该是贾玲导演的《你好,李焕英》。
比如她搭建了一个编剧班子,编剧团队对于小品的电影化改造,去除了小品的篇幅局限,
同时,增加的人物,以及角色之间交叉产生的故事,对过去时代与社会风貌的精准还原。
以父爱母爱为题材的电影,纵观中外电影史也多是文艺佳作居多,票房大赚的商业大片几乎没有。
话又说回来,从贾玲的角度来讲,能拍摄这样一部作品去纪念自己的母亲,已经算是莫大的成功了,这是普天下多少子女都想做的事情啊!
E. 2021中国电影年票房472.58亿,我国的电影市场有哪些特点
我国的电影年票房可谓是年年攀高,2021年中国电影年票房以472.58亿的成绩,宣告着电影行业已经从寒冬中苏醒,从这惊人的票房数字,我们不难发现中国的电影市场存在着以下几个明显的特点:主旋律影片受到追捧、商业爆米花片仍旧是主流、影片上映时间集中。
从2021年春节档起至年底,《你好,李焕英》、《长津湖》、《我和我的父辈》等一系列优秀的国产主旋律作品就受到了大家的喜爱,主旋律电影因其符合普适性原则,其中蕴含的情感能够引起大多数中国人的共鸣,并且影片拍摄的手法都比较细致入微,大多数是从细节入手去刻画人物之间的情感从而成功牵动起观众的情绪,让人沉浸于影片当中,因此票房成绩都很好看。
中国的电影市场还有很大的进步空间,大家认为中国的电影市场还存在哪些特点呢?
F. 2022年端午档电影总票房1.78亿,与往年相比有何变化
2021年端午档电影总票房是4.68亿元,而2022年端午档电影总票房则是1.78亿。这个数据与上一年相比票房跌落严重,为什么各地疫情渐好中国电影票房仍然低落呢。在2019年端午档总电影票房高达7.85亿元,这其中变化之大,原因主要除了疫情之外,还有电影行业本身的问题。近几年烂片层出不穷,好片只有那么几部,观众花钱买票并不想看烂片。
电影票房的低下不止证明了疫情之下中国经济的萧条,电影院的关门更使得电影院工作人员陆续下岗,社会问题增多。希望疫情赶紧过去,国内电影电视剧行业可以更加努力,推动中国电影新发展。
G. python艺恩网2022年电影票房状况
近日,艺恩发布了《2022年春节档中国电影市场报告》(以下简称“报告”),报告通过梳理春节档电影区域放映情况,结合春节档电影放映市场及重点影片的情况分析,总结2022年春节档电影市场总体情况。
总体市场来看,报告数据显示,2022年春节档七天票房总收入60.35亿元,较去年下降23%左右;观影人次1.14亿,较去年下降28.9%,仅相当于2018年水平,观影人次流失明显;单日票房方面,大年初一票房14.5亿,同比下降15%左右。
春节档票房TOP10影片依次是:《长津湖之水门桥》,档期内票房25.34亿;《这个杀手不太冷静》,档期票房 13.90亿;《奇迹·笨小孩》,档期票房6.69亿;《熊出没·重返地球》,档期内票房5.63;《四海》,档期内票房4.76亿;《狙击手》,档期内票房2.64亿;《喜羊羊与灰太狼之筐出未来》,档期内票房0.88亿元;《小虎墩大英雄》,档期内票房0.18亿元;《汪汪队立大功大电影》,档期内票房0.07亿;《好想去你的世界爱你》,档期内票房0.05亿。
H. 票房预测数据来源
中国电影票房数据分析
2016年中国电影票房分析
据不完全统计,截止到12月29日下午6时,2016年内地电影票房已达450.76亿,已超过去年票房总成绩440亿。其实,从2003年至2015年中国电影一直保持平均35%的市场增长率,2015年我国电影票房市场已经达到441亿,过去6年复合增速38.6%。但根据目前的整体票房走势来看,2016年的票房增速约3%,这也是17年来,我国电影票房增长最慢的一年。票房增长率13年来首次低于25%截至12月23日,2016年内地电影票房突破441亿,用时358天才艰难超过了去年440.69亿元的全年总票房,与2015年仅用时9个多月就超过2014年电影票房的速率相差甚远,今年全年票房增长率13年来将首次低于25%。数据来源:中商产业研究院整理从均观影次数来看,近年来我国平均观影人次逐年攀升,2015年中国人均观影次数已经达到1.6次;预计2016年中国电影观影人次将达1.7人次,但距发达国家人均3-4次的观影次数仍有较大差距。数据来源:中商产业研究院整理仅九部电影票房超10亿另外,2016年《美人鱼》、《疯狂动物城》和《魔兽》分别以33.9亿、15.3亿、14.7亿元的成绩成为今年内地电影票房冠、亚、季军。《美国队长3:英雄内战》、《西游记之孙悟空三打白骨精》、《湄公河行动》、《澳门风云3》、《盗墓笔记》和《功夫熊猫》刘部国产片跻身10亿元俱乐部,领衔今年华语片票房排行榜。截至目前,今年共有84部在内地公映的中外电影票房过亿,其中华语片共有41部过亿。不过《摆渡人》、《铁道飞虎》12月23日刚刚首映,无论口碑如何,相信两部电影票房过亿都毫无悬念。2016年度国内电影票房前十排行榜数据来源:艺恩 中商产业研究院整理(截止2016年12月30日)未来预期目前,中国电影进入繁荣发展的黄金机遇期。中国电影产量位居全球第三,今年中国电影产量不减,预计年底将突破700部。今年电影市场增长速度减缓,但依然在增长。预计,2016年电影市场或将达到454亿,增速3%,增长速度略缓。
另外,相关数据显示,今年有84部影片过亿,相比去年的81部有所提高。观影人数约在13亿,比去年12亿也有所增长。而12月下旬,国家新闻出版广电总局发布最新数据,中国电影银幕已超过4万块,跃居世界第一。2016年,中国电影银幕以每天增加26块的速度递增,超过了2015年每天增加22块的速度。值得关注的是:近期,阿里巴巴影业联合上戏、复星探索影视人才培养新模式。苹果收购已破产流媒体音乐公司,吸收技术和人才;Instagram也将推出直播功能。这些都反映我国影视传媒行业市场前景可期。中商产业研究院简介中商产业研究院是深圳中商情大数据股份有限公司下辖的研究机构,研究范围涵盖智能装备制造、新能源、新材料、新金融、新消费、大健康、“互联网+”等新兴领域。公司致力于为国内外企业、上市公司、投融资机构、会计师事务所、律师事务所等提供各类数据服务、研究报告及高价值的咨询服务。中商行业研究服务内容行业研究是中商开展一切咨询业务的基石,我们通过对特定行业长期跟踪监测,分析行业需求、供给、经营特性、盈利能力、产业链和商业模式等多方面的内容,整合行业、市场、企业、用户等多层面数据和信息资源,为客户提供深度的行业市场研究报告,全面客观的剖析当前行业发展的总体市场容量、竞争格局、进出口情况和市场需求特征等,对行业重点企业进行产销运营分析,并根据各行业的发展轨迹及实践经验,对各产业未来的发展趋势做出准确分析与预测。中商行业研究报告是企业了解各行业当前最新发展动向、把握市场机会、做出正确投资和明确企业发展方向不可多得的精品资料。中商行业研究方法中商拥有10多年的行业研究经验,利用中商Askci数据库立了多种数据分析模型,在产业研究咨询领域利用行业生命周期理论、SCP分析模型、PEST分析模型、波特五力竞争分析模型、SWOT分析模型、波士顿矩阵、国际竞争力钻石模型等、形成了自身独特的研究方法和产业评估体系。在市场预测分析方面,模型涵盖对新产品需求预测、快速消费品销售预测、市场份额预测等多种指标,实现针对性的进行市场预测分析。
中商研究报告数据及资料来源中商利用多种一手及二手资料来源核实所收集的数据或资料。一手资料来源于中商对行业内重点企业访谈获取的一手信息数据;中商通过行业访谈、电话访问等调研获取一手数据时,调研人员会将多名受访者的资料及意见、多种来源的数据或资料进行比对核查,公司内部也会预先探讨该数据源的合法性,以确保数据的可靠性及合法合规。二手资料主要包括国家统计局、国家发改委、商务部、工信部、农业部、中国海关、金融机构、行业协会、社会组织等发布的各类数据、年度报告、行业年鉴等资料信息。
数据来源 数据种类
金融机构 金融机构公开发布的各类年度数据、季度数据、月度数据等
政府部门 宏观经济数据、行业经济数据、产量数据、进出口贸易数据等
行业协会 年度报告数据、公报数据、行业运行数据、会员企业数据等
社会组织 国际性组织、社会团体公布的各类数据等
行业年鉴 农业、林业、医疗、卫生、教育、环境、装备、房产、建筑等各类行业数据
公司公告 资本市场各类公司发布的定期年报、半年报、公司公告等
期刊杂志 在开期刊杂志中获取的仅限于允许公开引用、转载的部分
中商调研 研究人员、调研人员通过实地调查、行业访谈、获取的一手数据
中商的产业研究服务优势
产业研究优势 优势体现
丰富的数据资源、强大数据挖掘能力 中商是中国首家自建数据库系统的产业研究咨询机构,公司自主研发的Askci数据库和CISource中商情报通对各类数据建立中商企业数据库、全球数据库、宏观经济数据库、行业数据库、区域数据库、调研数据库等专业数据库,覆盖近5000多个细分产业数据。
知名的研究团队,优质的研究咨询服务 中商拥有具备专业背景知识和熟悉产业运营的复合型人才, 产业分析师、行业专家及咨询顾问共计300余名,在宏观经济、区域经济、细分行业及政策法规研究方面具备很强的实力。公司研究团队为客户提供专业的产业研究咨询服务及个性化的专项咨询服务。
专门的客服团队,满足客户个性化咨询服务 公司建立了专门的客服团队,能够更为准确的了解客户的需求并满足,并且能够对客户的需求进行快速的处理,深入为客户提供多样化、个性化产品解决方案。通过加强员工培训与业务创新,开创了民营银行筹建、保险公司筹建等新型咨询服务业务。
产业大数据平台成就最具影响力行业门户 公司旗下中商情报网是是国内专业的商业大数据发布和查询平台,经过多年的发展吸引培养了一批忠实用户,已成为中国财经领域“最具影响力行业门户”,为国内外企业、金融从业人员、创业人员、科研院所工作者等提供客观、时效、高价值的商业资讯。
中商的影响力国家政府部门及权威媒体广泛报道与引用中商产业研究院专业研究结论国内外主流财经媒体及国家政府部门大量引用中商数据及研究结论,如央视财经、凤凰财经新浪财经、中国经济信息网、国家商务部、发改委、国务院发展研究中心(国研网)等。
¥
5
网络文库VIP限时优惠现在开通,立享6亿+VIP内容
立即获取
中国电影票房数据分析
2016年中国电影票房分析
第 1 页
据不完全统计,截止到12月29日下午6时,2016年内地电影票房已达450.76亿,已超过去年票房总成绩440亿。其实,从2003年至2015年中国电影一直保持平均35%的市场增长率,2015年我国电影票房市场已经达到441亿,过去6年复合增速38.6%。但根据目前的整体票房走势来看,2016年的票房增速约3%,这也是17年来,我国电影票房增长最慢的一年。
票房增长率13年来首次低于25%
截至12月23日,2016年内地电影票房突破441亿,用时358天才艰难超过了去年440.69亿元的全年总票房,与2015年仅用时9个多月就超过2014年电影票房的速率相差甚远,今年全年票房增长率13年来将首次低于25%。
第 2 页
数据来源:中商产业研究院整理
从均观影次数来看,近年来我国平均观影人次逐年攀升,2015年中国人均观影次数已经达到1.6次;预计2016年中国电影观影人次将达1.7人次,但距发达国家人均3-4次的观影次数仍有较大差距。
第 3 页
数据来源:中商产业研究院整理
仅九部电影票房超10亿
另外,2016年《美人鱼》、《疯狂动物城》和《魔兽》分别以33.9亿、15.3亿、14.7亿元的成绩成为今年内地电影票房冠、亚、季军。《美国队长3:英雄内战》、《西游记之孙悟空三打白骨精》、《湄公河行动》、《澳门风云3》、《盗墓笔记》和《功夫熊猫》刘部国产片跻身10亿元俱乐部,领衔今年华语片票房排行榜。
截至目前,今年共有84部在内地公映的中外电影票房过亿,其中华语片共有41部过亿。不过《摆渡人》、《铁道飞虎》12月23日刚刚首映,无论口碑如何,相信两部电影票房过亿都毫无悬念。
I. 电影票房分析及预测
从20世纪初的西洋镜戏法到今天占据全球电影业总产值的三分之一强,资本的加入让好莱坞在过去百年的发展中变得越来越理智--比起商业片流水线缔造者,它更像一个数学家--它精于计算每一项决定对利润的贡献:《蝙蝠侠》续集是否要接受男演员片酬的狮子大开口以获得百分之几的忠实粉丝买票入场;是否要在动作片的第37分钟增加感情戏以争取女性观众;是否要为这部烂透了的原著聘请收费高昂的剧本医生;一个小金人编剧的名头到底值多少钱……这就是在电影开机之前最为重要的环节:票房预测。
华尔街不仅给好莱坞带来了密集的资金支持,也带来了理性的金融工程技术,后者好像一把衡量艺术的尺子。一位浸淫于电影行业的金融人士一语中的:"在这个行业里充斥着暧昧不清、晦暗不明,有真正的艺术家、也有忽悠的吹水者,但到底怎么判断是否能合作,项目是否有投资价值,全凭经验"。
如何预测
早在80年代,美国票房收入预测的先驱BarryLitman对美国80年代近700部电影进行分析推出票房收入预测模型。该系统对之后美国电影投资界产生了颠覆性的影响。电影票房预测系统能分析预测不同种类电影的票房价值,已经成为国际电影产业投融资的重要参考工具,对电影产品定价及衍生产品开发都具有较强的指导作用。
预测系统
电影票房量化分析及预测系统(Box Revenue Prediction)是在考察导演、主要演员、制片、发行及市场营销、电影生命周期、电影类型、发行地区等影响电影票房的诸多因素基础上,基于资产定价模型,综合采用金融工程和回归统计分析方法研发出的预测系统。它能分析预测不同种类电影的票房价值,成为电影产业投融资重要参考工具,对电影产品定价及衍生产品开发都具有较强的指导作用。
中国第一套BRP系统
2012年1月,中影集团联合艾亿新融资本推出了国内第一套基于电影票房预测的估值与定价分析系统--BRP系统。通过对过去4年中600多部影片的统计分析,该BRP系统发现了6条有趣的现象:
·低成本的影片一般会比大片更卖座
·无名小卒主演的影片要比明星主演的影片利润率更高
·类型的艺术特征跟利润之间不存在直接关联,但评论的多寡(无论好评或者劣评)跟利润之间有密切关系
·不含暴力、色情成分的家庭影片最容易赚钱
·大片的续集要比普通新片更容易赚钱
·明星在为影片带来更高票房的同时,也往往拉低了利润率,因为大部分收入进了明星的口袋