导航:首页 > 数据处理 > 央视如何表达数据

央视如何表达数据

发布时间:2023-02-10 17:27:07

Ⅰ 央视为《人民的名义》点赞,却点名《三生三世十里桃花》数据造假

最近,反腐大剧《人民的名义》激发了观众的追剧狂潮,该剧没有小鲜肉,也不是大IP,积累播放量已经达到35亿,在央视的采访调查中,该剧的出品人明确表示:“该剧从播出到现在,没有买过点击率和收视率”。

但同样是人气作品,35亿这个数据,相比于前段时间大火的《三生三世十里桃花》可谓是小巫见大巫,因为《三生三世十里桃花》33天58集就创造了309亿的全网播放量。其中,2月22号到23号这一天,点击率高达14亿,这就意味着得“四海八荒”7亿网民都来刷两遍才行。

这高数据的背后也引起了人们的质疑,央视也独家去调查了关于数据真实性的问题,据业内人士反应:“流量造假已经变成一个公开的秘密了,就是地球人都不够用了,动都不动一天就有好多亿,全是假的嘛!”

同时,央视还到一家第三方数据监测公司进行调查,分析《孤芳不自赏》2月23号的数据,该数据的曲线基本上是平的,违背了人们的生活规律,正常的曲线应该是中午和晚上会有一些小高点,该公司的负责人还表示:“就这一部剧来说,它的水分大约在90%”。

实际上,流量造假已经是行业内公开的秘密,虚假流量的背后暗藏一条庞大的利益链条,据央视报道,刷量这个现象,不仅是片方去刷,其实平台方、营销方和发行方都会参与到整个刷量的过程中来。

央视在采访过程中,还让技术人员演示了刷流量的过程,那速度之快,真是触目惊心啊!看了这么多,也希望电视剧行业能够多一点真诚,少一点套路,多像《人民的名义》学习,毕竟流量和口碑都很重要,想要做好这两点,用心拍电视,给观众一份满意的答卷,观众也会回你一份热枕!

Ⅱ 央视的收视率怎么算的!

收视率调查记录的是观众收视行为结果,而非收视行为本身。但是通过对结果的分析,完全可以透视收视行为,以及分析影响收视行为变化的因素有哪些。简单地说,收视行为即选择,包括看与不看的选择,什么时间看的选择,看什么频道什么节目的选择,看多长时间的选择,以及如何看(伴随行为)的选择。行为选择的结果通过日记法或人员测量仪法记录下来,成为计算收视率和研究收视行为的基础数据。
由此可见,从收视率调查数据出发进行收视行为研究,首先要做的是把原始收视数据经过有效的整理、汇总和归纳,形成收视率指标,然后研究收视率所透视的收视行为模式,研究影响收视率变化和收视行为选择模式形成与改变的诸种因素,研究收视率在反映收视行为方面的局限性以及突破办法。

一、基于调查数据计算收视率指标

收视率调查数据包括两部分。一部分是被调查者(被调查个人及其所属户)的背景资料数据,包括性别、年龄、职业、文化程度、个人/家庭收入、个人/家庭资产、家庭规模、家庭角色关系、家庭收视设备占有情况和电视接收情况、基本生活态度和休闲选择、工作情况、居住地区、使用语言等。这部分数据主要通过样户入网调查得到,成为进行收视率计算和分析的背景数据。另一部分是通过日记法或人员测量仪法记录到的被调查者个人的电视收视数据,具体即有电视的家庭户(样本户)中每位成员(年龄4周岁及以上的被调查者)在每天连续的24小时内每15分钟(人员测量仪为每分钟)收看或不收看电视以及收看什么频道的记录信息。

另外还有一部分数据不属于收视率调查数据,也就是说不是从样户调查得来的数据,但对收视率计算与分析也至关重要,这就是电视频道属性数据和电视节目播出数据。这部分数据一般由电视台提供或通过电视监播得到。

有了以上三部分数据,就使得收视率指标的计算成为可能。只根据电视收视数据可以计算总收视率及分时段分频道的收视率;如果结合背景资料数据,则可计算分目标观众收视率;如果结合电视节目播出数据,则可计算节目收视率。这样组合运用这些数据,就可以计算出一系列的收视率指标。下图(图1)列出了收视率指标的体系结构。

根据这一体系结构,收视率指标被区分为两大类,一类为基本指标,指各种计算口径的收视率,如按人计算的收视率、按户计算的收视率、按时段计算的收视率、按节目计算的收视率、按目标观众计算的收视率等。另一类为派生指标,包括反映市场结构的指标如收视份额(或称市场占有率)、观众构成等,反映节目收视量的指标如开机率、总收视点(GRPs)、平均收视时间、到达率和暴露频次等,反映节目收视偏好的指标如节目吸引力、观众重叠率、观众忠诚度等。这些指标有的更受电视台重视,因为其对指导电视节目编排更有意义;有的更受广告公司和广告主重视,因为其对测算广告投放成本、优化广告投放策略更有意义。

这些指标的计算都有明确的定义和公式。例如GGTAM中分别对总收视点、开机率、到达率、暴露频次、收视份额等主要指标定义如下:

总收视点(GRPs:Gross Rating Points):某项广告投放活动中各次插播点收视率的总和;

开机率(HUTs/PUTs:Household/People Using Television):某特定时间段内按户或按人的电视平均开机(不论看何频道)百分比;

到达率(Reach):作为观众收看某一系列节目或某一广告排期插播点至少一次的累积百分比;

暴露频次(Frequency):一个广告排期或一系列节目中观众的平均收看次数;

收视份额(Audience Share):某一规定时段内,某特定频道或节目的观众收视量占观众总收视量的百分比。

图1 收视率指标体系框架

由于收视率调查的数据量非常庞大,这些指标的计算一般都由专门的计算机软件自动完成。央视-索福瑞公司提供客户使用的收视率分析软件称作InfoSys,是TN Sofres集团开发的基于Windows系统平台的PC软件,集成了收视率指标计算和基于收视率进行广告优化排期等多项功能,可分别满足电视台、广告公司及广告主的不同使用要求。

二、收视行为与收视率

如前文所述,收视行为主要可以分解为开机行为、收视时间选择行为、频道/节目选择行为、持续收视时间选择行为等。收视行为是个体行为,每位观众的行为选择各不相同,但是通过统计调查的方式把这些个体行为集合于一起,就得到了一个观众群体的收视行为模式。由于收视数据记录的是所有被调查样本的个体行为结果,则通过汇总分析计算的各项收视率指标就成为该群体收视行为模式的集中反映。

例如,开机行为模式可以通过一个收视日的开机率变化图来反映。如图2所示,一个收视日的最高个人开机率(PUT)可达80%,表明最多有八成的电视人口在使用电视。晚间18:00以后的开机率每天的变化不大,上下午的开机率则星期日明显高于其他收视日。

图2 一周开机率走势(CSM2004年北京数据)

收视时间的选择行为可以从不同的时间尺度上加以考察。从一个日历年的角度看,收视时间选择行为的变化更多地体现为收视率随季节或重大事件的变化。如图3所示,冬季和夏季由于分别受春节和暑假的影响而表现为比春季、秋季更高的收视率,国庆、澳门回归等重大事件的电视直播节目也赢得了非常集中的收视。

图3 收视率在一年中的变化(CSM1999年60城市数据)

收视时间的选择行为也可以从一个收视日的角度考察,即从一个收视日的各个主要时段的收视率变化加以考察,如早间时段(一般指6:00-9:00)、上午时段(一般指9:00-12:00)、午间时段(一般指12:00-14:00)、下午时段(一般指14:00-18:00)、晚间黄金时段(一般指18:00-22:00)、晚间非黄金时段(一般指22:00以后)等。在上下午,周末比平日有更多的收视行为选择;晚间黄金时段和午间新闻时段则成为一个收视日里两个最突出的收视高峰,尤其是晚间黄金时段,最高收视率可达60%以上。

图4 收视率在一个收视日的变化(CSM1999年60城市数据)

频道/节目的选择行为主要表现为收视份额和节目收视率的变化。观众选择收看某频道某节目,将导致该频道该节目的收视率和收视份额增加。这就如同观众“投票”,收看你的频道/节目的观众越多,你得到的投票就越多,也就有更高的收视率和收视份额。图5以北京为例,显示了各频道收视份额的差异。图6以《环珠格格-第二部》电视剧在北京播出为例,显示了节目收视率和收视份额随不同播出日期的变化。

图5 北京地区1999年各主要频道的收视份额(CSM数据)

图6 《环珠格格-第二部》在北京播出的节目收视率和收视份额
(CSM1999年数据)

持续收视时间的选择主要表现为平均收视时长。有的人愿意消磨更多的时间在电视机前,而有些人则相反。平均收视时长就是这些人消磨于电视机前的平均时间。1999年CSM的调查结果显示,中国人平均每天收看电视达3个小时,和过去两年的调查结果接近(如图7);若分区域考察,东北地区观众的日平均收视时长最大,达198分钟;华北地区居其次,为193分钟;华东地区最低,168分钟;华中地区次低,174分钟;其他几个地区分别是,西南191分钟,西北188分钟,华南182分钟。

除此而外,基于收视率调查的其他一些分析指标,也可以用来描述和解释收视行为选择的模式与变化。但不管怎样,收视率调查数据只能用来统计和分析收视行为选择的结果,而不能够说明收视行为选择的原因。这恰是收视率调查的局限所在。

三、影响收视行为选择与收视率变化的因素分析

人们作出收视行为选择不是无缘无故的,其中施加影响的因素多种多样。但归纳起来不外有两类,一类来自收视主体__电视观众,这包括观众性别、年龄、婚姻家庭、居住地等人口属性因素以及文化程度、职业、收入、生活工作方式、性格爱好等社会属性因素;另一类来自收视客体__电视节目,这包括电视频道构成和节目编排、节目内容、节目时长、播出形式等。一般而言,第一类因素可称为收视行为的背景因素,而第二类因素则可称为收视行为的前景因素。由于收视率调查以受众研究为出发点,因而对收视行为背景因素的关注往往更多一些。

背景因素对收视行为选择的影响可以分别从微观(个体)和宏观(群体)角度加以考察。从微观的角度看,个体性别、年龄、文化程度、职业、收入等都是影响收视行为选择的显着因素。图8显示的是两性收视率一年变化的比较,虽然在变化模式上是一致的,但明显地女性收视率要高于男性。图9显示的是各年龄组观众收视率一年变化的比较,从图中可见4-14岁少儿观众的收视率除寒暑假外均明显地低于15-24岁的青少年观众以及15岁以上的成人观众。

从宏观的角度看,群体的人口规模与年龄结构、城乡结构、地区分布与地区差异(包括气温、社会习俗和经济状况的差异等)、人口的文化素质如识字率等都是影响收视行为选择的显着因素。例如从图4可看出收视率随季节变化的差异,而季节变化主要是气温变化。再如上文谈到的中国各大区观众在平均收视时长方面的差异,主要的也是南北差异即气温差异。图10显示的是统合考虑以上各宏观变量的影响后对50多个不同收视率调查地区的统计分类(聚类)及其收视率比较,从本图可以明显地看出宏观背景变量对收视行为选择和收视率变化的影响,因为不同宏观背景变量作用下的各类调查地区的收视率存在着明显的差异。

图8 两性收视率一年变化的比较(CSM1999年60城市数据)

图9 各年龄组观众一年收视率变化的比较(CSM1999年60城市数据)

图10 不同类型地区的收视率差异(CSM1998年数据)

前景因素对收视行为选择和收视率变化的影响也非常重要。图11显示的是频道构成对收视率变化的影响。从图中可见,省台和中央台的收视率要明显地高于市台、有线台和其他频道的收视率,从而仍占据着目前为止中国电视收视市场上的主力地位。图12显示的是时段结构对收视率变化的影响。从图中可见,19:00-22:00的黄金时段收视率要远高于午间时段、下午时段和上午时段。表1显示的是1999年北京地区电视节目收视率排名,用以阐释节目类型和内容不同所造成的收视率差异。从表中排名可见,电视剧类节目、娱乐类节目和新闻类节目赢得了观众较多的收视。

图11 各类电视台一年收视率变化的比较(CSM1999年60城市数据)

图12 各时段一年收视率变化的比较(CSM1999年60城市数据)

表1 北京地区1999年电视节目收视排名(CSM数据)

排名
频道
节目名称
类别
日期
收视率

收视额
%
注释(最高与最低
收视率%)

1
BTV-2
还珠格格第二部
电视剧
6.27/7.20
33.8
43
48 集 (45.7至22.2)

2
CCTV-1
春节联欢晚会
娱乐
2.15
26.1
54

3
BTV-1
新闻联播
新闻
10.27
22.6
60

4
CCTV-1
国庆晚会
娱乐
9.30
22.5
46

5
BC-1
少年英雄方世玉
电视剧
10.14/11.15
21.9
48
40 集 (27.7至18.7)

6
BC-1
康熙微服私访记
电视剧
3.19/4.6
21.3
49
30 集 (29.3至14.2)

7
BTV-2
鹿鼎记
电视剧
8.1/8.24
20.4
47
45 集 (26.4至14.3)

8
BC-1
小李飞刀
电视剧
11.8/12.10
18.1
40
40 集 (22.5至9.2)

9
BC-1
一代巡抚
电视剧
1.29/2.10
14.7
32
20 集 (20.1至11)

10
BTV-1
食神
电视剧
2.21/3.18
12
25

注:电视剧的收视率是指所有剧集的平均收视率

无论前景因素还是背景因素,对收视行为选择和收视率变化的影响都不是孤立的,而是内在有机地相联系,共同发挥影响作用。因此有研究者更构建了影响收视率变化的多元分析模型,将这些有关的因素归拢于一起来考察对收视行为选择和收视率变化的整体影响。但是由于收视行为选择的复杂性以及多元统计量化分析在解决社会科学问题方面的局限性,迄今这方面的研究都没有令人满意的结果。

四、电视观众满意度调查--拓展对收视行为的研究

通过前文的分析可以知道,收视率调查回答的是“收视行为如何”的问题,而不能够回答“收视行为为何”的问题。要知道观众为什么作出这样那样的收视行为选择,通过进行一些背景因素和前景因素的分析虽可略知一二,但都是间接的判断;要直接地从观众那里获得数据,就必须采用不同于收视率调查的一些调查方法。电视观众满意度调查即是其中的一种,国外和香港一般将之称作电视节目欣赏指数调查。这种收集观众对电视节目评价数据的调查,一方面能够用来对各类节目作出观众评价得分并比较(如按总体满意度或欣赏指数之类的指标进行排序),另一方面也可直接分析观众收视的内在原因即对电视节目品质的欣赏。

观众满意度调查或者欣赏指数调查可以采用不同的方法,收集到的数据可以是连续的,也可以是间断的。连续收集数据的方式多为日记调查法,就象收视率调查一样,每周将日记卡送达被访者,由被访者对当周每一天所收看的节目进行评价。也可以采用问卷调查法,这时调查是间断的,例如每个季度或者每个月进行一次调查。调查问卷由访问员入户访问,记录观众过去三个月或者一个月对所列频道或栏目的评价。

满意度调查(或欣赏指数调查)的指标可以简单到只调查观众对当期节目的评价分(如采用5级评分制或百分评分制)和收看这个节目的主动程度;也可以设计较为复杂的指标体系,进行更深入的调查。例如可以分别就频道和栏目设计调查指标,从而形成频道满意度指标体系和栏目满意度指标体系,既获得观众对频道的总体评价和收视特征,也可以对所关心的具体栏目逐一给出评价。

尽管满意度调查和收视率调查所解决的受众研究课题不同,但是它们之间的关系密不可分,值得关注。有研究者将它们之间的关系用图13来表示(注1),并将电视节目区分为“叫好叫座”、 “叫好不叫座”、“不叫好叫座”和“不叫好不叫座”四种。其中“叫好不叫座”和“不叫好叫座”是一个问题的两个方面,概括的是收视率和满意度逆向变化的情况,其所隐含的一个经验性假设是:高收视率节目的满意度(欣赏指数)可能并不高,因为此类节目的观众多,他们既可能是“忠实”观众,也可能是“随机”观众,前者倾向于给节目高分,后者却会给较低分,无形中拉低了整体分数;而观众较少的节目却有可能获得较高的满意度(欣赏指数),因为在能够自由行使选择权时,如果某些观众宁愿放弃收看热门的电视节目而选择小众节目,表明他们对这个节目的题材或表达方式,会有一定程度的欣赏。换句话说,观众较少收视率较低的节目,可能会有较高的满意度(欣赏指数)。

“叫好叫座”和“不叫好不叫座”概括的是满意度与收视率同向变化的情况,其所隐含的则是与上述不同的另一个经验性假设:收视率可以代表满意度(欣赏指数),一档节目获得高收视率,意味着观众对此节目比较喜欢。有研究发现(注2),节目的“叫好”与“叫座”与节目自身的类型相关。

图13 观众满意度与收视率的关系

和收视率一样,满意度也受到观众背景变量的影响。英国有研究显示,满意度(欣赏指数)受观众年龄、性别和社会阶层的影响。最年幼和最年长的观众倾向于给予节目较高的满意度评分,而中青年观众则很难讨好,他们不轻易对电视节目打高分。从性别来看,女性比男性慷慨,乐意给电视节目更高的评价分。低下社会阶层的观众比较容易满足,倾向于给予电视节目较高评分,而中上阶层则比较挑剔。香港的研究则发现,在年龄方面,老年观众较多的节目满意度(欣赏指数)较高,年轻观众较多的节目则相反,满意度(欣赏指数)只是局部受观众年龄的影响,与性别和教育程度并无显着关系。

我们知道,收视率高低受许多因素的影响,其中时段因素的影响颇大,同样一档节目安排在不同时段播出,收视率可能会有相当大的差距。然而,满意度(欣赏指数)与节目播出时间无甚关系。香港的调查曾经显示,黄金时间播放的节目比非黄金时间播放的节目有更高的满意度(欣赏指数),但是这个关系可以用其他变量来解释。一般来说,好的节目即使被安排在不太好的时段播出,只会影响其收视率,而不大会影响其满意度(欣赏指数)。此外,香港的研究还发现,满意度(欣赏指数)与节目时长和制作者无关。由此可见,满意度(欣赏指数)是一个比较稳定的测量指标,并非收视率的附属品,是描述收视行为的另一种工具,是对收视行为研究的进一步拓展。

Ⅲ 用数据说话:数据分析的基本思想是什么

用数据说话:数据分析的基本思想是什么

今天分享一下数据分析的一些基本思想,我给它起了个名字叫做用数据说话。内容都是个人的一些心得,比较肤浅!如有不足之处,希望大家谅解!废话不说了,现在咱正式开始。
用数据说话,就是用真实的数据说真实的话!真实也可以理解为求真务实。那么,数据分析就是不断地求真,进而持续地务实的过程!用一句话表达就是用数据说话,用真实的数据说话,说真话、说实话、说管用的话。
1.用数据说话
数据本不会说话,但是面对不同的人时,就会发出不同的声音。现在我们以《荒岛售鞋》这个老故事为引例,从数据分析的角度来解读,看看能不能开出新花?为防止大家案例疲劳,我尽量用新的表达方式把故事罗嗦一下!
话说郭靖和杨康,被成吉思汗派去美丽的桃花岛进行射雕牌运动鞋的市场拓展。郭靖和杨康一上桃花岛就惊讶地发现这里的居民全部赤脚,没有一个穿鞋的,不论男女还是老少,莫不如此。杨康一看,倒吸了一口凉气,说:唉!完了,没啥市场!郭靖却不这么认为,马上掏出了新买的IPHONE4G给铁木真打了个长途加漫游的汇报电话。面对桃花岛这个空白的市场,郭靖电话里这么说:“桃花岛人口众多,但信息闭塞。现在全岛居民,全部赤脚。在运动鞋市场上没有任何竞争对手,茫茫蓝海,市场将为我独霸!可喜,可喜啊!”这个时候,咱现场做个调查,假如你是成吉思汗,你会怎么抉择?(投资Y1人,不投资的N1人。)
这个时候杨康听不下去了,马上抢过电话,说到“大汗,别听郭靖瞎嚷嚷!市场虽然没有竞争,但并不就一定是蓝海。在全球化竞争的大背景下,这么轻而易举的就让我们找到了蓝海,您觉得可能吗?难道阿迪、耐克、彪马、锐步这些国际巨头都是棒槌,会发现不了?我看肯定是岛上几百年不穿鞋的生活习惯,短期内无法改变,所以各路群雄,都只能望而止步!可惜,可惜啊!”听了杨康的论述,铁木真又该如何选择呢?请大家举手表态。(愿意投资Y2人,不愿意投资的N2人。)姜是老的辣!成吉思汗比较理性,他只说了一句:“继续调研,要用数据说话!”就把电话挂了!
一个星期之后,杨康率先给BOSS汇报了。不过他没有选择打电话,而是改发E—MAIL。原因有三:一是全球通资费太高了,钱要省着点花;二是杨康有点小人,他担心郭靖听了他的表述后,剽窃他的思想;三是他写了一份详细的调研报告,电话里三言两语说不清。杨康的调查报告里详细地记录了他与岛内精心选取的200位居民的谈话内容,以及他抽取居民样本时科学合理的甄别条件,最后的结论就是:岛内居民全部(100%)以捕鱼为生,脚一年四季泡在水里,根本就不需要鞋!听到这个消息,成吉思汗怎么办呢?请大家继续举手表态!(愿意投资Y3人,不愿意投资的N3人。)
成吉思汗有自己的想法。这个时候,他没有做决策,而是继续等。等什么呢?等郭靖的结论!又过了两天郭靖终于打来了电话。电话里说了3句话:“这个市场可以做!原因是岛上的居民每周都要上山砍柴,并且十有八九会被划破脚!更可喜的是,这两天他用美男计泡到了岛主的女儿黄蓉,而且黄蓉答应给射雕牌运动鞋作形象代言!”故事发生到这个阶段,我请大家做最后一次表态。(愿意投资Y4人,不愿意投资的N4人。)
好!数据在变,我们的决策也在变。不过,成吉思汗比我们理性的多。回答还是一句话,不过比第一次多了几个字:“继续深入调研,用详实数据论证。”为什么呢?难道这些数据还不够详实吗?是的!因为在成吉思汗脑袋里还存在有很多疑问。比如:
1) 难道竞争对手真的没来过?还是对方论证后真的不可行?
2) 山上不会开个伐木厂吧?如果有了伐木厂,居民就不会上山砍柴了,到时候送柴上门,鞋还有个屁用啊!
3) 为什么一周才上一次山?该不会主要使用的是太阳能吧?
4) 运动鞋的运输成本、营销成本、销售成本是多少?投资收益率有多高?
5) ……
听完这个案例,我想问大家一个问题!从数据分析的角度看,你受到了什么启示?请注意这里说的数据分析的角度,如果你得到的启示是:铁木真领导的郭靖与杨康不是1个老男人+2个帅小伙的Gourp,而是教练型的Team。那么,抱歉!这不是我们今天讨论的范围。好,在座的各位谁来表达一下自己的看法呢?提示性的启示有:
面对同一个数据,不同的人会说不同的话。
真实的数据并不一定能推导出正确的结论。
正确的决策需要有充分的数据去论证。
……
说完了启示,咱把这页PPT总结一下。这个案例涉及数据的搜集、分析、汇报以及用于决策的整个过程。在这个过程里,无论那个细节出了问题,最终做出的决策都将是致命的!所以说质量是数据的生命,在数据用于决策的整个过程,都必须保证真实有效!
2.用真实的数据说话
所谓用真实的数据说话,就是指在说话之前,先审核数据的真实性!现实生活中,拿着错误的数据还能大言不惭的可以说比比皆是。其中有两位杰出的代表:一个是传说中伟大的中国统计局,另一个就是动不动就要封杀这个封杀那个的CCTV。我不是瞎说,因为有数据支撑!
2010年1月20日,国家统计局公布了2009年全国房地产市场数据,全年房价平均每平方米上涨813元。够雷人吧!雷声还没过,霹雳紧跟着又来了!2月25日国家统计局发布了《2009年国民经济和社会发展统计公报》,数据显示,70个大中城市房屋销售价格上涨1.5%。真可是天雷滚滚!难怪网友把统计局票选成大天朝的娱乐至尊!
此话一出,央视不答应了!真所谓中国统计,娱乐至尊;央视不出,谁与争锋?那我们仔细推敲一下央视的数据。2010年2月15日,CCTV发布了虎年春晚的满意度报告,结果显示满意度为83.6%。几乎同一天,新浪的公布的调查结果是14.55%;后来没几天,腾讯也发布了满意度数据,结果是10.48%。数据一出,网友们骂声不断,此起彼伏,一浪高过一浪。但是人家央视就是央视,大有敌军围困万千重,我自岿然不动的定力。更夸张的是央视不但能装作视而不见,充耳不闻,而且还继续恬不知耻地在自己家的那几个频道里卖弄数据,自娱自乐。到底央视的数据错在哪里?我们先审视一下央视的调查方法。
央视的调查结果,来自央视——索福瑞媒介研究有限公司。索福瑞号称他们电视观众满意度调查的样本覆盖了全国30个城市,抽样框总人数有30,000人,央视春晚满意度的调查就是从这3万人中随机抽取了2122人进行调查。这样看,严格意义上讲所谓83.6%的满意度只能代表3万人的看法。当然,如果我拿这个说法与央视理论,对方肯定能拿出3万代表全国的理论证据。具体就是先从2千推断3万,再用3万推及到30个城市,然后从30个城市推及至全国所有城市,最后再推及至全国。这里用到了简单随机抽样、分层抽样、典型抽样,总起来还是个多阶段抽样,多么冠冕堂皇的理论依据!但是,纵然每一步都能保证90%的可靠程度,四次推及下来理论的可靠程度也只有65%。可遗憾的是,最后一步用城市推及全国的做法在理论上还有一道坎,因为我们不知道如何用45%的城镇居民来代表55%的农村人口?
说完了代表性的问题,我们再看看调查方法。索福瑞采用的是电话调查,而且时段选择在春晚直播的那几个小时内。据说调查是从晚上8:30开始,一直持续到春晚结束。巨汗!8:30貌似90%的节目还没有上演,又怎么能调查到观众对整个春晚的满意度呢?
央视的数据是经不住推敲的!那么,新浪和腾讯的一定对吗?不一定,这两个数据也只能代表新浪用户和腾讯用户的春晚满意度,最多能够代表一下4亿网友,要想替13亿的中国人民表达心声,也恐怕是鞭长莫及。
欣赏了统计局和CCTV送给我们的两个开年笑话之后,我们自己也应该反思,咱们日常工作中,在从数据的搜集、提取、整理到分析、发布、使用的这一连串过程中,数据有没有失真?是不是数据自始自终都很齐全、很准确,而且统计口径与分析目的保持着高度的一致呢?这个问题留到日常工作中供大家思考。
3.说真话说实话
拿着错误的数据,肯定得不出正确的结论。那么面对真实的数据,就一定能得出正确的结论吗?未必!给大家看个小笑话。
问:你只有10平米的蜗居,邻居家从90m2换到190m2,你的居住面积有没有增加?
答:没有。
解:错,你们两家的平均居住面积是100m2,你的居住面积被神不知鬼不觉地增加了!
这个神不知鬼不觉是谁呢?无敌的平均数!仔细想想,这个均值算错了吗?没有!那么,问题出在哪里?单一的统计量存在片面性,所以要想反映数据的真实面貌,就得使用一系列统计量。
我再杜撰一个气候的例子,说明一下在结构严重失衡的情况下,使用平均数的可怕之处。我们的大中国啊,960万平方公里,同一时间里有的刮风,有的下雨,还有的高温酷暑。从去年冬天到今年的春天,北方一直暴雪连天,南方则遭遇百年旱情;而最近这段时间,南方多个省市河水决堤,沿河两岸,村庄沦陷,而北方则是烈日当头,干旱焦人,酷暑难耐。如果我们计算全年或者是全国降雨量的平均值,算出来的结果肯定是神州大地风调雨顺,国泰民安,而实际却是华夏民族饱经风霜,多灾多难!
还好,统计学家不只给了我们平均数,同时还设计了许多其他的统计量,大家看看下面这个表。

衡量数据的集中趋势,基本有三个统计量,均值、中位数和众数。均值是数值平均数,它容易受极端值的影响。也就是说如果数据的跨度或者说是极差不大的话,用均值可以很好的反映真实情况。但是,如果数据的差异比较大,单一使用平均数就会搞出新的笑话了。中位数和众数属于位置平均数,中位数是把数据从小到大排序,正好处于中间位置的那个数,众数是说出现的频次最多的那个数。
数据除了有集中趋势,还有离散趋势。反映离散趋势的统计量主要有方差、标准差、极差、变异系数等。方差就是观测值与均值差的平方和除以自由度,自由度一般是n或n-1。总体数据就用n,抽样数据就用n-1。标准差就是方差的正平方根,它的意义是消除了量纲的影响。极差是最大值与最小值的差,反映的是观测值的跨度范围。还有一个比较重要也是比较常用的就是变异系数,它是标准差与均值的比,目的是消除数量级的影响。
此外,还有一些是描述数据分布的统计量,比如分位数,有四分位、八分位、十分位等等,二分位就是中位数,它们反映一系列数据某几个关键位置的数值。频率分布,就是对数据分组或者是分类后,各组或各类的百分比。偏度是用于衡量分布的不对称程度或偏斜程度,峰度是用于衡量分布的集中程度或分布曲线的尖峭程度的指标。
如果想再深入一些的话,就会用到相关系数、置信水平、统计指数等等。相关系数是反映变量之间线性相关程度的指标,取值范围是【-1,1】,大于0为正相关,小于0为负相关,等于0表示不相关。置信水平是指总体参数值落在样本统计值某一区内的概率。统计指数就是将不能直接比较的一些指标通过同度量因素的作用使得能够比较,常见的物价指数、上证指数等等。
有了这些基本的统计量,我们在实际工作中只要稍微用心选择一下,就可以比较准确的描述数据的真实情况。
4.说管用的话
说管用的话是指深入分析数据的实质,挖掘数据的内涵,而不是停留在数据的表层,说些大话、空话或者套话。这就要求在数据分析时,首先明确分析的目的,其次是选择恰当的方法,最后得出有用的结论。通俗地说,说管用的话,就是不说屁话,少说废话!
4.1明确分析目的
这里我们举个例子。我想这个例子的时候正好是7月7号,N年前的那个时候,正好是在座的各位高考的日子,所以就杜撰了一个高考的数据。

我们这个班级,虽然成绩很烂,800分的总分,平均成绩只有486分,但是人才辈出,名字一个比一个响,人气一个比一个旺。大家先认识一下,有饱读四书五经,满腹经纶的关东秀才吕轻侯;有篮球场上进攻犀利,防守严密的小飞侠科比;还有足球场上无论是边路传中还是抢点射门都有非常出色的C罗纳尔多;有喜欢烟熏妆、蓝丝袜加高跟鞋出镜的伪娘刘着,有被亿万网友烧香膜拜的春哥党教主李宇春,还有经常抱着吉他哼着绵羊音的90后MM曾轶可;以及自称冰清玉洁、妖媚性感、擅长爆发性舞蹈动作的芙蓉姐姐和非清华北大经济学硕士不嫁、奥巴马也可的重庆籍奇女子罗玉凤!
基于学生的考试成绩,不同的人会关注不同的方面,高考的判卷老师会关心试卷的雷同程度,命题人会测试考卷的信度和效度,研究文理分科的专家会计算文理成绩的相关程度。但是对于普通中学,通常只会关心两个方面。一是学生成绩,计算升学率;二是教学水平,给优秀教师发奖金。如果高中的教学科在这里研究文理相关就属于废话,如果还要把问卷的信效检验也扯出来就是屁话了。
关于学生:
吕秀才:总分722分,班级第一,平均成绩超过90分,如果将其他同学的水平比作三层小楼的话,吕秀才应该是站在赛格顶上!奇才,上清华北大没有问题。
科比和C罗:总分550左右,平均不到70分!属于班级2号、3号人物,但成绩确实不咋地,不过在该班级中也算鹤立鸡群了。
刘着、李宇春、曾轶可:成绩较差,上学肯定不是她们的出路!基于平时性情怪异,男的像女,女的像男,还有一个像绵羊,建议别走高考这条寻常路,还是去湖南卫视选秀吧。
凤姐、芙蓉:这成绩,就是个脑残,估计脑袋不是被门挤过,就是被驴踢过!
关于老师:
衡量教师的优劣需要剔除异常值,吕秀才就是!吕秀才属于成绩异常出众,个人素质极高,所以他的成绩不应该成为衡量老师优劣的样本。
语文均值高,变异系数小!由此看出语文老师真是好老师!该发奖金!
同理,历史老师也不错!也应该适当奖励。至于物理老师,太差,得赶快换掉,绝对不能让他继续误人子弟了!
存在疑问的就是英语老师。英语成绩的均值较高,但变异系数大。这说明数据里可能存在极端值。可能的异常值是科比与C罗。科比美国人,外语自然好!C罗葡萄牙人,但从2003年到2009年一直在英国留学,6年啊,英语好也是应该的!所以,科比与C罗的英语成绩不能算是英语老师的栽培,所以科比和C罗是异常值,应该剔除。那么,剔除异常后就会发现英语的均值只有47分!说明英语老师并不能算做好老师,所以只能与奖金无缘了!
4.2选择恰当的方法
接上面的案例。如果我们是研究高中该不该进行文理分科的有关部门,那么我们该如何分析文理成绩之间的相关性?
举例1:如何计算文理科之间的相关性。
目前基本有三种方法,一是简单相关分析,二是典型相关分析,三是潜变量相关分析。
简单相关分析就是通过加总,分别计算出文科成绩总和、理科成绩总和,然后计算两者的简单相关系数。
典型相关分析主要用于衡量两组变量之间的相关性。它的基本原理是:为了从总体上把握两组指标之间的相关关系,分别在两组变量中提取是的相关系数最大的一系列典型变量,然后通过计算各对典型变量之间的相关性,来反映变量间的相关程度。
潜变量相关就是计算潜变量之间的相关系数。所谓潜变量是相对于显变量或者测量变量而言的。潜变量是实际工作中无法直接测量到的变量,包括比较抽象的概念和由于种种原因不能准确测量的变量。一个潜变量往往可以有多个显变量,潜变量是可以看做是其对应显变量的抽象和概括,显变量则可视为特定潜变量的测量指标。在文理科相关性的分析中,我们可以将文科、理科看成潜变量,将语文、外语、政治、历史这四个显变量看成文科的测量指标,将数学、物理、化学、生物这四个显变量看成是理科的测量指标,那么求文理成绩之间的相关问题就转化成潜变量之间相关的问题。
那么。我们究竟该选用哪种方法呢?或者假如说我们同时使用了上面三种方法,求出相关系数,该选择哪一个呢?比如我们计算的结果分别是0.35(简单相关)、0.85(最大典型变量)、-0.65(潜变量相关),这个时候我们到底该相信哪个数据呢?
其实,我更愿意相信简单相关计算的结果。原因如下:
1、简单相关,既简单又易理解。
2、典型相关的取值范围是【0,1】,它计算出的结果没有正负,只有大小。与我们实际研究目的有悖。我们想知道学生是否在文理课程上均衡发展,所谓均衡就是正相关,所谓不均衡就是负相关。而典型相关做不到。
3、潜变量相关虽然取值范围是【-1.1】,但是它多数是采用主成分的方法拟合潜变量,而依据方差提取最大主成分的过程与我们的分析貌似不甚吻合。
4、最重要的是,其实简单加总与典型相关、主成分相关拥有同一个思想,就是先把多个变量拟合成一个变量(或几个),然后分析这个拟合出来的变量之间的相关性。其实,在量纲、数量级相同的情况下,而且权重也容易计算的情况下,最简单有效的拟合就是加总!所以我认为简单加总后计算出的相关系数是最有效。而潜变量、典型变量是在量纲或数量级不等的情况下,衡量多个变量之间相关关系的有效方法。
举例2:计算硬币正反概率
最后,再给大家做道选择题。
问题:如果一枚硬币连抛10次都是正面,问第11次出现正面的概率是多少?
选项:A. 接近0% B.50% C.接近100% D. 以上答案都不对
一个硬币连抛10次都出现正面的概率是0.510,绝对的小概率事件。在一次实验中,小概率事件发生,那么我们就应该拒绝原假设。原假设是什么?硬币出现正反的概率是0.5。所以,我们可以大胆地推断,硬币本身就是一个两面都是正面的硬币,所以说第11次出现正面的概率是100%,或者接近100%。大家是不是有异议呢?
树上10只鸟,猎枪一枪打死1只,树上还剩0只的结论大家都应该同意吧。因为我们考虑的是实际问题,不是10-1=?的数学算式。所以大家在幼儿园的时候就知道枪声响过,树上一只鸟都不会剩。试想,你和你的朋友打赌投硬币猜正反,如果10次之后朋友投出来的都是正面,你会怎么想?兄弟你出千了吧,硬币肯定有问题吧!相信用不了10次,你就会提出这样的质疑了。如果说计算概率,0.5没有错,独立事件发生的概率不因之前的情况而改变。但是,如果用假设检验的思想,100%的结论就更合理了。之所以说0.5的结果不对,不是说你的计算出错了,而是在解决实际问题的时候,你太教条了,太书本了,从而选错方法了。
5.最后总结
我的分享结束了,大家也听了也笑了,但是笑过之后务必记住我啰嗦了一个小时的这句话:用数据说话就是用真实的数据说话,说真话、说实话、说管用的话!最后说一句废话:希望刚刚过去的1个小时没有浪费大家的时间。

Ⅳ 中央电视台怎样统计收视率

■收视率是如何产生的?

目前采用的收视率数据采集方法有两种,即日记法和人员测量仪法。日记法是指通过由样本户中所有4岁及以上家庭成员填写日记卡来收集收视信息的方法。样本户中每一家庭成员都有各自的日记卡,要求他们把每天收看电视的情况(包括收看的频道和时间段)随时记录在自己的日记卡上。日记卡上所列的时间间隔为15分钟。每一张日记卡可记录一周的收视情况。

人员测量仪法是指利用“人员测量仪”来收集电视收视信息的方法,是目前国际上最新的收视调查手段。样本家庭的每个成员在手控器上都有自己的按钮,而且还留有客人的按钮。当家庭成员开始看电视时,必须先按一下手控器上代表自己的按钮,不看电视时,再按一下这个按钮。测量仪会把收看电视的所有信息以每分钟为时间段(甚至可以精确到秒)储存下来,然后通过电话线传送到总部的中心计算机\(或通过掌上电脑入户取数据\)。

收视率多久能够出来?有的是一周,有的是两周,有的是一天。刘燕南说,这主要取决于采用什么样的测量方法,如果采用日记法,因为要对数据进行收集和分析,最快需要一周,一般需要两周;如果采用人员测量仪法,因为电话线可以即时回传数据,因此能够做到隔一天就能够提供收视数据,只是人员测量仪成本比较高。

■电视剧收视率能否和《新闻联播》比较?

如今,越来越多的电视剧在提供收视率时采用这样的提法:某一部电视剧的收视率仅次于《新闻联播》,这种比较方法是否具有科学性?

刘燕南认为,两者没有可比性,首先电视剧和《新闻联播》不在同一个播出时段;其次,两者面临的不是同一个市场,《新闻联播》面向全国,而更多的电视剧是区域性的,面向一个省或者一个城市,“之所以会出现这样的提法,主要是在大家的印象中《新闻联播》的收视率很高,想以此来证明该电视剧的收视率很高,但最好不要做这样的比较。”其次,刘燕南介绍,在某些地方,一部电视剧的收视率可能高于《新闻联播》,比如《还珠格格》在某些地方的收视率达到60%,因为《新闻联播》是面向全国的,统计的基数太大。

那应该拿什么数据作为某一部电视剧收视率的比较标准呢?刘燕南说,业内一般都是以央视一套黄金时段所播电视剧的收视率作为比较的标准,或者以某一部有代表性的、曾经创造过收视神话的电视剧作为衡量标准。

■央视索福瑞和AC尼尔森提供的收视率为何不一样?

央视—索福瑞媒介研究公司和AC尼尔森公司是中国目前最主要的两家收视率调查公司。据业内人士分析,在电视收视率市场上,央视—索福瑞占据了全国85%左右的市场份额,AC尼尔森公司占据10%左右,另外两家比较大的公司是AC尼尔森媒介研究和上海的广播电视信息咨询有限公司。

业内人士经常会有这样的印象,即使是同一地区同一时段同一部电视剧,AC尼尔森和央视—索福瑞媒介研究提供的收视率数据并不相同,有时还相差挺大。比如央视一套播出的《浪漫的事》,尼尔森的平均收视率是7%,而央视—索福瑞则为6%;又如2000年1月1日到9月23日杭州地区《新闻联播》的平均收视率,央视—索福瑞提供的数据是22.1%,AC尼尔森为4.6%。究竟哪一个数据更加准确呢?

记者在采访中发现,对于调查公司来说,这是一个敏感的话题。一位不愿透露姓名的业内人士告诉记者,这主要是因为测量手段不一样造成的:日记法和仪器测量法的结果肯定会有差异,应该说仪器测量法更准确一些,日记法往往是通过事后回忆来填写的,因此误差会大一些,而人员测量仪数据可以精确到1分钟,这样得到的收视率就会低很多。此外,由于样本户数不同、采用的计算体系不一样等,也会造成收视率不一样,“一般来说,虽然数字不一样,但趋势应该是一致的,否则用户就会糊涂了。”

■哪些因素影响收视率?

央视-索福瑞媒介研究公司的毕江燕则分析了影响电视剧收视率的五种因素:①地区因素。《刘老根》在东北的收视率高达22%,在南方却只有几个百分点。②季节因素。2002年的12个月中,前五个月平均收视率为3.66%,6月份是电视剧收视的低谷,只有2.82%。暑假收视率有了回升,并达到了全年的最高点3.85%。③时段因素。在收视上表现最好的则是19:00-20:00这个时段,收视率超过了5%,从这里可以看出,时段在很大程度上决定了电视剧的收视率。④频道因素。同一部电视剧在不同频道播出,它的收视率也不同。比如《橘子红了》在甘肃一套(省级频道)播出时收视率为13.97%,福建电视台电视剧频道(有线频道)播出时收视率为7.37%,中央八套(中央级频道)播出时收视率为7.29%。⑤播出轮次因素。同样在武汉地区播出的电视剧《康熙微服私访记第四部》,2002年10月份在武汉二套播出时收视率9.39%,而在11月份武汉四套播出时收视率不到4%。

阅读全文

与央视如何表达数据相关的资料

热点内容
交易猫腾讯号已发货多久交易成功 浏览:324
中国基因技术如何 浏览:877
化妆品批发代理商需要什么资质 浏览:25
p城的技术怎么样 浏览:109
技术类体操的基础技术是什么 浏览:18
网络登不上了如何查询以前信息 浏览:898
陌陌如何设置拒绝接收信息 浏览:127
阳泉二手车市场哪个好 浏览:354
绿通网络预约通过哪个小程序 浏览:971
物流企业的信息反馈效率如何 浏览:877
赤峰调料批发市场在哪里 浏览:20
复制的程序为什么运行错误 浏览:571
大数据下载在哪里 浏览:918
选款标准数据是什么意思 浏览:665
行驶证能查询车辆什么信息 浏览:798
客户问如何知道你的产品是正品 浏览:501
什么是重命名数据类型 浏览:766
作为产品经理如何写app的逻辑 浏览:123
小米换机怎么选择第三方应用程序 浏览:248
酒店代理怎么推广 浏览:857