導航:首頁 > 數據處理 > 央視如何表達數據

央視如何表達數據

發布時間:2023-02-10 17:27:07

Ⅰ 央視為《人民的名義》點贊,卻點名《三生三世十里桃花》數據造假

最近,反腐大劇《人民的名義》激發了觀眾的追劇狂潮,該劇沒有小鮮肉,也不是大IP,積累播放量已經達到35億,在央視的采訪調查中,該劇的出品人明確表示:「該劇從播出到現在,沒有買過點擊率和收視率」。

但同樣是人氣作品,35億這個數據,相比於前段時間大火的《三生三世十里桃花》可謂是小巫見大巫,因為《三生三世十里桃花》33天58集就創造了309億的全網播放量。其中,2月22號到23號這一天,點擊率高達14億,這就意味著得「四海八荒」7億網民都來刷兩遍才行。

這高數據的背後也引起了人們的質疑,央視也獨家去調查了關於數據真實性的問題,據業內人士反應:「流量造假已經變成一個公開的秘密了,就是地球人都不夠用了,動都不動一天就有好多億,全是假的嘛!」

同時,央視還到一家第三方數據監測公司進行調查,分析《孤芳不自賞》2月23號的數據,該數據的曲線基本上是平的,違背了人們的生活規律,正常的曲線應該是中午和晚上會有一些小高點,該公司的負責人還表示:「就這一部劇來說,它的水分大約在90%」。

實際上,流量造假已經是行業內公開的秘密,虛假流量的背後暗藏一條龐大的利益鏈條,據央視報道,刷量這個現象,不僅是片方去刷,其實平台方、營銷方和發行方都會參與到整個刷量的過程中來。

央視在采訪過程中,還讓技術人員演示了刷流量的過程,那速度之快,真是觸目驚心啊!看了這么多,也希望電視劇行業能夠多一點真誠,少一點套路,多像《人民的名義》學習,畢竟流量和口碑都很重要,想要做好這兩點,用心拍電視,給觀眾一份滿意的答卷,觀眾也會回你一份熱枕!

Ⅱ 央視的收視率怎麼算的!

收視率調查記錄的是觀眾收視行為結果,而非收視行為本身。但是通過對結果的分析,完全可以透視收視行為,以及分析影響收視行為變化的因素有哪些。簡單地說,收視行為即選擇,包括看與不看的選擇,什麼時間看的選擇,看什麼頻道什麼節目的選擇,看多長時間的選擇,以及如何看(伴隨行為)的選擇。行為選擇的結果通過日記法或人員測量儀法記錄下來,成為計算收視率和研究收視行為的基礎數據。
由此可見,從收視率調查數據出發進行收視行為研究,首先要做的是把原始收視數據經過有效的整理、匯總和歸納,形成收視率指標,然後研究收視率所透視的收視行為模式,研究影響收視率變化和收視行為選擇模式形成與改變的諸種因素,研究收視率在反映收視行為方面的局限性以及突破辦法。

一、基於調查數據計算收視率指標

收視率調查數據包括兩部分。一部分是被調查者(被調查個人及其所屬戶)的背景資料數據,包括性別、年齡、職業、文化程度、個人/家庭收入、個人/家庭資產、家庭規模、家庭角色關系、家庭收視設備佔有情況和電視接收情況、基本生活態度和休閑選擇、工作情況、居住地區、使用語言等。這部分數據主要通過樣戶入網調查得到,成為進行收視率計算和分析的背景數據。另一部分是通過日記法或人員測量儀法記錄到的被調查者個人的電視收視數據,具體即有電視的家庭戶(樣本戶)中每位成員(年齡4周歲及以上的被調查者)在每天連續的24小時內每15分鍾(人員測量儀為每分鍾)收看或不收看電視以及收看什麼頻道的記錄信息。

另外還有一部分數據不屬於收視率調查數據,也就是說不是從樣戶調查得來的數據,但對收視率計算與分析也至關重要,這就是電視頻道屬性數據和電視節目播出數據。這部分數據一般由電視台提供或通過電視監播得到。

有了以上三部分數據,就使得收視率指標的計算成為可能。只根據電視收視數據可以計算總收視率及分時段分頻道的收視率;如果結合背景資料數據,則可計算分目標觀眾收視率;如果結合電視節目播出數據,則可計算節目收視率。這樣組合運用這些數據,就可以計算出一系列的收視率指標。下圖(圖1)列出了收視率指標的體系結構。

根據這一體系結構,收視率指標被區分為兩大類,一類為基本指標,指各種計算口徑的收視率,如按人計算的收視率、按戶計算的收視率、按時段計算的收視率、按節目計算的收視率、按目標觀眾計算的收視率等。另一類為派生指標,包括反映市場結構的指標如收視份額(或稱市場佔有率)、觀眾構成等,反映節目收視量的指標如開機率、總收視點(GRPs)、平均收視時間、到達率和暴露頻次等,反映節目收視偏好的指標如節目吸引力、觀眾重疊率、觀眾忠誠度等。這些指標有的更受電視台重視,因為其對指導電視節目編排更有意義;有的更受廣告公司和廣告主重視,因為其對測算廣告投放成本、優化廣告投放策略更有意義。

這些指標的計算都有明確的定義和公式。例如GGTAM中分別對總收視點、開機率、到達率、暴露頻次、收視份額等主要指標定義如下:

總收視點(GRPs:Gross Rating Points):某項廣告投放活動中各次插播點收視率的總和;

開機率(HUTs/PUTs:Household/People Using Television):某特定時間段內按戶或按人的電視平均開機(不論看何頻道)百分比;

到達率(Reach):作為觀眾收看某一系列節目或某一廣告排期插播點至少一次的累積百分比;

暴露頻次(Frequency):一個廣告排期或一系列節目中觀眾的平均收看次數;

收視份額(Audience Share):某一規定時段內,某特定頻道或節目的觀眾收視量占觀眾總收視量的百分比。

圖1 收視率指標體系框架

由於收視率調查的數據量非常龐大,這些指標的計算一般都由專門的計算機軟體自動完成。央視-索福瑞公司提供客戶使用的收視率分析軟體稱作InfoSys,是TN Sofres集團開發的基於Windows系統平台的PC軟體,集成了收視率指標計算和基於收視率進行廣告優化排期等多項功能,可分別滿足電視台、廣告公司及廣告主的不同使用要求。

二、收視行為與收視率

如前文所述,收視行為主要可以分解為開機行為、收視時間選擇行為、頻道/節目選擇行為、持續收視時間選擇行為等。收視行為是個體行為,每位觀眾的行為選擇各不相同,但是通過統計調查的方式把這些個體行為集合於一起,就得到了一個觀眾群體的收視行為模式。由於收視數據記錄的是所有被調查樣本的個體行為結果,則通過匯總分析計算的各項收視率指標就成為該群體收視行為模式的集中反映。

例如,開機行為模式可以通過一個收視日的開機率變化圖來反映。如圖2所示,一個收視日的最高個人開機率(PUT)可達80%,表明最多有八成的電視人口在使用電視。晚間18:00以後的開機率每天的變化不大,上下午的開機率則星期日明顯高於其他收視日。

圖2 一周開機率走勢(CSM2004年北京數據)

收視時間的選擇行為可以從不同的時間尺度上加以考察。從一個日歷年的角度看,收視時間選擇行為的變化更多地體現為收視率隨季節或重大事件的變化。如圖3所示,冬季和夏季由於分別受春節和暑假的影響而表現為比春季、秋季更高的收視率,國慶、澳門回歸等重大事件的電視直播節目也贏得了非常集中的收視。

圖3 收視率在一年中的變化(CSM1999年60城市數據)

收視時間的選擇行為也可以從一個收視日的角度考察,即從一個收視日的各個主要時段的收視率變化加以考察,如早間時段(一般指6:00-9:00)、上午時段(一般指9:00-12:00)、午間時段(一般指12:00-14:00)、下午時段(一般指14:00-18:00)、晚間黃金時段(一般指18:00-22:00)、晚間非黃金時段(一般指22:00以後)等。在上下午,周末比平日有更多的收視行為選擇;晚間黃金時段和午間新聞時段則成為一個收視日里兩個最突出的收視高峰,尤其是晚間黃金時段,最高收視率可達60%以上。

圖4 收視率在一個收視日的變化(CSM1999年60城市數據)

頻道/節目的選擇行為主要表現為收視份額和節目收視率的變化。觀眾選擇收看某頻道某節目,將導致該頻道該節目的收視率和收視份額增加。這就如同觀眾「投票」,收看你的頻道/節目的觀眾越多,你得到的投票就越多,也就有更高的收視率和收視份額。圖5以北京為例,顯示了各頻道收視份額的差異。圖6以《環珠格格-第二部》電視劇在北京播出為例,顯示了節目收視率和收視份額隨不同播出日期的變化。

圖5 北京地區1999年各主要頻道的收視份額(CSM數據)

圖6 《環珠格格-第二部》在北京播出的節目收視率和收視份額
(CSM1999年數據)

持續收視時間的選擇主要表現為平均收視時長。有的人願意消磨更多的時間在電視機前,而有些人則相反。平均收視時長就是這些人消磨於電視機前的平均時間。1999年CSM的調查結果顯示,中國人平均每天收看電視達3個小時,和過去兩年的調查結果接近(如圖7);若分區域考察,東北地區觀眾的日平均收視時長最大,達198分鍾;華北地區居其次,為193分鍾;華東地區最低,168分鍾;華中地區次低,174分鍾;其他幾個地區分別是,西南191分鍾,西北188分鍾,華南182分鍾。

除此而外,基於收視率調查的其他一些分析指標,也可以用來描述和解釋收視行為選擇的模式與變化。但不管怎樣,收視率調查數據只能用來統計和分析收視行為選擇的結果,而不能夠說明收視行為選擇的原因。這恰是收視率調查的局限所在。

三、影響收視行為選擇與收視率變化的因素分析

人們作出收視行為選擇不是無緣無故的,其中施加影響的因素多種多樣。但歸納起來不外有兩類,一類來自收視主體__電視觀眾,這包括觀眾性別、年齡、婚姻家庭、居住地等人口屬性因素以及文化程度、職業、收入、生活工作方式、性格愛好等社會屬性因素;另一類來自收視客體__電視節目,這包括電視頻道構成和節目編排、節目內容、節目時長、播出形式等。一般而言,第一類因素可稱為收視行為的背景因素,而第二類因素則可稱為收視行為的前景因素。由於收視率調查以受眾研究為出發點,因而對收視行為背景因素的關注往往更多一些。

背景因素對收視行為選擇的影響可以分別從微觀(個體)和宏觀(群體)角度加以考察。從微觀的角度看,個體性別、年齡、文化程度、職業、收入等都是影響收視行為選擇的顯著因素。圖8顯示的是兩性收視率一年變化的比較,雖然在變化模式上是一致的,但明顯地女性收視率要高於男性。圖9顯示的是各年齡組觀眾收視率一年變化的比較,從圖中可見4-14歲少兒觀眾的收視率除寒暑假外均明顯地低於15-24歲的青少年觀眾以及15歲以上的成人觀眾。

從宏觀的角度看,群體的人口規模與年齡結構、城鄉結構、地區分布與地區差異(包括氣溫、社會習俗和經濟狀況的差異等)、人口的文化素質如識字率等都是影響收視行為選擇的顯著因素。例如從圖4可看出收視率隨季節變化的差異,而季節變化主要是氣溫變化。再如上文談到的中國各大區觀眾在平均收視時長方面的差異,主要的也是南北差異即氣溫差異。圖10顯示的是統合考慮以上各宏觀變數的影響後對50多個不同收視率調查地區的統計分類(聚類)及其收視率比較,從本圖可以明顯地看出宏觀背景變數對收視行為選擇和收視率變化的影響,因為不同宏觀背景變數作用下的各類調查地區的收視率存在著明顯的差異。

圖8 兩性收視率一年變化的比較(CSM1999年60城市數據)

圖9 各年齡組觀眾一年收視率變化的比較(CSM1999年60城市數據)

圖10 不同類型地區的收視率差異(CSM1998年數據)

前景因素對收視行為選擇和收視率變化的影響也非常重要。圖11顯示的是頻道構成對收視率變化的影響。從圖中可見,省台和中央台的收視率要明顯地高於市台、有線台和其他頻道的收視率,從而仍占據著目前為止中國電視收視市場上的主力地位。圖12顯示的是時段結構對收視率變化的影響。從圖中可見,19:00-22:00的黃金時段收視率要遠高於午間時段、下午時段和上午時段。表1顯示的是1999年北京地區電視節目收視率排名,用以闡釋節目類型和內容不同所造成的收視率差異。從表中排名可見,電視劇類節目、娛樂類節目和新聞類節目贏得了觀眾較多的收視。

圖11 各類電視台一年收視率變化的比較(CSM1999年60城市數據)

圖12 各時段一年收視率變化的比較(CSM1999年60城市數據)

表1 北京地區1999年電視節目收視排名(CSM數據)

排名
頻道
節目名稱
類別
日期
收視率

收視額
%
注釋(最高與最低
收視率%)

1
BTV-2
還珠格格第二部
電視劇
6.27/7.20
33.8
43
48 集 (45.7至22.2)

2
CCTV-1
春節聯歡晚會
娛樂
2.15
26.1
54

3
BTV-1
新聞聯播
新聞
10.27
22.6
60

4
CCTV-1
國慶晚會
娛樂
9.30
22.5
46

5
BC-1
少年英雄方世玉
電視劇
10.14/11.15
21.9
48
40 集 (27.7至18.7)

6
BC-1
康熙微服私訪記
電視劇
3.19/4.6
21.3
49
30 集 (29.3至14.2)

7
BTV-2
鹿鼎記
電視劇
8.1/8.24
20.4
47
45 集 (26.4至14.3)

8
BC-1
小李飛刀
電視劇
11.8/12.10
18.1
40
40 集 (22.5至9.2)

9
BC-1
一代巡撫
電視劇
1.29/2.10
14.7
32
20 集 (20.1至11)

10
BTV-1
食神
電視劇
2.21/3.18
12
25

註:電視劇的收視率是指所有劇集的平均收視率

無論前景因素還是背景因素,對收視行為選擇和收視率變化的影響都不是孤立的,而是內在有機地相聯系,共同發揮影響作用。因此有研究者更構建了影響收視率變化的多元分析模型,將這些有關的因素歸攏於一起來考察對收視行為選擇和收視率變化的整體影響。但是由於收視行為選擇的復雜性以及多元統計量化分析在解決社會科學問題方面的局限性,迄今這方面的研究都沒有令人滿意的結果。

四、電視觀眾滿意度調查--拓展對收視行為的研究

通過前文的分析可以知道,收視率調查回答的是「收視行為如何」的問題,而不能夠回答「收視行為為何」的問題。要知道觀眾為什麼作出這樣那樣的收視行為選擇,通過進行一些背景因素和前景因素的分析雖可略知一二,但都是間接的判斷;要直接地從觀眾那裡獲得數據,就必須採用不同於收視率調查的一些調查方法。電視觀眾滿意度調查即是其中的一種,國外和香港一般將之稱作電視節目欣賞指數調查。這種收集觀眾對電視節目評價數據的調查,一方面能夠用來對各類節目作出觀眾評價得分並比較(如按總體滿意度或欣賞指數之類的指標進行排序),另一方面也可直接分析觀眾收視的內在原因即對電視節目品質的欣賞。

觀眾滿意度調查或者欣賞指數調查可以採用不同的方法,收集到的數據可以是連續的,也可以是間斷的。連續收集數據的方式多為日記調查法,就象收視率調查一樣,每周將日記卡送達被訪者,由被訪者對當周每一天所收看的節目進行評價。也可以採用問卷調查法,這時調查是間斷的,例如每個季度或者每個月進行一次調查。調查問卷由訪問員入戶訪問,記錄觀眾過去三個月或者一個月對所列頻道或欄目的評價。

滿意度調查(或欣賞指數調查)的指標可以簡單到只調查觀眾對當期節目的評價分(如採用5級評分制或百分評分制)和收看這個節目的主動程度;也可以設計較為復雜的指標體系,進行更深入的調查。例如可以分別就頻道和欄目設計調查指標,從而形成頻道滿意度指標體系和欄目滿意度指標體系,既獲得觀眾對頻道的總體評價和收視特徵,也可以對所關心的具體欄目逐一給出評價。

盡管滿意度調查和收視率調查所解決的受眾研究課題不同,但是它們之間的關系密不可分,值得關注。有研究者將它們之間的關系用圖13來表示(注1),並將電視節目區分為「叫好叫座」、 「叫好不叫座」、「不叫好叫座」和「不叫好不叫座」四種。其中「叫好不叫座」和「不叫好叫座」是一個問題的兩個方面,概括的是收視率和滿意度逆向變化的情況,其所隱含的一個經驗性假設是:高收視率節目的滿意度(欣賞指數)可能並不高,因為此類節目的觀眾多,他們既可能是「忠實」觀眾,也可能是「隨機」觀眾,前者傾向於給節目高分,後者卻會給較低分,無形中拉低了整體分數;而觀眾較少的節目卻有可能獲得較高的滿意度(欣賞指數),因為在能夠自由行使選擇權時,如果某些觀眾寧願放棄收看熱門的電視節目而選擇小眾節目,表明他們對這個節目的題材或表達方式,會有一定程度的欣賞。換句話說,觀眾較少收視率較低的節目,可能會有較高的滿意度(欣賞指數)。

「叫好叫座」和「不叫好不叫座」概括的是滿意度與收視率同向變化的情況,其所隱含的則是與上述不同的另一個經驗性假設:收視率可以代表滿意度(欣賞指數),一檔節目獲得高收視率,意味著觀眾對此節目比較喜歡。有研究發現(注2),節目的「叫好」與「叫座」與節目自身的類型相關。

圖13 觀眾滿意度與收視率的關系

和收視率一樣,滿意度也受到觀眾背景變數的影響。英國有研究顯示,滿意度(欣賞指數)受觀眾年齡、性別和社會階層的影響。最年幼和最年長的觀眾傾向於給予節目較高的滿意度評分,而中青年觀眾則很難討好,他們不輕易對電視節目打高分。從性別來看,女性比男性慷慨,樂意給電視節目更高的評價分。低下社會階層的觀眾比較容易滿足,傾向於給予電視節目較高評分,而中上階層則比較挑剔。香港的研究則發現,在年齡方面,老年觀眾較多的節目滿意度(欣賞指數)較高,年輕觀眾較多的節目則相反,滿意度(欣賞指數)只是局部受觀眾年齡的影響,與性別和教育程度並無顯著關系。

我們知道,收視率高低受許多因素的影響,其中時段因素的影響頗大,同樣一檔節目安排在不同時段播出,收視率可能會有相當大的差距。然而,滿意度(欣賞指數)與節目播出時間無甚關系。香港的調查曾經顯示,黃金時間播放的節目比非黃金時間播放的節目有更高的滿意度(欣賞指數),但是這個關系可以用其他變數來解釋。一般來說,好的節目即使被安排在不太好的時段播出,只會影響其收視率,而不大會影響其滿意度(欣賞指數)。此外,香港的研究還發現,滿意度(欣賞指數)與節目時長和製作者無關。由此可見,滿意度(欣賞指數)是一個比較穩定的測量指標,並非收視率的附屬品,是描述收視行為的另一種工具,是對收視行為研究的進一步拓展。

Ⅲ 用數據說話:數據分析的基本思想是什麼

用數據說話:數據分析的基本思想是什麼

今天分享一下數據分析的一些基本思想,我給它起了個名字叫做用數據說話。內容都是個人的一些心得,比較膚淺!如有不足之處,希望大家諒解!廢話不說了,現在咱正式開始。
用數據說話,就是用真實的數據說真實的話!真實也可以理解為求真務實。那麼,數據分析就是不斷地求真,進而持續地務實的過程!用一句話表達就是用數據說話,用真實的數據說話,說真話、說實話、說管用的話。
1.用數據說話
數據本不會說話,但是面對不同的人時,就會發出不同的聲音。現在我們以《荒島售鞋》這個老故事為引例,從數據分析的角度來解讀,看看能不能開出新花?為防止大家案例疲勞,我盡量用新的表達方式把故事羅嗦一下!
話說郭靖和楊康,被成吉思汗派去美麗的桃花島進行射鵰牌運動鞋的市場拓展。郭靖和楊康一上桃花島就驚訝地發現這里的居民全部赤腳,沒有一個穿鞋的,不論男女還是老少,莫不如此。楊康一看,倒吸了一口涼氣,說:唉!完了,沒啥市場!郭靖卻不這么認為,馬上掏出了新買的IPHONE4G給鐵木真打了個長途加漫遊的匯報電話。面對桃花島這個空白的市場,郭靖電話里這么說:「桃花島人口眾多,但信息閉塞。現在全島居民,全部赤腳。在運動鞋市場上沒有任何競爭對手,茫茫藍海,市場將為我獨霸!可喜,可喜啊!」這個時候,咱現場做個調查,假如你是成吉思汗,你會怎麼抉擇?(投資Y1人,不投資的N1人。)
這個時候楊康聽不下去了,馬上搶過電話,說到「大汗,別聽郭靖瞎嚷嚷!市場雖然沒有競爭,但並不就一定是藍海。在全球化競爭的大背景下,這么輕而易舉的就讓我們找到了藍海,您覺得可能嗎?難道阿迪、耐克、彪馬、銳步這些國際巨頭都是棒槌,會發現不了?我看肯定是島上幾百年不穿鞋的生活習慣,短期內無法改變,所以各路群雄,都只能望而止步!可惜,可惜啊!」聽了楊康的論述,鐵木真又該如何選擇呢?請大家舉手錶態。(願意投資Y2人,不願意投資的N2人。)薑是老的辣!成吉思汗比較理性,他只說了一句:「繼續調研,要用數據說話!」就把電話掛了!
一個星期之後,楊康率先給BOSS匯報了。不過他沒有選擇打電話,而是改發E—MAIL。原因有三:一是全球通資費太高了,錢要省著點花;二是楊康有點小人,他擔心郭靖聽了他的表述後,剽竊他的思想;三是他寫了一份詳細的調研報告,電話里三言兩語說不清。楊康的調查報告里詳細地記錄了他與島內精心選取的200位居民的談話內容,以及他抽取居民樣本時科學合理的甄別條件,最後的結論就是:島內居民全部(100%)以捕魚為生,腳一年四季泡在水裡,根本就不需要鞋!聽到這個消息,成吉思汗怎麼辦呢?請大家繼續舉手錶態!(願意投資Y3人,不願意投資的N3人。)
成吉思汗有自己的想法。這個時候,他沒有做決策,而是繼續等。等什麼呢?等郭靖的結論!又過了兩天郭靖終於打來了電話。電話里說了3句話:「這個市場可以做!原因是島上的居民每周都要上山砍柴,並且十有八九會被劃破腳!更可喜的是,這兩天他用美男計泡到了島主的女兒黃蓉,而且黃蓉答應給射鵰牌運動鞋作形象代言!」故事發生到這個階段,我請大家做最後一次表態。(願意投資Y4人,不願意投資的N4人。)
好!數據在變,我們的決策也在變。不過,成吉思汗比我們理性的多。回答還是一句話,不過比第一次多了幾個字:「繼續深入調研,用詳實數據論證。」為什麼呢?難道這些數據還不夠詳實嗎?是的!因為在成吉思汗腦袋裡還存在有很多疑問。比如:
1) 難道競爭對手真的沒來過?還是對方論證後真的不可行?
2) 山上不會開個伐木廠吧?如果有了伐木廠,居民就不會上山砍柴了,到時候送柴上門,鞋還有個屁用啊!
3) 為什麼一周才上一次山?該不會主要使用的是太陽能吧?
4) 運動鞋的運輸成本、營銷成本、銷售成本是多少?投資收益率有多高?
5) ……
聽完這個案例,我想問大家一個問題!從數據分析的角度看,你受到了什麼啟示?請注意這里說的數據分析的角度,如果你得到的啟示是:鐵木真領導的郭靖與楊康不是1個老男人+2個帥小伙的Gourp,而是教練型的Team。那麼,抱歉!這不是我們今天討論的范圍。好,在座的各位誰來表達一下自己的看法呢?提示性的啟示有:
面對同一個數據,不同的人會說不同的話。
真實的數據並不一定能推導出正確的結論。
正確的決策需要有充分的數據去論證。
……
說完了啟示,咱把這頁PPT總結一下。這個案例涉及數據的搜集、分析、匯報以及用於決策的整個過程。在這個過程里,無論那個細節出了問題,最終做出的決策都將是致命的!所以說質量是數據的生命,在數據用於決策的整個過程,都必須保證真實有效!
2.用真實的數據說話
所謂用真實的數據說話,就是指在說話之前,先審核數據的真實性!現實生活中,拿著錯誤的數據還能大言不慚的可以說比比皆是。其中有兩位傑出的代表:一個是傳說中偉大的中國統計局,另一個就是動不動就要封殺這個封殺那個的CCTV。我不是瞎說,因為有數據支撐!
2010年1月20日,國家統計局公布了2009年全國房地產市場數據,全年房價平均每平方米上漲813元。夠雷人吧!雷聲還沒過,霹靂緊跟著又來了!2月25日國家統計局發布了《2009年國民經濟和社會發展統計公報》,數據顯示,70個大中城市房屋銷售價格上漲1.5%。真可是天雷滾滾!難怪網友把統計局票選成大天朝的娛樂至尊!
此話一出,央視不答應了!真所謂中國統計,娛樂至尊;央視不出,誰與爭鋒?那我們仔細推敲一下央視的數據。2010年2月15日,CCTV發布了虎年春晚的滿意度報告,結果顯示滿意度為83.6%。幾乎同一天,新浪的公布的調查結果是14.55%;後來沒幾天,騰訊也發布了滿意度數據,結果是10.48%。數據一出,網友們罵聲不斷,此起彼伏,一浪高過一浪。但是人家央視就是央視,大有敵軍圍困萬千重,我自巋然不動的定力。更誇張的是央視不但能裝作視而不見,充耳不聞,而且還繼續恬不知恥地在自己家的那幾個頻道里賣弄數據,自娛自樂。到底央視的數據錯在哪裡?我們先審視一下央視的調查方法。
央視的調查結果,來自央視——索福瑞媒介研究有限公司。索福瑞號稱他們電視觀眾滿意度調查的樣本覆蓋了全國30個城市,抽樣框總人數有30,000人,央視春晚滿意度的調查就是從這3萬人中隨機抽取了2122人進行調查。這樣看,嚴格意義上講所謂83.6%的滿意度只能代表3萬人的看法。當然,如果我拿這個說法與央視理論,對方肯定能拿出3萬代表全國的理論證據。具體就是先從2千推斷3萬,再用3萬推及到30個城市,然後從30個城市推及至全國所有城市,最後再推及至全國。這里用到了簡單隨機抽樣、分層抽樣、典型抽樣,總起來還是個多階段抽樣,多麼冠冕堂皇的理論依據!但是,縱然每一步都能保證90%的可靠程度,四次推及下來理論的可靠程度也只有65%。可遺憾的是,最後一步用城市推及全國的做法在理論上還有一道坎,因為我們不知道如何用45%的城鎮居民來代表55%的農村人口?
說完了代表性的問題,我們再看看調查方法。索福瑞採用的是電話調查,而且時段選擇在春晚直播的那幾個小時內。據說調查是從晚上8:30開始,一直持續到春晚結束。巨汗!8:30貌似90%的節目還沒有上演,又怎麼能調查到觀眾對整個春晚的滿意度呢?
央視的數據是經不住推敲的!那麼,新浪和騰訊的一定對嗎?不一定,這兩個數據也只能代表新浪用戶和騰訊用戶的春晚滿意度,最多能夠代表一下4億網友,要想替13億的中國人民表達心聲,也恐怕是鞭長莫及。
欣賞了統計局和CCTV送給我們的兩個開年笑話之後,我們自己也應該反思,咱們日常工作中,在從數據的搜集、提取、整理到分析、發布、使用的這一連串過程中,數據有沒有失真?是不是數據自始自終都很齊全、很准確,而且統計口徑與分析目的保持著高度的一致呢?這個問題留到日常工作中供大家思考。
3.說真話說實話
拿著錯誤的數據,肯定得不出正確的結論。那麼面對真實的數據,就一定能得出正確的結論嗎?未必!給大家看個小笑話。
問:你只有10平米的蝸居,鄰居家從90m2換到190m2,你的居住面積有沒有增加?
答:沒有。
解:錯,你們兩家的平均居住面積是100m2,你的居住面積被神不知鬼不覺地增加了!
這個神不知鬼不覺是誰呢?無敵的平均數!仔細想想,這個均值算錯了嗎?沒有!那麼,問題出在哪裡?單一的統計量存在片面性,所以要想反映數據的真實面貌,就得使用一系列統計量。
我再杜撰一個氣候的例子,說明一下在結構嚴重失衡的情況下,使用平均數的可怕之處。我們的大中國啊,960萬平方公里,同一時間里有的刮風,有的下雨,還有的高溫酷暑。從去年冬天到今年的春天,北方一直暴雪連天,南方則遭遇百年旱情;而最近這段時間,南方多個省市河水決堤,沿河兩岸,村莊淪陷,而北方則是烈日當頭,乾旱焦人,酷暑難耐。如果我們計算全年或者是全國降雨量的平均值,算出來的結果肯定是神州大地風調雨順,國泰民安,而實際卻是華夏民族飽經風霜,多災多難!
還好,統計學家不只給了我們平均數,同時還設計了許多其他的統計量,大家看看下面這個表。

衡量數據的集中趨勢,基本有三個統計量,均值、中位數和眾數。均值是數值平均數,它容易受極端值的影響。也就是說如果數據的跨度或者說是極差不大的話,用均值可以很好的反映真實情況。但是,如果數據的差異比較大,單一使用平均數就會搞出新的笑話了。中位數和眾數屬於位置平均數,中位數是把數據從小到大排序,正好處於中間位置的那個數,眾數是說出現的頻次最多的那個數。
數據除了有集中趨勢,還有離散趨勢。反映離散趨勢的統計量主要有方差、標准差、極差、變異系數等。方差就是觀測值與均值差的平方和除以自由度,自由度一般是n或n-1。總體數據就用n,抽樣數據就用n-1。標准差就是方差的正平方根,它的意義是消除了量綱的影響。極差是最大值與最小值的差,反映的是觀測值的跨度范圍。還有一個比較重要也是比較常用的就是變異系數,它是標准差與均值的比,目的是消除數量級的影響。
此外,還有一些是描述數據分布的統計量,比如分位數,有四分位、八分位、十分位等等,二分位就是中位數,它們反映一系列數據某幾個關鍵位置的數值。頻率分布,就是對數據分組或者是分類後,各組或各類的百分比。偏度是用於衡量分布的不對稱程度或偏斜程度,峰度是用於衡量分布的集中程度或分布曲線的尖峭程度的指標。
如果想再深入一些的話,就會用到相關系數、置信水平、統計指數等等。相關系數是反映變數之間線性相關程度的指標,取值范圍是【-1,1】,大於0為正相關,小於0為負相關,等於0表示不相關。置信水平是指總體參數值落在樣本統計值某一區內的概率。統計指數就是將不能直接比較的一些指標通過同度量因素的作用使得能夠比較,常見的物價指數、上證指數等等。
有了這些基本的統計量,我們在實際工作中只要稍微用心選擇一下,就可以比較准確的描述數據的真實情況。
4.說管用的話
說管用的話是指深入分析數據的實質,挖掘數據的內涵,而不是停留在數據的表層,說些大話、空話或者套話。這就要求在數據分析時,首先明確分析的目的,其次是選擇恰當的方法,最後得出有用的結論。通俗地說,說管用的話,就是不說屁話,少說廢話!
4.1明確分析目的
這里我們舉個例子。我想這個例子的時候正好是7月7號,N年前的那個時候,正好是在座的各位高考的日子,所以就杜撰了一個高考的數據。

我們這個班級,雖然成績很爛,800分的總分,平均成績只有486分,但是人才輩出,名字一個比一個響,人氣一個比一個旺。大家先認識一下,有飽讀四書五經,滿腹經綸的關東秀才呂輕侯;有籃球場上進攻犀利,防守嚴密的小飛俠科比;還有足球場上無論是邊路傳中還是搶點射門都有非常出色的C羅納爾多;有喜歡煙熏妝、藍絲襪加高跟鞋出鏡的偽娘劉著,有被億萬網友燒香膜拜的春哥黨教主李宇春,還有經常抱著吉他哼著綿羊音的90後MM曾軼可;以及自稱冰清玉潔、妖媚性感、擅長爆發性舞蹈動作的芙蓉姐姐和非清華北大經濟學碩士不嫁、奧巴馬也可的重慶籍奇女子羅玉鳳!
基於學生的考試成績,不同的人會關注不同的方面,高考的判卷老師會關心試卷的雷同程度,命題人會測試考卷的信度和效度,研究文理分科的專家會計算文理成績的相關程度。但是對於普通中學,通常只會關心兩個方面。一是學生成績,計算升學率;二是教學水平,給優秀教師發獎金。如果高中的教學科在這里研究文理相關就屬於廢話,如果還要把問卷的信效檢驗也扯出來就是屁話了。
關於學生:
呂秀才:總分722分,班級第一,平均成績超過90分,如果將其他同學的水平比作三層小樓的話,呂秀才應該是站在賽格頂上!奇才,上清華北大沒有問題。
科比和C羅:總分550左右,平均不到70分!屬於班級2號、3號人物,但成績確實不咋地,不過在該班級中也算鶴立雞群了。
劉著、李宇春、曾軼可:成績較差,上學肯定不是她們的出路!基於平時性情怪異,男的像女,女的像男,還有一個像綿羊,建議別走高考這條尋常路,還是去湖南衛視選秀吧。
鳳姐、芙蓉:這成績,就是個腦殘,估計腦袋不是被門擠過,就是被驢踢過!
關於老師:
衡量教師的優劣需要剔除異常值,呂秀才就是!呂秀才屬於成績異常出眾,個人素質極高,所以他的成績不應該成為衡量老師優劣的樣本。
語文均值高,變異系數小!由此看出語文老師真是好老師!該發獎金!
同理,歷史老師也不錯!也應該適當獎勵。至於物理老師,太差,得趕快換掉,絕對不能讓他繼續誤人子弟了!
存在疑問的就是英語老師。英語成績的均值較高,但變異系數大。這說明數據里可能存在極端值。可能的異常值是科比與C羅。科比美國人,外語自然好!C羅葡萄牙人,但從2003年到2009年一直在英國留學,6年啊,英語好也是應該的!所以,科比與C羅的英語成績不能算是英語老師的栽培,所以科比和C羅是異常值,應該剔除。那麼,剔除異常後就會發現英語的均值只有47分!說明英語老師並不能算做好老師,所以只能與獎金無緣了!
4.2選擇恰當的方法
接上面的案例。如果我們是研究高中該不該進行文理分科的有關部門,那麼我們該如何分析文理成績之間的相關性?
舉例1:如何計算文理科之間的相關性。
目前基本有三種方法,一是簡單相關分析,二是典型相關分析,三是潛變數相關分析。
簡單相關分析就是通過加總,分別計算出文科成績總和、理科成績總和,然後計算兩者的簡單相關系數。
典型相關分析主要用於衡量兩組變數之間的相關性。它的基本原理是:為了從總體上把握兩組指標之間的相關關系,分別在兩組變數中提取是的相關系數最大的一系列典型變數,然後通過計算各對典型變數之間的相關性,來反映變數間的相關程度。
潛變數相關就是計算潛變數之間的相關系數。所謂潛變數是相對於顯變數或者測量變數而言的。潛變數是實際工作中無法直接測量到的變數,包括比較抽象的概念和由於種種原因不能准確測量的變數。一個潛變數往往可以有多個顯變數,潛變數是可以看做是其對應顯變數的抽象和概括,顯變數則可視為特定潛變數的測量指標。在文理科相關性的分析中,我們可以將文科、理科看成潛變數,將語文、外語、政治、歷史這四個顯變數看成文科的測量指標,將數學、物理、化學、生物這四個顯變數看成是理科的測量指標,那麼求文理成績之間的相關問題就轉化成潛變數之間相關的問題。
那麼。我們究竟該選用哪種方法呢?或者假如說我們同時使用了上面三種方法,求出相關系數,該選擇哪一個呢?比如我們計算的結果分別是0.35(簡單相關)、0.85(最大典型變數)、-0.65(潛變數相關),這個時候我們到底該相信哪個數據呢?
其實,我更願意相信簡單相關計算的結果。原因如下:
1、簡單相關,既簡單又易理解。
2、典型相關的取值范圍是【0,1】,它計算出的結果沒有正負,只有大小。與我們實際研究目的有悖。我們想知道學生是否在文理課程上均衡發展,所謂均衡就是正相關,所謂不均衡就是負相關。而典型相關做不到。
3、潛變數相關雖然取值范圍是【-1.1】,但是它多數是採用主成分的方法擬合潛變數,而依據方差提取最大主成分的過程與我們的分析貌似不甚吻合。
4、最重要的是,其實簡單加總與典型相關、主成分相關擁有同一個思想,就是先把多個變數擬合成一個變數(或幾個),然後分析這個擬合出來的變數之間的相關性。其實,在量綱、數量級相同的情況下,而且權重也容易計算的情況下,最簡單有效的擬合就是加總!所以我認為簡單加總後計算出的相關系數是最有效。而潛變數、典型變數是在量綱或數量級不等的情況下,衡量多個變數之間相關關系的有效方法。
舉例2:計算硬幣正反概率
最後,再給大家做道選擇題。
問題:如果一枚硬幣連拋10次都是正面,問第11次出現正面的概率是多少?
選項:A. 接近0% B.50% C.接近100% D. 以上答案都不對
一個硬幣連拋10次都出現正面的概率是0.510,絕對的小概率事件。在一次實驗中,小概率事件發生,那麼我們就應該拒絕原假設。原假設是什麼?硬幣出現正反的概率是0.5。所以,我們可以大膽地推斷,硬幣本身就是一個兩面都是正面的硬幣,所以說第11次出現正面的概率是100%,或者接近100%。大家是不是有異議呢?
樹上10隻鳥,獵槍一槍打死1隻,樹上還剩0隻的結論大家都應該同意吧。因為我們考慮的是實際問題,不是10-1=?的數學算式。所以大家在幼兒園的時候就知道槍聲響過,樹上一隻鳥都不會剩。試想,你和你的朋友打賭投硬幣猜正反,如果10次之後朋友投出來的都是正面,你會怎麼想?兄弟你出千了吧,硬幣肯定有問題吧!相信用不了10次,你就會提出這樣的質疑了。如果說計算概率,0.5沒有錯,獨立事件發生的概率不因之前的情況而改變。但是,如果用假設檢驗的思想,100%的結論就更合理了。之所以說0.5的結果不對,不是說你的計算出錯了,而是在解決實際問題的時候,你太教條了,太書本了,從而選錯方法了。
5.最後總結
我的分享結束了,大家也聽了也笑了,但是笑過之後務必記住我啰嗦了一個小時的這句話:用數據說話就是用真實的數據說話,說真話、說實話、說管用的話!最後說一句廢話:希望剛剛過去的1個小時沒有浪費大家的時間。

Ⅳ 中央電視台怎樣統計收視率

■收視率是如何產生的?

目前採用的收視率數據採集方法有兩種,即日記法和人員測量儀法。日記法是指通過由樣本戶中所有4歲及以上家庭成員填寫日記卡來收集收視信息的方法。樣本戶中每一家庭成員都有各自的日記卡,要求他們把每天收看電視的情況(包括收看的頻道和時間段)隨時記錄在自己的日記卡上。日記卡上所列的時間間隔為15分鍾。每一張日記卡可記錄一周的收視情況。

人員測量儀法是指利用「人員測量儀」來收集電視收視信息的方法,是目前國際上最新的收視調查手段。樣本家庭的每個成員在手控器上都有自己的按鈕,而且還留有客人的按鈕。當家庭成員開始看電視時,必須先按一下手控器上代表自己的按鈕,不看電視時,再按一下這個按鈕。測量儀會把收看電視的所有信息以每分鍾為時間段(甚至可以精確到秒)儲存下來,然後通過電話線傳送到總部的中心計算機\(或通過掌上電腦入戶取數據\)。

收視率多久能夠出來?有的是一周,有的是兩周,有的是一天。劉燕南說,這主要取決於採用什麼樣的測量方法,如果採用日記法,因為要對數據進行收集和分析,最快需要一周,一般需要兩周;如果採用人員測量儀法,因為電話線可以即時回傳數據,因此能夠做到隔一天就能夠提供收視數據,只是人員測量儀成本比較高。

■電視劇收視率能否和《新聞聯播》比較?

如今,越來越多的電視劇在提供收視率時採用這樣的提法:某一部電視劇的收視率僅次於《新聞聯播》,這種比較方法是否具有科學性?

劉燕南認為,兩者沒有可比性,首先電視劇和《新聞聯播》不在同一個播出時段;其次,兩者面臨的不是同一個市場,《新聞聯播》面向全國,而更多的電視劇是區域性的,面向一個省或者一個城市,「之所以會出現這樣的提法,主要是在大家的印象中《新聞聯播》的收視率很高,想以此來證明該電視劇的收視率很高,但最好不要做這樣的比較。」其次,劉燕南介紹,在某些地方,一部電視劇的收視率可能高於《新聞聯播》,比如《還珠格格》在某些地方的收視率達到60%,因為《新聞聯播》是面向全國的,統計的基數太大。

那應該拿什麼數據作為某一部電視劇收視率的比較標准呢?劉燕南說,業內一般都是以央視一套黃金時段所播電視劇的收視率作為比較的標准,或者以某一部有代表性的、曾經創造過收視神話的電視劇作為衡量標准。

■央視索福瑞和AC尼爾森提供的收視率為何不一樣?

央視—索福瑞媒介研究公司和AC尼爾森公司是中國目前最主要的兩家收視率調查公司。據業內人士分析,在電視收視率市場上,央視—索福瑞占據了全國85%左右的市場份額,AC尼爾森公司占據10%左右,另外兩家比較大的公司是AC尼爾森媒介研究和上海的廣播電視信息咨詢有限公司。

業內人士經常會有這樣的印象,即使是同一地區同一時段同一部電視劇,AC尼爾森和央視—索福瑞媒介研究提供的收視率數據並不相同,有時還相差挺大。比如央視一套播出的《浪漫的事》,尼爾森的平均收視率是7%,而央視—索福瑞則為6%;又如2000年1月1日到9月23日杭州地區《新聞聯播》的平均收視率,央視—索福瑞提供的數據是22.1%,AC尼爾森為4.6%。究竟哪一個數據更加准確呢?

記者在采訪中發現,對於調查公司來說,這是一個敏感的話題。一位不願透露姓名的業內人士告訴記者,這主要是因為測量手段不一樣造成的:日記法和儀器測量法的結果肯定會有差異,應該說儀器測量法更准確一些,日記法往往是通過事後回憶來填寫的,因此誤差會大一些,而人員測量儀數據可以精確到1分鍾,這樣得到的收視率就會低很多。此外,由於樣本戶數不同、採用的計算體系不一樣等,也會造成收視率不一樣,「一般來說,雖然數字不一樣,但趨勢應該是一致的,否則用戶就會糊塗了。」

■哪些因素影響收視率?

央視-索福瑞媒介研究公司的畢江燕則分析了影響電視劇收視率的五種因素:①地區因素。《劉老根》在東北的收視率高達22%,在南方卻只有幾個百分點。②季節因素。2002年的12個月中,前五個月平均收視率為3.66%,6月份是電視劇收視的低谷,只有2.82%。暑假收視率有了回升,並達到了全年的最高點3.85%。③時段因素。在收視上表現最好的則是19:00-20:00這個時段,收視率超過了5%,從這里可以看出,時段在很大程度上決定了電視劇的收視率。④頻道因素。同一部電視劇在不同頻道播出,它的收視率也不同。比如《橘子紅了》在甘肅一套(省級頻道)播出時收視率為13.97%,福建電視台電視劇頻道(有線頻道)播出時收視率為7.37%,中央八套(中央級頻道)播出時收視率為7.29%。⑤播出輪次因素。同樣在武漢地區播出的電視劇《康熙微服私訪記第四部》,2002年10月份在武漢二套播出時收視率9.39%,而在11月份武漢四套播出時收視率不到4%。

閱讀全文

與央視如何表達數據相關的資料

熱點內容
赤峰調料批發市場在哪裡 瀏覽:20
復制的程序為什麼運行錯誤 瀏覽:570
大數據下載在哪裡 瀏覽:918
選款標准數據是什麼意思 瀏覽:665
行駛證能查詢車輛什麼信息 瀏覽:798
客戶問如何知道你的產品是正品 瀏覽:501
什麼是重命名數據類型 瀏覽:765
作為產品經理如何寫app的邏輯 瀏覽:123
小米換機怎麼選擇第三方應用程序 瀏覽:248
酒店代理怎麼推廣 瀏覽:855
如何跟蹤小程序交互代碼 瀏覽:240
我想買個小程序在哪裡找 瀏覽:612
日照運營商大數據多少錢一條 瀏覽:80
電子表格如何設置數據下拉排序 瀏覽:610
春雪食品有什麼產品 瀏覽:229
車險怎麼代理保險 瀏覽:623
怎麼看狗幣交易了多少 瀏覽:246
微信上小程序怎麼綁定手機號 瀏覽:193
為什麼數據網路延遲一直100 瀏覽:990
喜雲怎麼添加自己的產品 瀏覽:370