導航:首頁 > 數據處理 > 哪些動畫片運用到了大數據

哪些動畫片運用到了大數據

發布時間:2024-09-19 03:33:37

① 怎樣預測票房


票房預測:需求與現實



從1896年西洋影戲傳入上海徐園,到1905年中國拍攝首部國產電影《定軍山》,再到2013年全國電影票房突破200億
大關,(4)有著百餘年歷史的中國電影產業,在近幾年呈現出飛躍式發展的態勢,無論是影片質量、院線建設還是投資規模都有了長足的發展。與此同時,隨著
大數據」時代的到來,電影觀影群體、觀影偏好與心理、電影信息傳播和獲取方式也都在發生著深刻的變化。



毋庸置疑,多樣化資本的加入是中國電影不可或缺的發展引擎,然而,電影行業以投資回報率難以預測著稱,大投入未必有大產出,票房預測工具的缺失使得投資者
無法有效對沖投資風險,華人著名導演吳宇森的《風語者》就拖累了米高梅公司最終走向破產。因此製作與發行公司不得不考慮所有對票房有影響的因素:辣媽李小
璐對《私人訂制》票房貢獻幾何;《風暴》票房為何遠低於其金牌製片人江志強預期;被吐槽「爛片」的《富山春居圖》和《小時代》緣何票房卻一路走紅;成龍大
叔的《警察故事2013》有無必要拍成3D;《泰囧》的「報復性」觀影效應能否復現……這一切的一切其實都可以從「大數據」中找到答案。因為網路上的每一
次瀏覽、查詢乃至點擊所匯聚成的群體智慧都「蝴蝶效應」般地影響著電影的最終票房。



2013年Google在一份名為《Quantifying Movie Magic with Google Search》(5)
的白皮書中公布了其電影票房預測模型,該模型主要利用搜索、廣告點擊數據以及院線排片來預測票房,Google宣布其模型預測票房與真實票房的吻合程度達
到了94%,但並未見其公開對未上映電影的預測結果。



搜狗公司藉助「深思」系統,建立了更為復雜的模型,用於預測國內電影票房,並在新浪微博上提前發布了2013年12月國內上映電影的首周票房預測結果。很高興到目前為止預測結果與真實數據非常接近,同時,我們的模型還可以用於對影響票房的因素進行定量分析。





搜索查詢量的奧秘



搜狗搜索每天都響應上億次的搜索請求,查詢詞的分布和變化趨勢能夠很好的反映出中國網民的興趣點和關注指向。與Google的研究類似,我們也發現,電影
上映前相關查詢詞的搜索次數與票房收入有著很強的關聯性。這一點很好理解,用戶的主動搜索行為體現了用戶對這部電影的潛在興趣。



我們選取了2013年1-11月國內上映的180部電影的票房和上映前的搜索量數據作為訓練集,用於訓練一個基礎的線性回歸模型。實驗發現,單純利用搜索
量訓練得到的模型,預測得到的首周票房與真實票房的相關度R方值僅為68%,這與Google僅用搜索數據得到的結果70%很接近。(註:R方值取值為0
至1,值越大表示模型預測效果越好),這個結果也說明無論在中國還是美國,用戶的搜索行為是很相似的。





用搜索量來進行預測票房是一個好的開始,但是准確度還遠遠不夠。同時很多搜索詞還存在歧義的情況,比如《生化危機》,既是電影也是游戲,混在一起會造成票
房預測值偏高。進一步研究發現,游戲意圖的查詢請求量較為平穩,但電影意圖的查詢請求在上映前則有一個高峰,也可以通過用戶點擊的URL來進一步確認用戶
的搜索意圖。因此模型需要再引入查詢量的變化趨勢和用戶點擊的分布情況。修正後的模型可以達到74%的准確度,這時模型已經可以對電影票房進行一個粗略的
估計。







社交媒體:用戶的情感分析



社交媒體數據對票房預測也會有一定幫助。假設你是某個明星的粉絲,打算去看他主演的電影,那麼你很可能會提前轉發該電影的相關微博給你的朋友。國外已經有
很多預測項目都是在針對Twitter數據做研究,這里我們主要採用國內部分微博網站的數據來進行預測。通過自然語言理解技術,分析出用戶對未上映影片的
情感傾向,從而轉換為用戶的觀影需求。進一步可以考慮的因素包括微博轉發深度、評論活躍程度,以及相關微博數量隨電影上映日期臨近的變化趨勢,這些數據都
可以被有效的提煉為特徵並加入到模型中。



微博數據的加入使得准確率超過了80%。





結語



預測專家納特·西爾弗在《信號與雜訊:大數據時代預測的科學與藝術》一書中提到,大數據時代的預測更容易失敗,大部分失敗的預測都源於一種盲目的自信,用精確的預測來冒充准確的預測。



對此我們有著清醒的認識,目前的票房預測模型還有若干需要改進的方向。首先,目前模型的主要思想是通過電影上映前的用戶關注度來推算首周票房,這實際上沒
有考慮電影上映後的口碑對票房的影響;其次,模型較為依賴歷史數據,可能難以識別一些上映後脫穎而出的小成本「黑馬」電影;再次,目前的技術只能提前10
天預報出首周票房,還可以更加超前。



總體而言,「深思」系統代表了搜狗公司在社會化預測方面一些新的嘗試。我們試著從繁雜的海量數據中篩選出真正的信號,努力穿越不確定性的迷霧,區分出未來
圖景的哪些部分可以預測,哪些不可預測。通向這個未來的道路還在探索之中,但目前工作已經取得了一些不錯的進展,並給予了我們更大的信心。

② 全網路、全樣本、大數據、雲計算收視綜合評價系統的數據來源和技術依託是如何實現的呢

以往監測用戶收視信息通過電子節目指南(英語:Electronic program guide,縮寫:EPG)提供當前及未來電視節目的播出時間及節目介紹信息,廣泛應用於智能電視以及互聯網機頂盒,電視用戶根據個人興趣搜索頻道或節目名,欄目名稱等,快速切換到用戶喜歡的頻道,觀看直播或者回放。但這種傳統EPG面臨頻道局限、數據識別精準性差等問題。

天脈聚源在電視大數據方面有多年積累,收錄了全國500家以上頻道,對央視頻道、衛視頻道及部分城市頻道等共120多個頻道的EPG和廣告進行24小時自動化監測和人工檢驗,達到99%以上的准確度,可在30分鍾內提供可靠的播後信息,節目內容包括電視劇、電影、動畫片、綜藝、歌曲、體育賽事、生活信息等,電視節目的播出數據,比如哪個頻道,什麼時間播出了哪些節目,有哪些廣告投放,都可以通過天脈聚源電子EPG獲得精準信息。 天脈聚源大數據提供的電子EPG是廣電總局收視綜合評價大數據系統的基礎數據來源,從以下五點優勢中也不難看出其重要影響:

★樣本多、覆蓋廣,超規模海量信息源。系統初期匯集4000萬有線電視和IPTV樣本用戶的收視數據。

★大數據、雲計算,實時處理精準到戶。大數據、雲計算,實時處理精準到戶,既可以反映熱門節目、黃金時段的收視情況,又可以精準捕捉小眾節目、邊緣時段的收視特徵。

★防操縱、抗污染,解決收視造假。零收視」將不復存在;數據採集、清洗、分析、呈現等各環節無縫銜接,全流程自動化、封閉化處理,有效防範人為操縱。

★多維度、全方位,綜合評價引領發展。系統能提供客觀真實的收視統計數據,對節目多維度建模分析。

★全媒體、開放性,面向未來全新定位。系統積極適應技術和傳播發展趨勢,將全面覆蓋有線電視、直播衛星、IPTV、互聯網電視以及網路視聽領域等不同傳播渠道。

閱讀全文

與哪些動畫片運用到了大數據相關的資料

熱點內容
如何拓展和代理的合作 瀏覽:647
什麼是與市場有關人文活動 瀏覽:787
我是做裝修的如何群發信息給朋友 瀏覽:915
亞馬遜如何改變產品鏈接 瀏覽:108
用什麼技術做音樂 瀏覽:273
普陀代理記賬怎麼辦理 瀏覽:53
程序員是干什麼用的通俗講 瀏覽:498
etf二級市場有哪些 瀏覽:470
周六不交易為什麼股票漲停了 瀏覽:23
換店了怎麼給老顧客發信息 瀏覽:740
施工單位需要哪些技術 瀏覽:147
在庫的產品怎麼退給供應商 瀏覽:370
如何自做免費小程序 瀏覽:738
快遞服務組織信息保管多久 瀏覽:295
怎麼更改上傳數據時間 瀏覽:275
大數據為什麼需要Hadoop 瀏覽:241
為什麼迷你世界發送信息會失敗 瀏覽:75
產品網上推廣怎麼做 瀏覽:195
選擇代理記賬業務多少錢 瀏覽:104
工行白銀td開通多久可以交易 瀏覽:969