A. 要做一個介紹大數據的PPT,求大神幫幫忙,感激不盡!
問題描述不清楚喲,不過還是提供點信息給你吧。
1.大數據是什麼?怎麼理解大數據?
數據就好比地球上的水,單個數據就是一滴水,小溪、河流、湖泊,對應不同的數據體量,所有的水最終匯到海洋,大數據就象地球上的海洋,它足夠大,水滴足夠多,多到用人工數不清楚,裡面的資源超級豐富,那些資源也是數據。這么說,你明白大數據了嗎?就是把超級多數據信息匯集到一起,然後在裡面「釣大魚」。
2.都說大數據有4V的特徵,是什麼意思?
大數據的4V,就是「容量大Volume」「多樣性Variety」「價值高Value」「速度快Velocity」,同樣以海洋為例:
A.容量大:地球表面有70%左右都是海洋,想想裡面都有多少水滴?大數據時代,每一個人、每一件物品的信息、狀態,都能夠形成一系列隨時更新的數據,數據量也呈現出指數級的增長;
B.多樣性:海洋裡面的物產非常多樣化,就拿海鮮來說,小智一天吃一種,這輩子都可能吃不完一遍(所以小智不會糾結吃什麼的問題),太平洋的海水和大西洋的海水是有區別的,不同地方海水裡面蘊含的物質、生活的物種都有不同,海洋就是超級大寶藏,裡面有原油、有萌寵、也有大白鯊之類的獵手……大數據也和海洋一樣復雜,各種結構化、非結構化數據,匯成了數據海洋;
C.價值高:說到這個,資深吃貨口水直流,海里好吃的有大龍蝦、石斑魚、三文魚……更不用說其它寶貝啦,數據海洋裡面各種資源同樣豐富到極致,人們利用海洋,開發海洋中無窮的價值;
D.速度快,有兩個層面的意思,一是海水流動快,二是隨著技術的提升,我們對海水的利用也加快了速度(看看快艇、游輪的發展),畢竟嘛,先來吃肉、後來喝湯,這個道理,你懂的。
3.對大數據的處理,以海洋捕魚為例:
通過技術手段,在茫茫大海中找到魚群較集中的地點,這是數據挖掘;
捕到的魚進行初步分類,把太小的魚放回海中(養大了才好吃,原諒我是吃貨),這是數據清洗;
然後把魚運上岸,仔細分類,根據實際情況決定哪些魚送到海鮮市場賣活的,哪些魚用於做魚干,這是數據分析;
魚干、魚罐頭、魚子醬、魚肝油……目不暇接的海產品最終呈現在我們面前,此為數據可視化。
更多的,可進一步交流。
B. 大數據可視化大屏圖表設計經驗,教給你!
自從跟大家分享第一篇 《大數據可視化大屏設計經驗,教給你!》 ,很多小夥伴都會問我一些相關的問題,看了小夥伴給我發的視覺稿,整體都還不錯,但是發現圖表的設計都有一些問題,大家可能對數據可視化的圖表設計經驗少一些,所以這篇文章就挖掘一下圖表的細節表現,分享我曾經遇到過的坑和對圖表設計的理解。
圖表設計
圖表設計概念
圖表設計是數據可視化的一個分支領域,是對數據進行二次加工,用統計圖表的方式進行呈現,也是數據可視化的核心表現,圖表設計既要保證圖表本身數據清晰准確、直觀易懂,又要在找准用戶關注的核心內容進行適當的突顯,幫助用戶通過數據進行決策。
下面分析三種常用的可視化圖表設計:
折線圖
折線圖常用於表示數據的變化和趨勢,坐標軸的不同對折線的變化幅度有很大的影響。
左圖坐標軸設定的太低,折線變化過於陡峭,圖中數值區間為(10-34)數據可視化的表現過於誇大了折線變化的趨勢。
右圖坐標軸的數值設定的太高,則折線變化過於平緩,無法清晰的表現折線的變化。
合理的折線圖應當占據圖表的三分之二的位置,圖表的X軸數值范圍應根據折線的數值增減變化而變化,這需要跟前端小哥哥小姐姐說明,做成動態計算。
折線圖的折線粗細要合理,過細的折線會降低數據表現,過粗的折線會損失折線中的數據波動細節,視覺上較難精準找到折線點的相應數值!我通常用兩個像素的線,看起來比較合適!
右圖刻度線顏色過重,影響圖表數據的表現,零基線跟圖表內的刻度線對比不夠明顯,整體很亂。零基線是強調起始位置的,一般要比圖表內的線顏色凸出一些。
條形圖/柱狀圖
理想很豐滿,現實很骨感。這個案例是我之前在工作中遇到的問題,數據進來後,被嚇到了,問題的原因是沒有跟前端小哥姐溝通好,他們把X軸寫死,導致出現這種問題,其實應該情況要把這些圖表的取值范圍寫成動態計算的。
例如,以現在數值范圍為例,數據的最高值為18,X軸最高數值應該為25,當數據又上升一定的高度後,X軸再上升到相應的數值高度,這樣避免了如右圖的問題。
坐標軸的標簽文字最好能水平排列, 當X軸標簽文字過多時,不建議傾斜排列、上下排列、換行排列 文字多了這樣的展示大大降低了閱讀性!下圖給出兩個解決方案,大大提高標簽文字的閱讀性!
解決方案
柱子之間過於分散就會失去數據之間的關聯性,過密就會變得數據之間沒有獨立性更不利於舒適閱讀。
當柱子為n時,柱子直接的距離建議與n相差不要太大,柱子靠邊的距離,最好是柱子之間的一半的距離,這樣視覺上最為舒適。
餅圖
左1圖,不建議在餅圖內與百分比數值一起顯示,餅圖本身的形狀和大小,文字過多時容易溢出,如果出現一個2%一個1%,就很難辨別圖形指向,這樣也就失去了數據可視化的意義,PPT通常有這樣的設計樣式,因為是個死圖。
左3圖,人的閱讀習慣是從左到右,從上到下,所以數據從大到小排列,更有助於閱讀,圖形也更具美感!
當餅圖為檢出率,或者一些重要信息檢測的重點關注數據,就不建議大小數據順時針排列,左1圖這種情況一般很少出現,因為關注的是檢出數值,展示未檢出數據實為雞肋,可能是極少情況的需要吧!
右圖對於類似檢出率的數據最為合適,直觀清晰,沒有無用數據干擾!
當餅圖的標簽維度過多時,就不適合把數據圍繞餅圖一周展示,會很亂,不易閱讀,解決方案如右圖!
圖表分類圖
分享一張圖表分類大全,保存起來,設計數據可視化產品,會有重要參考價值!
這張圖由設計師Abela對圖表的各種特徵進行了大致的概括總結。