① 數據分析需要掌握些什麼知識
我們先從整體上了解數據分析師要掌握的技能有哪些,然後再從具體職位類別來看,不同的職位具體要掌握的技能有哪些。
這樣你就能根據自己的實際情況,有針對性的准備和學習。
一、數據分析的勝任力模型是什麼?
從整體上來看,數據分析師需要掌握的能力有很多,從總體上可以分為以下幾類,這些能力構成了數據分析師的能力模型。
1)理論基礎,包括統計學
2)數據分析工具,常用的分析工具有 Excel,SQL,Python 等
3)可視化工具,常用的有 Excel,商業智能(Business Intelligence,BI)
4)業務知識,包括常用的指標、某行業的業務流程
5)數據分析思維,包括常用的分析方法
6)通用能力,包括 PPT、溝通能力
下面我們來詳細看下每一種能力的要求。
理論基礎:統計學
數據分析背後的理論基礎是統計學。所以,掌握了統計學以後我們才能去看懂數據表達的意義是什麼。舉個例子,給你一家公司員工的工資,是平均值能代表這家公司的工資水平,還是中位數能代表?
如果沒學過統計學,那麼可能只認識這里的平均值,而不知道中位數這個知識。但是,如果你學過了統計學就會知道,中位數比平均值更能反映出數據的集中表現。
統計學的內容比較多,詳細又可以分為兩類內容:描述統計分析、推論統計分析。
什麼是描述統計分析?
對大量信息進行歸納是處理數據時最基本的任務。中國約有 14 億人,一張記錄每位中國人的姓名和收入的電子表格包含了我們衡量這個國家經濟健康狀況所需的所有信息,通常我們也將多個數據集合在一起的東東叫「簡稱數據集」。但這張信息過量的表格其實相當於什麼都沒有告訴我們。這就是讓人覺得諷刺的地方:經常是數據越多,事實越模糊。
因此,我們需要簡化,將一系列復雜的數據減少為幾個能夠起到描述作用的數字,正如奧運會體操比賽中,我們將一套多難度組合的復雜動作濃縮為一個得分:9.8 分。
描述統計分析就是將一系列復雜的數據減少為幾個能夠起到描述作用的數字,用這些有代表性的數字來代表所有的數據。這樣在面對一大堆數據時,你可在不知道所有數據的情況下就能知道數據的整體情況。
這就好比,我們通常一說起美女,能想到的是這樣幾個指標:長腿,大眼睛,臉蛋好看。雖然全國有那麼多美女,你也沒有見過全部的美女,但是你卻能通過這樣幾個代表美女的指標就可以大概知道什麼是美女。
同樣的,描述統計學的關鍵點在於,找到幾個關鍵的數字來描述數據的整體情況。那麼,問題就來了,能擔當起這樣重要責任的數字有哪些呢?描述數據的整體情況,我們可以用 4 個指標來做,分別是:平均值、四分位數、標准差和標准分。例如,前面我們在拿到工資數據,就可以用「中位數」這樣的數字來描述工資的整體情況。
所以,描述統計分析就是掌握 4 個指標:平均值,四分位數,標准差和標准分。
什麼是推論統計分析?
推論統計分析就是通過樣本來推斷出總體。需要掌握的知識包括概率分布、中心極限定、如何用樣本估計總體、置信區間、假設檢驗。例如,互聯網常用的 AB 測試背後的原理就是假設檢驗,如果不掌握推論統計分析,那麼連 AB 測試的結果也看不懂,更不用說完成一個 AB 測試實驗。
2.數據分析工具
很多人看到現在 Python 很火,就不管自己的能力水平如何,就一頭扎進學習 Python 的大潮,最後發現其實自己學不會,或者學完用不上。
這其實是不對的,真正工作里最常用的數據分析工具其實是 Excel,SQL。所以,如果你的零基礎,不建議一上來就學 Python,而是先學會 Excel 分析數據,然後學會 SQL。
這樣你學會了常用的分析工具,然後再學 Python 才是加分項。同時,這樣學習的順序還有一個好處,如果你是零基礎沒學過編程,一上來學 Python,大概率是學不會的。但是如果你學過用 Excel、SQL 處理數據,那麼就具備了一定的基礎,再學 Python,很多概念就會理解起來比較容易。
這就好比,一個嬰兒不是一上來就學習跑步(Python),而是先把走路學會,具備了走路(Excel、SQL)的基礎,再跑步就容易多了。
需要注意的是,除非是工作必須要求的,其他少部分公司用的工具其實不需要學習。比如有些公司要求其他編程語言,例如 R、SPSS、SAS 這些工具。
現在 Pyhon 已經是人工智慧排名第一的編程語言了,大部分公司要求 Python,很少部分的公司要求其他的編程語言,所以學習市場要求最多的那個技能才能找到更多機會。如果你學習了少部分公司才要求的工具,那麼意味著你找工作或者跳槽只能選擇這些公司,而會錯失其他大部分公司的求職機會,對你整個職業生涯不利。
TIOBE 編程語言排行榜是全球編程語言流行趨勢的一個指標,每月更新,官網地址(https://www.tiobe.com/tiobe-index)。下圖是 2021 年 2 月份排名前 10 的編程語言的變化圖,其中橙色曲線是 Python,我們會發現 Python 的流行趨勢越來越高。
3.可視化工具
常用的可視化工具包括 Excel、商業智能(BI)。
一般的可視化圖表用 Excel 里的圖表功能就可以實現,而且使用起來也方便。如果是要經常做報表,並且要求實現報表自動化,那麼就需要用到商業智能(BI)工具。
那什麼是商業智能(BI)呢?
微軟官方給的定義是「使用用於自助服務和企業商業智能 (BI) 的統一、可擴展平台(該平台易於使用,可幫助獲取更深入的數據見解),連接到任何數據並對數據進行可視化。 」
毫無懸念,看這種官方定義就是看不懂。簡單來說就是把數據導入商業智能(BI)工具中,就可以快速對數據可視化。例如下圖就是把數據導入用商業智能(BI)工具中,通過可視化數據來分析。
IDC《2019 年下半年中國商業智能軟體市場數據跟蹤報告》顯示,在中國商業智能軟體子市場中,報表分析仍是目前市場最主要的需求,2019 年全年年市場份額佔比為 79.0%。高級分析和預測分析市場份額佔比 21.0%(下圖)。
常用的商業智能(BI)工具有哪些呢?
目前使用最多的商業智能(BI)工具是 Power BI、Tableau、帆軟,選擇其中任意一種學習就可以了。
4.業務知識
因為數據分析是用來解決具體行業問題的,需要從業務的角度出發,了解各個指標,以及每個指標之間的關系,還需要聯系業務去理解數據。所以,工作中數據分析脫離不了業務,在分析中要找到導致問題發生的根本原因,而不只是單純的統計數據。
因此需要具備某個行業的業務知識才能去理解這個行業里的術語、業務問題等。
業務知識包括某個行業的常用指標、業務流程。需要注意的是,不同行業的指標、業務流程是不一樣的,所以需要學習的時候針對你的目標行業去學習准備。例如,下圖分別是金融信貸行業、在線教育行業的業務流程。
金融信貸行業業務流程(來自書《數據分析思維》)
在線教育業務流程(來自書《數據分析思維》)
如果是剛入門,這塊內容做到了解即可,等進入工作以後,再慢慢深入業務,積累業務經驗。具體某個行業的常用指標、業務流程可以看書《數據分析思維》,這本書里涉及了 10 多個行業的指標、業務流程。
5.數據分析思維
在數據分析相關的職位里經常會寫這么一條招聘要求「具備數據分析思維」。在工作或者面試中,會經常聽到分析思維、分析思路、分析方法。這三個詞語有什麼關系呢?其實簡單來說,它們都是指分析方法。
數據分析思維需要你掌握 10 種常用的分析方法。
數據分析 10 種常用的分析方法
如果你的分析目的是想將復雜問題變得簡單,就可以使用邏輯樹分析方法,例如經典的費米問題就可以用這個分析方法。
如果你的分析目的是做行業分析,那麼就可以用 PEST 分析方法,例如你想要研究中國少兒編程行業。
如果你想從多個角度去思考問題,那麼就可以用多維度拆解分析方法,例如找相親對象,需要從多個角度去分析是否合適。
如果你想進行對比分析,就要用到對比分析方法,例如你朋友問自己胖嗎,就是在對比。
如果你想找到問題發生的原因,那麼就要用到假設檢驗分析方法,其實破案劇里警察就是用這個方法來破案的。
如果你想知道 A 和 B 有什麼關系,就要用到相關分析方法,例如豆瓣在我們喜歡的電影下面推薦和這部分電影相關的電影。
如果你想對用戶留存和流失分析,就要用到群組分析方法,例如微博用戶留存分析。
如果你想對用戶按價值分類,那麼就要用到 RFM 分析方法,例如信用卡的會員服務,就是對用戶按價值分類,對不同用戶使用不同的營銷策略,從而做到精細化運營。
如果你想分析用戶的行為或者做產品運營,就要用到 AARRR 模型分析方法,例如對拼多多的用戶進行分析。
如果你想分析用戶的轉化,就要用到漏斗分析方法,例如店鋪本周銷量下降,想知道是中間哪個業務環節出了問題。
6.通用能力
通用能力包括 PPT 製作分析報告、溝通能力。
在工作中,要經常做分析結果做成數據分析報告,然後展示給業務部門、上級領導、客戶等,而這種展示數據分析報告的場景常用的工具就是 PPT,所以就要求你會用 PPT 製作數據分析報告,有較好的的文字、書面總結能力。
職業社交網站領英發布的《2018 新興工作崗位報告》報告里說,最大的技能缺口是軟技能,比如口頭交流、領導力和時間管理等。這份報告中建議,職場人士需要在快速變化的工作環境中,學習並保持軟技能,因為擁有這些技能的人才具備更大的職場優勢。
其實,任何職位都需要溝通能力,但是,數據分析師對溝通能力的要求更高。因為,數據分析師解決的是實際的問題,需要跨部門溝通業務,做好的數據分析報告也要展示給各個部門、領導、客戶,只有好的溝通能力,才能讓你的分析結果得到用戶的認可。 那麼這些通用能力如何提升呢?最直接的方式,就是通過寫文章來提升。
通過寫作可以同時提升你下面 3 個能力:
1)邏輯能力
寫作的本質其實是把一件事情講清楚,而邏輯能力強的人寫出來的內容,讀起來更順暢。
2)文字表達能力
數據分析師要經常做數據分析報告,和通過郵件匯報分析結果。這體現的其實就是文字表達能力,提高這個能力的辦法就是不斷去寫作。
3)溝通能力
寫作其實就是把想說的話通過文字和你的用戶去溝通。另外,經常在社群里提問和解答他人的問題,也可以提高你的溝通能力。你會看到不同人提問的水平是不一樣的,有的人可以完整的把一個問題描述清楚,有的人說完,其他人也不明白他的問題是什麼。這其實就是體現了溝通能力。
二、不同職位的數據分析能力要求有什麼不一樣?
經過前面的分析,我們從整體上知道了數據分析師需要掌握的能力。但並不是說,這些能力全都掌握了你才能找到一份數據分析師的工作。因為不同的職位的要求不一樣的。在《職業發展前景:數據分析師的晉升通道》章節我們知道了數據分析相關職位的分類。
我把勝任力模型中的這些能力對應到不同的職位,就可以清楚的看到對應職位的能力要求(下圖)。
有一個誤區,很多人以為只要掌握了分析工具,就掌握了數據分析,其實不是的。從圖中,我們可以看出。各個數據分析職位都需要的能力是:業務知識、分析思維、PPT、溝通能力。這些能力才可以讓你從一個只會舞弄工具的普通職場人變成真正解決業務問題的職場高手。
很多人以為數據分析師需要掌握很高大的工具,其實不是的。例如騰訊里有一個崗位叫「商業數據分析師」,這聽起來很高大上。其實這個職位對應的就是上圖初級數據分析師的能力要求,也就是理論基礎(描述統計分析),分析工具(Excel),可視化工具(Excel)。
上圖中黃色標出的是相對於前一職位多出來的能力。中級數據分析師在初級數據分析師要求的能力上增加了分析工具(SQL),可視化工具(商業智能 BI)。高級數據分析師在中級數據分析師要求的能力上增加了理論基礎(推論統計分析),分析工具(Python)。
Excel、SQL、Python 要掌握到什麼程度?
我們知道了數據分析師最常用的分析工具是 Excel、SQL、Python。那麼問題就來了,這些分析工具具體掌握哪些內容呢?
② 數據分析需要掌握哪些知識
數學知識
對於初級數據分析師來說,則需要了解統計相關的基礎性內容,公式計算,統計模型等。當你獲得一份數據集時,需要先進行了解數據集的質量,進行描述統計。
而對於高級數據分析師,必須具備統計模型的能力,線性代數也要有一定的了解。分析工具
對於分析工具,SQL 是必須會的,還有要熟悉Excel數據透視表和公式的使用,另外,還要學會一個統計分析工具,SAS作為入門是比較好的,VBA 基本必備,SPSS/SAS/R 至少要熟練使用其中之一,其他分析工具(如 Matlab)可以視情況而定。編程語言
數據分析領域最熱門的兩大語言是 R 和 Python。涉及各類統計函數和工具的調用,R無疑有優勢。但是大數據量的處理力不足,學習曲線比較陡峭。Python 適用性強,可以將分析的過程腳本化。所以,如果你想在這一領域有所發展,學習 Python 也是相當有必要的。
當然其他編程語言也是需要掌握的。要有獨立把數據化為己用的能力, 這其中SQL 是最基本的,你必須會用 SQL 查詢數據、會快速寫程序分析數據。當然,編程技術不需要達到軟體工程師的水平。要想更深入的分析問題你可能還會用到:Exploratory analysis skills、Optimization、Simulation、Machine Learning、Data Mining、Modeling 等。業務理解
對業務的理解是數據分析師工作的基礎,數據的獲取方案、指標的選取、還有最終結論的洞察,都依賴於數據分析師對業務本身的理解。
對於初級數據分析師,主要工作是提取數據和做一些簡單圖表,以及少量的洞察結論,擁有對業務的基本了解就可以。對於高級數據分析師,需要對業務有較為深入的了解,能夠基於數據,提煉出有效觀點,對實際業務能有所幫助。對於數據挖掘工程師,對業務有基本了解就可以,重點還是需要放在發揮自己的技術能力上。邏輯思維
對於初級數據分析師,邏輯思維主要體現在數據分析過程中每一步都有目的性,知道自己需要用什麼樣的手段,達到什麼樣的目標。對於高級數據分析師,邏輯思維主要體現在搭建完整有效的分析框架,了解分析對象之間的關聯關系,清楚每一個指標變化的前因後果,會給業務帶來的影響。對於數據挖掘工程師,羅輯思維除了體現在和業務相關的分析工作上,還包括演算法邏輯,程序邏輯等,所以對邏輯思維的要求也是最高的。數據可視化數據可視化主要藉助於圖形化手段,清晰有效地傳達與溝通信息。聽起來很高大上,其實包括的范圍很廣,做個 PPT 里邊放上數據圖表也可以算是數據可視化。
對於初級數據分析師,能用 Excel 和 PPT 做出基本的圖表和報告,能清楚地展示數據,就達到目標了。對於稍高級的數據分析師,需要使用更有效的數據分析工具,根據實際需求做出或簡單或復雜,但適合受眾觀看的數據可視化內容。協調溝通
數據分析師不僅需要具備破譯數據的能力,也經常被要求向項目經理和部門主管提供有關某些數據點的建議,所以,你需要有較強的交流能力。
③ 我想轉行做數據分析師,怎麼入門
需要一定的知識儲備和對業務的基本了解及運用。對於希望轉行數據分析的零基礎小白們,在對於進入數據分析行業需要學什麼、數據分析行業薪酬待遇如何、如何更好地掌握數據分析領域的技能,都是一臉茫然。因此本文給出一些建議,針對想要轉行數據分析行列且是零基礎轉行的小夥伴們。
注意事項:
1、互聯網本身具有數字化和互動性的特徵,這種屬性特徵給數據搜集、整理、研究帶來了革命性的突破。以往「原子世界」中數據分析師要花較高的成本(資金、資源和時間)獲取支撐研究、分析的數據,數據的豐富性、全面性、連續性和及時性都比互聯網時代差很多。
2、與傳統的數據分析師相比,互聯網時代的數據分析師面臨的不是數據匱乏,而是數據過剩。因此,互聯網時代的數據分析師必須學會藉助技術手段進行高效的數據處理。更為重要的是,互聯網時代的數據分析師要不斷在數據研究的方法論方面進行創新和突破。
3、就行業而言,數據分析師的價值與此類似。就新聞出版行業而言,無論在任何時代,媒體運營者能否准確、詳細和及時地了解受眾狀況和變化趨勢,都是媒體成敗的關鍵。
4、此外,對於新聞出版等內容產業來說,更為關鍵的是,數據分析師可以發揮內容消費者數據分析的職能,這是支撐新聞出版機構改善客戶服務的關鍵職能。
④ 如何提高數據分析師的業務知識
很多數據分析師都認為學好數據分析的技能就足夠了,於是就把所有的精力放在了數據分析的知識上,從而忽略了數據分析師的業務知識。說真的,一個優秀的數據分析師不會忽略業務知識,這是因為數據分析師針對業務而進行工作的,如果脫離了業務,那麼數據分析工作就沒有了靈魂,或者數據分析的准確性就容易遭受質疑,那麼如何提高數據分析師的業務知識呢?下面就由小編為大家解答一下這個問題。
其實數據分析知識中的業務知識有很多,不過確實很簡單的,一般有很多種方式,需要大家隨時隨地的進行業務學習,我們可以多多的向業務部門的同事去請教,通過溝通的方式和業務部門汲取經驗,有的人會擔心業務部門怕自己的知識儲備泄露不會傳授知識,也就是怕業務部門怕自己教會徒弟餓死師傅而拒絕自己,其實這種想法是多餘的,首先業務部門和數據分析部門並沒有什麼利益沖突,只要有一顆虛心請教的心,就可以學到知識。
我們還可以通過網路進行搜集知識,在一些行業的網站上搜索一些關鍵字,並且關心行業發生了什麼以及競爭對手都發展了什麼,當然,不能只是看,需要和公司的業務數據結合起來,這樣才能夠學到一點業務的知識。當然,我們還要多多帶來觀察各種數據分析的案例,通過裡面的內容汲取經驗和知識,這樣我們才能夠不斷的提高自己。
如果有條件的話,我們可以多多的往一線跑,如果多多的向一線的客戶溝通,這是提升業務知識的最好方法。這些就是實踐性的學習知識,一般來說,實踐出真知,我們還要經常走出辦公室,多多去交流,去實踐。數據分析做為數據分析師們單獨的技能,但是並不能體現其作用,需要同實際業務相結合,才能發揮出最大的價值。
由此可見,業務知識是一個非常重要的技能。通過上面的描述想必大家看了這篇文章以後已經知道了如何提高業務知識了吧,大家在進行學習數據分析知識的時候一定不能忘了或者忽視了業務知識的學習,只有重視業務知識,才能夠做好每一次的數據分析工作。希望這篇文章能夠給大家帶來幫助。
⑤ 數據分析需要掌握些什麼知識
要想成為一名專業的數據分析師,就需要滿足數據分析師的職業要求。數據分析師的職業要求可以總結為以下幾個方面。
(1)掌握統計相關的數學知識
和統計相關的數學知識是數據分析師需要具備的基礎知識,數據分析師可以根據自己的能力和水平學習相關的統計學知識,初級數據分析師和高級數據分析師需要對統計學知識掌握的程度是不一樣的。
如果你是初級數據分析師,了解一些描述統計相關的基礎內容,有一定的公式計算能力就可以,如果了解常用的統計模型演算法那會是你的加分項。
對高級數據分析師來說,只了解基礎的統計學知識是不夠的。統計模型的相關知識是高級數據分析師必備的能力,最好對線性代數(主要是矩陣計算相關知識)也有一些了解。
「工欲善其事,必先利其器」,要成為一名合格的數據分析師,會使用數據分析工具非常重要。這里所說的工具也就是數據分析軟體,例如Excel、SPSS、SAS等。由於Excel通用性強、使用門檻低、功能強大,所以深受數據分析人員的喜愛,也是數據分析師必須掌握的一個數據分析工具,本書所涉及的數據分析內容均使用Excel進行講解。當然,數據分析師也可以根據自己的能力選擇性的掌握SPSS和SAS等進行高級數據分析的工具。
對於初級數據分析師來說,掌握Excel是硬性要求,必須能熟練使用數據透視表和公式,會使用VBA(一種宏語言)的話則是你的加分項。
對於高級數據分析師來說,使用數據分析工具是核心能力。VBA是必備技能,至少熟練使用SPSS/SAS/R其中的一種,可以根據具體情況選擇掌握其他分析工具(MATLAB)。
不過,電商數據分析人員除了掌握Excel、SPSS和SAS等本地軟體外,還需要掌握像生意參謀、京東商智等專門的電商數據獲取和分析工具。
(3)理解業務
對業務的理解是數據分析師所有工作的基礎,無論是數據獲取方案、指標的選取還是得出最終結論,都依賴於數據分析師對業務本身的理解。
但是要學習和掌握業務知識需要長時間的積累,成為業務專家非常不易,數據分析師則是在業務專家之上的更深層次的思考和總結,否則在數據分析工作中誰指導誰都是個問題。
學習業務知識的方法有很多,以前的分析報告和取數案例都可以拿來研究,當然這也是一個循序漸進的過程。
(4)掌握數據分析方法
做數據分析一定要了解數據分析的方法、應用場景、使用過程以及優缺點,能夠根據具體情況在實際工作中靈活應用,確保數據分析工作能夠有效開展。
基本的數據分析方法有:平均分析法、分組分析法、對比分析法、交叉分析法、結構分析法、綜合評價分析法、矩陣關聯分析法等。
高級的數據分析方法包括:聚類分析法、回歸分析法、類別分析法、因子分析法、對應分析法等。在做數據分析時,應該在明確目的的前提下選擇適合的分析方法。
(5)了解基本設計原則
數據分析師需要通過圖表把自己的分析結論和觀點展現出來,根據相關的設計原則對圖表進行調整,可以使數據分析結果一目瞭然。