1. 數據分析師需要學什麼
一、統計學:我看一些人推薦了不少統計學的專業書籍,直接把人嚇跑了。
我自己就大學時候學過《概率論與數理統計》,其他統計相關的內容也沒怎麼看過。
對於互聯網的數據分析來說,並不需要掌握太復雜的統計理論。
所以只要按照本科教材,學一下統計學就夠了。
二、編程能力:學會一門編程語言,會讓你處理數據的效率大大提升。
如果你只會在 Excel 上復制粘貼,動手能力是不可能快的。
我比較推薦 Python,上手比較快,寫起來比較優雅。
三、資料庫:數據分析師經常和資料庫打交銷喚道,不掌握資料庫的使用可不行。
學會如何建表和使用 SQL 語言進行數據處理,可以說是必不可少的技能。
四、數據倉庫:許多人分不清楚資料庫和數據倉庫的差異,簡鏈吵單來說,數據倉庫記錄了所有歷史數據,專門設計為方便數據分析人員高效使用的。
五、數據分析方法:對於互聯網數據分析人員來說,可以看一下《精益創業》和《精益數據分析》,掌握常用的數據分析方法,然後再根據自己公司的產品調整,靈活組合。
六、數據分析工具:SAS、Matlab、SPSS 這些工具經常有人推薦,我要說的是在互聯虧喚凱網公司一般都用不上。
做可視化的 Tableau,統計分析的友盟、網路統計,還有像我們神策分析等。
2. 數據分析師要學會什麼技能
要熟練使用 Excel、至少熟悉並精通一種數據挖掘工具和語言、撰寫報告的能力、要打好扎實的 SQL 基礎。
1、要熟練使用 Excel
Excel 可以進行各種數據的處理、統計分析和輔助決策操作,作為常用的數據處理和展現工具,數據分析師除了要熟練將數據用 Excel 中的圖表展現出來,還需要掌握為生成的圖表做一系 列的格式設置的方法。
注意:
1、與傳統的數據分析師相比,互聯網時代的數據分析師面臨的不是數據匱乏,而是數據過剩。因此,互聯網時代的數據分析師必須學會藉助技術手段進行高效的數據處理。更為重要的是,互聯網時代的數據分析師要不斷在數據研究的方法論方面進行創新和突破。
2、就行業而言,數據分析師的價值與此類似。就新聞出版行業而言,無論在任何時代,媒體運營者能否准確、詳細和及時地了解受眾狀況和變化趨勢,都是媒體成敗的關鍵。
3. 數據分析需要掌握些什麼知識
1、數學知識:數學是每一位數據分析師必學的基礎知識,對於初級數據分析師來講,必須要具備一定的公式計算能力,並且要了解常用的模型演算法。
2、分析工具:對於初級分析師來看,必須要學會玩轉excel,並且要將透視表和公式使用的比較熟練。除此之外,還要學會VBA基本必備,SPSS/SAS/R等分析工具的使用。
3、編程語言:初級的數據分析師,是必須要會寫SQL查詢,有需要的可以寫一下Hadoop和Hive查詢。另外,還要學習好Python,這都是具備的基礎語言。
4、業務理解:業務理解對於每一位數據分析來說也是基礎的知識,主要包括獲取方案以及指標的選取還有最終結論洞察等各個方面的內容。
4. 數據分析需要學習哪些
1、數學知識
數學知識是數據分析師的基礎知識。對於初級數據分析師,了解一些描述統計相關的基礎內容,有一定的公式計算能力即可,了解常用統計模型演算法則是加分。
對於高級數據分析師,統計模型相關知識是必備能力,線性代數(主要是矩陣計算相關知識)最好也有一定的了解。
而對於數據挖掘工程師,除了統計學以外,各類演算法也需要熟練使用,對數學的要求是最高的。
所以數據分析並非一定要數學能力非常好才能學習,只要看你想往哪個方向發展,數據分析也有偏“文”的一面,特別是女孩子,可以往文檔寫作這一方向發展。
2、分析工具
對於初級數據分析師,玩轉Excel是必須的,數據透視表和公式使用必須熟練,VBA是加分。另外,還要學會一個統計分析工具,SPSS作為入門是比較好的。
對於高級數據分析師,使用分析工具是核心能力,VBA基本必備,SPSS/SAS/R至少要熟練使用其中之一,其他分析工具(如Matlab)視情況而定。
對於數據挖掘工程師……嗯,會用用Excel就行了,主要工作要靠寫代碼來解決呢。
3、編程語言
對於初級數據分析師,會寫SQL查詢,有需要的話寫寫Hadoop和Hive查詢,基本就OK了。
對於高級數據分析師,除了SQL以外,學習Python是很有必要的,用來獲取和處理數據都是事半功倍。當然其他編程語言也是可以的。
對於數據挖掘工程師,Hadoop得熟悉,Python/Java/C++至少得熟悉一門,Shell得會用……總之編程語言絕對是數據挖掘工程師的最核心能力了。
4、業務理解
業務理解說是數據分析師所有工作的基礎也不為過,數據的獲取方案、指標的選取、乃至最終結論的洞察,都依賴於數據分析師對業務本身的理解。
對於初級數據分析師,主要工作是提取數據和做一些簡單圖表,以及少量的洞察結論,擁有對業務的基本了解就可以。
對於高級數據分析師,需要對業務有較為深入的了解,能夠基於數據,提煉出有效觀點,對實際業務能有所幫助。
對於數據挖掘工程師,對業務有基本了解就可以,重點還是需要放在發揮自己的技術能力上。
業務能力是優秀數據分析師必備的,如果你之前對某一行業已經非常熟悉,再學習數據分析,是非常正確的做法。剛畢業沒有行業經驗也可以慢慢培養,無需擔心。
5、邏輯思維
這項能力在我之前的文章中提的比較少,這次單獨拿出來說一下。
對於初級數據分析師,邏輯思維主要體現在數據分析過程中每一步都有目的性,知道自己需要用什麼樣的手段,達到什麼樣的目標。
對於高級數據分析師,邏輯思維主要體現在搭建完整有效的分析框架,了解分析對象之間的關聯關系,清楚每一個指標變化的前因後果,會給業務帶來的影響。
對於數據挖掘工程師,邏輯思維除了體現在和業務相關的分析工作上,還包括演算法邏輯,程序邏輯等,所以對邏輯思維的要求也是最高的。
6、數據可視化
數據可視化說起來很高大上,其實包括的范圍很廣,做個PPT里邊放上數據圖表也可以算是數據可視化,所以我認為這是一項普遍需要的能力。
對於初級數據分析師,能用Excel和PPT做出基本的圖表和報告,能清楚的展示數據,就達到目標了。
對於高級數據分析師,需要探尋更好的數據可視化方法,使用更有效的數據可視化工具,根據實際需求做出或簡單或復雜,但適合受眾觀看的數據可視化內容。
對於數據挖掘工程師,了解一些數據可視化工具是有必要的,也要根據需求做一些復雜的可視化圖表,但通常不需要考慮太多美化的問題。
7、協調溝通
對於初級數據分析師,了解業務、尋找數據、講解報告,都需要和不同部門的人打交道,因此溝通能力很重要。
對於高級數據分析師,需要開始獨立帶項目,或者和產品做一些合作,因此除了溝通能力以外,還需要一些項目協調能力。
對於數據挖掘工程師,和人溝通技術方面內容偏多,業務方面相對少一些,對溝通協調的要求也相對低一些。
5. 數據分析需要掌握哪些知識
數學知識
對於初級數據分析師來說,則需要了解統計相關的基礎性內容,公式計算,統計模型等。當你獲得一份數據集時,需要先進行了解數據集的質量,進行描述統計。
而對於高級數據分析師,必須具備統計模型的能力,線性代數也要有一定的了解。分析工具
對於分析工具,SQL 是必須會的,還有要熟悉Excel數據透視表和公式的使用,另外,還要學會一個統計分析工具,SAS作為入門是比較好的,VBA 基本必備,SPSS/SAS/R 至少要熟練使用其中之一,其他分析工具(如 Matlab)可以視情況而定。編程語言
數據分析領域最熱門的兩大語言是 R 和 Python。涉及各類統計函數和工具的調用,R無疑有優勢。但是大數據量的處理力不足,學習曲線比較陡峭。Python 適用性強,可以將分析的過程腳本化。所以,如果你想在這一領域有所發展,學習 Python 也是相當有必要的。
當然其他編程語言也是需要掌握的。要有獨立把數據化為己用的能力, 這其中SQL 是最基本的,你必須會用 SQL 查詢數據、會快速寫程序分析數據。當然,編程技術不需要達到軟體工程師的水平。要想更深入的分析問題你可能還會用到:Exploratory analysis skills、Optimization、Simulation、Machine Learning、Data Mining、Modeling 等。業務理解
對業務的理解是數據分析師工作的基礎,數據的獲取方案、指標的選取、還有最終結論的洞察,都依賴於數據分析師對業務本身的理解。
對於初級數據分析師,主要工作是提取數據和做一些簡單圖表,以及少量的洞察結論,擁有對業務的基本了解就可以。對於高級數據分析師,需要對業務有較為深入的了解,能夠基於數據,提煉出有效觀點,對實際業務能有所幫助。對於數據挖掘工程師,對業務有基本了解就可以,重點還是需要放在發揮自己的技術能力上。邏輯思維
對於初級數據分析師,邏輯思維主要體現在數據分析過程中每一步都有目的性,知道自己需要用什麼樣的手段,達到什麼樣的目標。對於高級數據分析師,邏輯思維主要體現在搭建完整有效的分析框架,了解分析對象之間的關聯關系,清楚每一個指標變化的前因後果,會給業務帶來的影響。對於數據挖掘工程師,羅輯思維除了體現在和業務相關的分析工作上,還包括演算法邏輯,程序邏輯等,所以對邏輯思維的要求也是最高的。數據可視化數據可視化主要藉助於圖形化手段,清晰有效地傳達與溝通信息。聽起來很高大上,其實包括的范圍很廣,做個 PPT 里邊放上數據圖表也可以算是數據可視化。
對於初級數據分析師,能用 Excel 和 PPT 做出基本的圖表和報告,能清楚地展示數據,就達到目標了。對於稍高級的數據分析師,需要使用更有效的數據分析工具,根據實際需求做出或簡單或復雜,但適合受眾觀看的數據可視化內容。協調溝通
數據分析師不僅需要具備破譯數據的能力,也經常被要求向項目經理和部門主管提供有關某些數據點的建議,所以,你需要有較強的交流能力。
6. 數據分析需要掌握哪些知識
數據分析主要需要學習:認識數據、數據基礎運算:科學計算模塊Numpy—基礎操作、數據統計分析:科學計算模塊Numpy進階—統計分析、數據可視化基礎:賀輪matplotlib基礎繪圖模塊、數據可視化高階:pyecharts三方庫html動圖繪制、表格數據操作:pandas操作表格數據、pandas進階—數據清洗 、數據集成、數據規約等內容。
認識數據:數據的定義、數據的類型、數據的度量方式、數據來源、臟數據來源、為什麼做數據處理、數據處理有哪些維度。
數據基礎運算:科學計算模塊Numpy—基礎操作:簡介、矩陣的創建、矩陣的運算、矩陣的屬性、自定義數組的創建、數組的屬性、特定形式數組的創建、隨機數組的創建、數組的索引、數組的形狀變換、數組的拆分和合並、數組運算
數據統計分析:科學計算模塊Numpy進階—統計分析:numpy文件讀寫、數組去重和重復、數組排序、常用統計分析函數
數據可視化基礎:matplotlib基礎繪圖模:塊折線圖繪制、散點圖繪制、柱狀圖繪制、子圖繪制、直方圖繪制、餅圖繪制、箱線圖繪制、雷達圖肢爛繪制、三維圖繪圖、動圖的繪制
數據可視化高階:pyecharts三方庫html動圖繪制:yecharts簡介、柱狀圖繪制、餅圖繪制、折線圖繪制、組合圖繪制、流向地圖繪制、中國地圖繪制、世界地圖繪制
表格數據操作:pandas操作表格數據:Pandas簡介、DataFrame與Series的創建、DataFrame與Series屬性、DataFrame索引修改、Pandas文件讀寫、DataFrame查詢操作、DataFrame增刪改操作、Pandas統計分析、Pandas時間數據、Pandas分組聚合、Pandas透視表及交叉表
pandas進階—數據清洗 、數據集成、數據規約:認識數據處理、數據集成歷拍漏、數據集成-堆疊合並、數據集成-主鍵合並、數據集成-重疊合並、數據清洗--重復值處理、數據清洗--缺失值處理
7. 數據分析需要掌握哪些知識呢
數據分析所需要掌握的知識:
數學知識
對於初級數據分析師來說,則需要了解統計相關的基礎性內容,公式計算,統計模型等。當你獲得一份數據集時,需要先進行了解數據集的質量,進行描述統計。
而對於高級數據分析師,必須具備統計模型的能力,線性代數也要有一定的了解。
分析工具
對於分析工具,SQL 是必須會的,還有要熟悉Excel數據透視表和公式的使用,另外,還要學會一個統計分析工具,SAS作為入門是比較好的,VBA 基本必備,SPSS/SAS/R 至少要熟練使用其中之一,其他分析工具(如 Matlab)可以視情況而定。
編程語言
數據分析領域最熱門的兩大語言是 R 和 Python。涉及各類統計函數和工具的調用,R無疑有優勢。但是大數據量的處理力不足,學習曲線比較陡峭。Python 適用性強,可以將分析的過程腳本化。所以,如果你想在這一領域有所發展,學習 Python 也是相當有必要的。
當然其他編程語言也是需要掌握的。要有獨立把數據化為己用的能力, 這其中SQL 是最基本的,你必須會用 SQL 查詢數據、會快速寫程序分析數據。當然,編程技術不需要達到軟體工程師的水平。要想更深入的分析問題你可能還會用到:Exploratory analysis skills、Optimization、Simulation、Machine Learning、Data Mining、Modeling 等。
業務理解
對業務的理解是數據分析師工作的基礎,數據的獲取方案、指標的選取、還有最終結論的洞察,都依賴於數據分析師對業務本身的理解。
對於初級數據分析師,主要工作是提取數據和做一些簡單圖表,以及少量的洞察結論,擁有對業務的基本了解就可以。對於高級數據分析師,需要對業務有較為深入的了解,能夠基於數據,提煉出有效觀點,對實際業務能有所幫助。對於數據挖掘工程師,對業務有基本了解就可以,重點還是需要放在發揮自己的技術能力上。
邏輯思維
對於初級數據分析師,邏輯思維主要體現在數據分析過程中每一步都有目的性,知道自己需要用什麼樣的手段,達到什麼樣的目標。對於高級數據分析師,邏輯思維主要體現在搭建完整有效的分析框架,了解分析對象之間的關聯關系,清楚每一個指標變化的前因後果,會給業務帶來的影響。對於數據挖掘工程師,羅輯思維除了體現在和業務相關的分析工作上,還包括演算法邏輯,程序邏輯等,所以對邏輯思維的要求也是最高的。
數據可視化
數據可視化主要藉助於圖形化手段,清晰有效地傳達與溝通信息。聽起來很高大上,其實包括的范圍很廣,做個 PPT 里邊放上數據圖表也可以算是數據可視化。
對於初級數據分析師,能用 Excel 和 PPT 做出基本的圖表和報告,能清楚地展示數據,就達到目標了。對於稍高級的數據分析師,需要使用更有效的數據分析工具,根據實際需求做出或簡單或復雜,但適合受眾觀看的數據可視化內容。
協調溝通
數據分析師不僅需要具備破譯數據的能力,也經常被要求向項目經理和部門主管提供有關某些數據點的建議,所以,你需要有較強的交流能力。
對於高級數據分析師,需要開始獨立帶項目,或者和產品做一些合作,因此除了溝通能力以外,還需要一些項目協調能力。