㈠ 怎麼做數據分析
怎麼做數據分析,如下所示:
1.對比分析法:對比分析法指通過指標的對比來反映事物數量上的變化,屬於統計分析中常用的方法。常見的對比有橫向對比和縱向對比。
橫向對比指的是不同事物在固定時間上的對比,例如,不同等級的用戶在同一時間購買商品的價格對比,不同商品在同一時間的銷量、利潤率等的對比。
2.分組分析法:分組分析法是指根據數據的性質、特徵,按照一定的指標,猜升乎將數據總體劃分為不同的部分,分析其內部結構和相互關系,從而了解事物的發展規律。根據指標的性質,分組分析法分為屬性指標分組和數量指標分組。
所謂屬性指標代表的是事物的性質、特徵等,如姓名、性別、文化程度穗悉等,這些指標無法進行運算;而數據指標代表的數據能夠進行運算,如人的年齡、工資收入等。分組分析法一般都和對比分析法結合使用。
㈡ 數據分析怎麼做
Step1:目標確定
這一步在工作中通常是由你的客戶/上級/其他部門同事/合作方提出來的,但第一次的數據報告中,需要你自己來提出並確定目標。
選擇目標時,請注意以下幾點:
選擇一個你比較熟悉,或者比較感興趣的領域/行業;
選擇一個范圍比較小的細分領域/細分行業作為切入點;
確定這個領域/行業有公開發表的數據/可以獲取的UGC內容(論壇帖子,用戶點評等)。
Step2:數據獲取
目標定下來了,接下來要去找相應的數據。如果你制定目標時完全遵循了第一悶漏兄步的三個注意點,那麼你現在會很明確要找哪些數據。如果現在你還不確定自己需要哪些數據,那麼回到第一步重來吧。
Step3:數據清洗
在工作中,90%以上的情況,你拿到的數據都需要先做清洗工作,排除異常值、空白值、無效值、重復值等等。這項工作經常會佔到整個數據分析過程將近一半的時間。
如果在上一步中,你的數據是通過手工復制/下載獲取的,那麼通常會比較干凈,不需要做太多清洗工作。但如果數據是通過爬蟲等方式得來,那麼你需要進行清洗,提取核心內容,去掉網頁代碼、標點符號等無用內容。
無論你採用哪一種方式獲取數據,請記住,數據清洗永遠是你必須要做的一項工作。
Step4:數據整理
清洗過後,需要進行數據整理,即將數據整理為能夠進行下一步分析的格式,對於初學者,用Excel來完成這一工作就OK。
如果你的數據已經是表格形式,那麼計算一些二級指標就好,比如用今年銷量和去年銷量算出同比增長率。鑒於你是第一次做數據報告,建議你不要計算太多復雜的二級指標,基本的同比、環比、佔比分布這些就OK。
如果你收集的是一些非數字的數據,比如對商家的點評,那麼你進行下一步統計之前,需要通過「關鍵詞-標簽」方式,將句子轉化為標簽,再對標簽進行統計。
Step5:描述分析
描述分析是最基本的分析統計方法,在實際工作中也是應用最廣的分析方法。描述統計分為兩大部分:數據描述和指標統計。
數據描述:用來對數據進行基本情況的刻畫,包括:數據總數、時間跨度、時間粒度、空間范圍、空間粒度、數據來源等。如果是建模,那麼還要看數據的極值、分布、離散度等內容。
指標統計:用來作報告,分析實際情況的數據指標,可粗略分為四大類:變化、分布、對比、預測;
變化:指標隨時間的變動,表現為增幅(同比、環比等);
分布:指標在不同層次上的表現,包括地域分布(省、市、區縣、店/網點)、用戶群分布(年齡、性別、職業等)、產品分布(螞襲如動感地帶和全球通)等;
預測:根據現有情況,估計下個分析時段的指標值。
描述分析的產出是圖表,下一個步驟的內容將基於這些圖表產出。
Step6:洞察結論
這一步是數據報告的核心,也是最能看出數據分析師水平的部分。一個年輕的分析師和一個年邁的分析師拿到同樣的圖表,完全有可能解讀出不同的內容。
但通常來說,即使是復雜的數據報告,也是由一個個相對簡單的洞察結論組成的,這其中涉及到問題的分拆,邏輯線的建立等一系列內容。作為初學者,做到自己力所能及的程度就好。
總結一下,所謂洞察,就是要越過數據,去推測和理解真實情況。單純描述數據,誰都會做,根據數據得出有價值的結論,報告才有意義。
Step7:報告撰寫
都到這一步了,相信各位對數據報告也不再陌生了。這一步中,需要保證的是數據報告內容的完整性。
一個完整的數據報告,應至少包含以下六塊內容:
報告背景
報告目的
數據來源、數量等基本情況
分頁圖表內容搜禪及本頁結論
各部分小結及最終總結
下一步策略或對趨勢的預測
其中,背景和目的決定了你的報告邏輯(解決什麼問題);數據基本情況告訴對方你用了什麼樣的數據,可信度如何;分頁內容需要按照一定的邏輯來構建,目標仍然是解決報告目的中的問題;小結及總結必不可少;下一步策略或對趨勢的預測能為你的報告加分。
那麼,普通難度的數據報告做法就是這樣了。高深的固然要更難一些,但是普通的已經將整體的路徑將的很清楚了。