1. 怎樣對數據進行分析
數據分析方法:
1、對比分析法
對比分析法是通過指標的對比來反映事物數量上的變化,屬於統計分析中常用的方法。常見的對比有橫向對比和縱向對比。利用對比分析法可以對數據規模大小、水平高低、速度快慢等做出有效的判斷和評價。
2、分組分析法
分組分析法是根據數據的性質、特徵,按照一定的指標,將數據總體劃分為不同的部分,分析其內部結構和相互關系,從而了解事物的發展規律。根據指標的性質,分組分析法分為屬性指標分組和數量指標分組。
所謂屬性指標代表的是事物的性質、特徵等,如姓名、性別、文化程度等,這些指標無法進行運算;而數據指標代表的數據能夠進行運算,如人的年齡、工資收入等。分組分析法一般都和對比分析法結合使用。
3、預測分析法
預測分析法主要基於當前的數據,對未來的數據變化趨勢進行判斷和預測。
預測分析一般分為兩種:一種是基於時間序列的預測,例如,依據以往的銷售業績,預測未來3個月的銷售額;另一種是回歸類預測,即根據指標之間相互影響的因果關系進行預測,例如,根據用戶網頁瀏覽行為,預測用戶可能購買的商品。
4、漏斗分析法
漏斗分析法也叫流程分析法,它的主要目的是專注於某個事件在重要環節上的轉化率,在互聯網行業的應用較普遍。
比如,對於信用卡申請的流程,用戶從瀏覽卡片信息,到填寫信用卡資料、提交申請、銀行審核與批卡,最後用戶激活並使用信用卡,中間有很多重要的環節,每個環節的用戶量都是越來越少的,從而形成一個漏斗。
使用漏斗分析法,能使業務方關注各個環節的轉化率,並加以監控和管理,當某個環節的轉換率發生異常時,可以有針對性地優化流程,採取適當的措施來提升業務指標。
5、AB測試分析法
AB測試分析法其實是一種對比分析法,但它側重於對比A、B兩組結構相似的樣本,並基於樣本指標值來分析各自的差異。
例如,對於某個App的同一功能,設計了不同的樣式風格和頁面布局,將兩種風格的頁面隨機分配給使用者,最後根據用戶在該頁面的瀏覽轉化率來評估不同樣式的優劣,了解用戶的喜好,從而進一步優化產品。
2. 怎樣用Excel做數據分析
前言
最近鬆懈了,花了很多時間在玩游戲看視頻上,把學習計劃耽擱了,總說要自律,但光說不做是沒用的,最主要是自控能力太差了,得承認自己和大多數人一樣,愛玩、不願意邁出舒適區,「知行合一」,只四個字,大道至簡,卻超過99%的人都做不到。在前進的路上,希望自己能克服惰性,提升自控力,按計劃耐心學習並踐行。
1、數據分析步驟:
提出問題→理解數據→數據清洗→構建模型→數據可視化
2、實踐案例:
利用一份招聘網站的數據作為實戰案例。
第一步提出問題:
1)在哪些城市找到數據分師工作的機會比較大?
2)數據分師的薪水如何?
3)根據工作經驗的不同,薪酬是怎樣變化的?
第二步理解數據:
初始數據有6875條,14項內容。
設置表格列寬(步驟如下圖),顯示全部內容,方便後續操作,最後保存。
第三步清洗數據:
這一步需要花費的時間佔大部分,把數據處理成自己想要的樣子。
1、選擇子集:選擇公司全名和公司ID兩列並隱藏(取消隱藏方法:全選表格→開始→格式→隱藏和取消隱藏→取消隱藏列)
2、列名重命名:雙擊列名可以修改成自己想要的列名。
3、刪除重復值:選擇職位ID將其重復值刪除(步驟如下圖)
4、缺失值處理:選擇職位ID列計數5032,選擇城市列計數5030,城市列缺失兩個數據。
查找並定位城市列的缺失值(步驟如下圖),缺失值填上海。
缺失值處理的4種方法,根據情況靈活使用:
1)通過人工手動補全;
2)刪除缺失的數據;
3)用平均值代替缺失值;
4)用統計模型計算出的值去代替缺失值。
5、一致化處理:對「公司所屬領域」進行一致化處理(步驟如下圖)
將原來的「公司所屬領域」列隱藏,並將復制的列進行分列:
6、數據排序:
7、異常值處理:
第四步構建模型
第五步數據可視化
通過上面的分析,我們可以得到的以下分析結論有:
1)數據分析這一崗位,有大量的工作機會集中在北上廣深以及新一線城市,如果你將來去這些城市找工作,可以提高你成功的條件概率。
2)從待遇上看,數據分析師留在深圳發展是個不錯的選擇,其次是北京、上海。
3)數據分析是個年輕的職業方向,大量的工作經驗需求集中在1-3年。
對於數據分析師來說,5年似乎是個瓶頸期,如果在5年之內沒有提升自己的能力,大概以後的競爭壓力會比較大。
4)隨著經驗的提升,數據分析師的薪酬也在不斷提高,10年以上工作經驗的人,能獲得相當豐厚的薪酬。
3、劃重點:
1)分列功能會覆蓋掉右列單元格,所以我們記得先要復制這一列到最後一個空白列的地方,再進行分列操作。
2)上面圖片中的函數:IF(COUNT(FIND({"數據運營","數據分析","分析師"},L2)),"是","否")。
3)Ctrl+Eneter快捷鍵,在不連續的單元格中同時輸入同一個數據或公式時很好用。
4)精確查找和近似查找(模糊查找)的區別
(1)精確查找是指從第一行開始往最後一行逐個查找。一找到匹配項就停止查詢,所以返回找到的第一個值。
(2)當你要近似查找的時候,它就會苦逼地查遍所有的數據,返回的是最後一個匹配到的值。
5)在使用vlookup函數時,在很多情況下使用的是精確匹配,而在進行分組時需要用模糊匹配,所以這里要輸入「1」來進行模糊匹配。
6)Excel設置了快捷鍵F4幫助用戶迅速切換相對引用、絕對引用和混合引用,步驟如下:
(1)選定包含該公式的單元格;
(2)在編輯欄中選擇要更改的公式內容,並按 F4 鍵;
(3)以引用單元格A1為例,每次按 F4 鍵時,Excel會依次在以下組合間切換:
按一次F4是絕對引用
按兩次、三次F4是混合引用
按四次F4是相對引用
7)使用這個函數過程中,如果出現錯誤標識「#N/A」,一般是3個原因導致:
(1)第2個參數:查找范圍里第一列的值必須是要查找的值。
比如這個案例里第2個參數選定的的范圍里第一列是姓名,是要查找值的列。
(2)數據存在空格,此時可以嵌套使用TRIM函數將空格批量刪除。
(3)數據類型或格式不一致,此時將數據類型或格式轉為一致即可。