① 數據科學家需要具備什麼能力
分析和機器學習是數據科學家工作的核心
需要統計學和計算機科學技能
最常見的技術技能:
1. Python
是數據科學家的主要語言
2. R
Python或R對於幾乎每一個數據科學家職位來說都是必須的
3. SQL
在數據科學領域,SQL有時會被忽視,但是如果打算進入就業市場,這是一項值得展示的技能
4. Hadoop和Spark
它們都是Apache提供的用於大數據的開源工具
5. Java和SAS
這兩種語言的背後都有大公司支持,至少有一些免費產品
6. Tableau
這個分析平台和可視化工具功能強大,易於使用,並且越來越受歡迎
② 數據科學家的核心技能是什麼
能夠從不同的角度提出回答問題的方法,並且有取捨。也許沒有一個方法是百分百正確或者可以百分百給出問題答案的,但是一個好的數據分析師,能夠給出不同維度的數據,總結出其中的故事,給出可能性最高的答案。繼續剛才的例子,產品前期用戶最重要的使用特點是什麼,是一個可以推廣的特點嗎,除了去看用戶對這個產品的使用數據,你也許還想看一下用戶在其他同類競爭產品裡面的使用數據,也許還想看一些市場數據來確定市場大小以及市場需求,也許還想看一下用戶本身的屬性(年齡,學歷,性別,居住地或者主要社交圈),也許還想看一下用戶使用產品之後的變化..可以看的事情非常多,也很容易迷失在無窮無盡的曲線中。可是,哪些才是最重要的呢。