① 数据科学家需要具备什么能力
分析和机器学习是数据科学家工作的核心
需要统计学和计算机科学技能
最常见的技术技能:
1. Python
是数据科学家的主要语言
2. R
Python或R对于几乎每一个数据科学家职位来说都是必须的
3. SQL
在数据科学领域,SQL有时会被忽视,但是如果打算进入就业市场,这是一项值得展示的技能
4. Hadoop和Spark
它们都是Apache提供的用于大数据的开源工具
5. Java和SAS
这两种语言的背后都有大公司支持,至少有一些免费产品
6. Tableau
这个分析平台和可视化工具功能强大,易于使用,并且越来越受欢迎
② 数据科学家的核心技能是什么
能够从不同的角度提出回答问题的方法,并且有取舍。也许没有一个方法是百分百正确或者可以百分百给出问题答案的,但是一个好的数据分析师,能够给出不同维度的数据,总结出其中的故事,给出可能性最高的答案。继续刚才的例子,产品前期用户最重要的使用特点是什么,是一个可以推广的特点吗,除了去看用户对这个产品的使用数据,你也许还想看一下用户在其他同类竞争产品里面的使用数据,也许还想看一些市场数据来确定市场大小以及市场需求,也许还想看一下用户本身的属性(年龄,学历,性别,居住地或者主要社交圈),也许还想看一下用户使用产品之后的变化..可以看的事情非常多,也很容易迷失在无穷无尽的曲线中。可是,哪些才是最重要的呢。