‘壹’ 如何快速成为数据分析师
1、技能一:理解数据库。
还以为要与文本数据打交道吗?答案是:NO!进入了这个领域,你会发现几乎一切都是用数据库 来存储数据,如MySQL,Postgres,CouchDB,MongoDB,Cassandra等。理解数据库并且能熟练使用它,将是一个基础能力。
2、技能二:掌握数据整理、可视化和报表制作。
数据整理,是将原始数据转换成方便实用的格式,实用工具有DataWrangler和R。数据可视化,是创建和研究数据的视觉表现,实用工具有ggvis,D3,vega。数据报表是将数据分析和结果制作成报告。也是数据分析师的一个后续工作。这项技能是做数据分析师的主要技能。可以借助新型软件帮助自己迅速学会分析。
3、技能三:懂设计
说到能制作报表成果,就不得不说说图表的设计。在运用图表表达数据分析师的观点时,懂不懂设计直接影响到图形的选择、版式的设计、颜色的搭配等,只有掌握设计原则才能让结果一目了然。否则图表杂乱无章,数据分析内容不能良好地呈现出来,分析结果就不能有效地传达。
4、技能四:几项专业技哗陵大能
统计学技能——统计学是数据分析的基础,掌握统计学的基本知识是数据分析师的基本功。从数据采集、抽样到具体分析时的验证探索和预测都要用到统计汪纳学。
社会学技能——从社会化角度看,人有社会性,收群体心理的影响。数据分析师没有社乱竖会学基本技能,很难对市场现象做出合理解释。
另外,最好还能懂得财务管理知识和心理学概况。这些都将会使你做数据分析的过程更容易。
5、技能五:提升个人能力。
有了产品可以将数据展示出来,还需要具备基本的分析师能力。首先,要了解模型背后的逻辑,不能单纯地在模型中看,而要放到整个项目的上下文中去看。要理解数据的信息,形成一个整体系统,这样才能够做好细节。另外,与数据打交道,细心和耐心也是必不可少的。
6、技能六:随时贴近数据文化
拥有了数据分析的基本能力,还怕不够专业?不如让自己的生活中充满数据分析的气氛吧!试着多去数据分析的论坛看看,多浏览大数据知识的网站,让自己无时无刻不在进步,还怕不能学会数据分析吗?
拥有这些技能,再去做数据分析,数据将在你手里变得更亲切,做数据分析也会更简单更便捷,速成数据分析师不再遥远。
(1)如何升华数据价值扩展阅读:
企业对数据分析师的基础技能需求差别不大,可总结如下:
SQL数据库的基本操作,会基本的数据管理
会用Excel/SQL做基本的数据分析和展示
会用脚本语言进行数据分析,Python or R
有获取外部数据的能力,如爬虫
会基本的数据可视化技能,能撰写数据报告
熟悉常用的数据挖掘算法:以回归分析为主
‘贰’ 一名优秀的数据分析师是怎样炼成的
近些年,互联网公司对数据分析师岗位的需求越来越多,这不是偶然。
过去十多年,中国互联网行业靠着人口红利和流量红利野蛮生长;而随着流量获取成本不断提高、运营效率的不断下降,这种粗放的经营模式已经不再可行。互联网企业迫切需要通过数据分析来实现精细化运营,降低成本、提高效率;而这对数据分析师也提出了更高的要求。
本文将和大家分享数据分析师的演变、数据分析价值体系、数据分析师必备的四大能力、七大常用思路以及实战分析案例。
一、数据分析师的前世今生
在介绍数据分析师之前,我们先来看一下这几个历史人物,看看他们都跟数据分析师有着怎样的渊源?
历史上大名鼎鼎的“分析师”
上面展示的六个历史人物(从左往右,从上往下)分别是:张良、管仲、萧何、孙斌、鬼谷子和诸葛亮。他们是历史上大名鼎鼎的谋士,有的还做过丞相。他们博览群书、眼光独到,通过对大量史实进行总结发现了很多规律,并且在实践中成功预测了很多事件。他们通过 “历史统计——总结分析——预测未来”的实践为自己的组织创造了绝大的价值,而这就是“数据分析师”的前身。
那么现在,数据分析师需要哪些必备技能,如何成为一名优秀的数据分析师呢?
二、数据分析师的价值金字塔
一个完整的企业数据分析体系涉及到多个环节:采集、清理、转化、存储、可视化、分析决策等等。其中,不同环节工作内容不一样,消耗的时间和产生的价值也相差甚远。
数据分析价值金字塔
互联网企业数据分析体系中至少有三方面的数据:用户行为数据、交易订单数据和CRM数据。工程师把不同来源的数据采集好,然后通过清理、转化等环节统一到数据平台上;再由专门的数据工程师从数据平台上提出数据。这些工作占用了整个环节90%的时间,然而产生的价值却只占10%。
这个金字塔再往上数据分析就和业务实际紧密结合,以报表、可视化等方式支持企业的业务决策,涵盖产品、运营、市场、销售、客户支持各个一线部门。这个部分占用了整个环节才10%的时间,但是却能产生90%的价值。
一个优秀的商务数据分析师应该以价值为导向,紧密结合产品、运营、销售、客户支持等实践,支持各条业务线发现问题、解决问题并创造更多的价值。
三、数据分析师必备的四大能力
数据分析师必备的四大技能
1.全局观
某日,产品经理跑过来问我:Hi,能不能帮我看一下昨天产品新功能发送的数据?谢谢!条件反射我会说:好,我马上给你!不过我还是礼貌性地问了一句:为什么需要这数据呢?产品经理回复道:哦,昨天新功能上线了,我想看看效果。知道了产品经理的目的,我就可以针对性地进行数据提取和分析,分析的结果和建议也就更加具有可操作性。
很多时候,数据分析师不能就数说数,陷入各种报表中不能自拔。一个优秀的数据分析师应该具有全局观,碰到分析需求的时候退一步多问个为什么,更好地了解问题背景和分析目标。
2.专业度
某企业的数据科学家针对用户流失情形进行建模预测,最终得到的用户流失模型预测准确率高达90%多。准确率如此之高,让商务分析师都不敢相信。经过检验,发现数据科学家的模型中有一个自变量是 “用户是否点击取消按钮” 。而点击了“取消”按钮是用户流失的重要征兆,做过这个动作的用户基本上都会流失,用这个自变量来预测流失没有任何业务意义和可操作性。
数据分析师要在所在行业(例如电商、O2O、社交、媒体、SaaS、互金等等)展示她/他的专业度,熟悉自己行业的业务流程和数据背后的意义,避免上面的数据笑话。
3.想象力
商业环境的变化越来越快、越来越复杂,一组商业数据的背后涉及到的影响因素是常人难以想象的。数据分析师应该在工作经验的基础上发挥想象力,大胆创新和假设。
4.信任度
以销售岗位为例,一个销售人员首先要和用户建立起信任;如果用户不信任你的话,那他也很难信任或者购买你的产品。同理,数据分析师要和各部门同事建立良好的人际关系,形成一定的信任。各个部门的同事信任你了,他们才可能更容易接受你的分析结论和建议;否则事倍功半。
四、数据分析常见的七种思路
1.简单趋势
通过实时访问趋势了解产品使用情况,便于产品迅速迭代。访问用户量、访问来源、访问用户行为三大指标对于趋势分析具有重要意义。
分钟级别的实时走势
以星期为周期的趋势对比
2.多维分解
数据分析师可以根据分析需要,从多维度对指标进行分解。例如浏览器类型、操作系统类型、访问来源、广告来源、地区、网站/手机应用、设备品牌、APP版本等等维度。
多维度分析访问用户的属性
3.转化漏斗
按照已知的转化路径,借助漏斗模型分析总体和每一步的转化情况。常见的转化情境有注册转化分析、购买转化分析等。
漏斗分析展示注册每一步的流失率
4.用户分群
在精细化分析中,常常需要对有某个特定行为的用户群组进行分析和比对;数据分析师需要将多维度和多指标作为分群条件,有针对性地优化产品,提升用户体验。
5.细查路径
数据分析师可以观察用户的行为轨迹,探索用户与产品的交互过程;进而从中发现问题、激发灵感亦或验证假设。
通过细查路径分析用户的行为规律
6.留存分析
留存分析是探索用户行为与回访之间的关联。一般我们讲的留存率,是指“新增用户”在一段时间内“回访网站/app”的比例。 数据分析师通过分析不同用户群组的留存差异、使用过不同功能用户的留存差异来找到产品的增长点。
留存分析发现“创建图表”的用户留存度更高
7.A/B 测试
A/B测试就是同时进行多个方案并行测试,但是每个方案仅有一个变量不同;然后以某种规则(例如用户体验、数据指标等)优胜略汰选择最优的方案。数据分析师需要在这个过程中选择合理的分组样本、监测数据指标、事后数据分析和不同方案评估。
五、数据分析实战案例
某社交平台推出付费高级功能,并且以EDM(Email Direct Marketing,电子邮件营销)的形式向目标用户推送,用户可以直接点击邮件中的链接完成注册。该渠道的注册转化率一直在10%-20%之间;但是8月下旬开始注册转化率急剧下降,甚至不到5%。
如果你是该公司的数据分析师,你会如何分析这个问题呢?换言之,哪些因素可能造成EDM转化率骤降?
一个优秀的数据分析师应该具有全局观和专业度,从业务实际出发,综合各个方面的可能性。因此,EDM注册转化率骤降的可能性罗列如下:
1.技术原因:ETL延迟或者故障,造成前端注册数据缺失,注册转化率急剧下降;
2.外部因素:该时间节点是否有节假日,其他部门近期是否有向用户发送推广邮件,这些因素可能稀释用户的注意力;
3.内部因素:邮件的文案、设计是否有改变;邮件的到达率、打开率、点击率是否正常;邮件的注册流是否顺畅。
经过逐一排查,数据分析师将原因锁定在注册流程上:产品经理在注册环节添加了绑定信用卡的内容,导致用户的注册提交意愿大幅度下降,转化率暴跌。
一个看似简单的转化率分析问题,它的背后是数据分析师各方面能力的体现。首先是技术层面,对ETL(数据抽取-转换-载入)的理解和认识;其实是全局观,对季节性、公司等层面的业务有清晰的了解;最后是专业度,对EDM业务的流程、设计等了如指掌。
练就数据分析的洪荒之力并非一朝一夕之功,而是在实践中不断成长和升华。一个优秀的数据分析师应该以价值为导向,放眼全局、立足业务、与人为善,用数据来驱动增长。