‘壹’ 为什么要做数据分析师:职业规划很重要
数据分析”作为近几年最火热的词汇,越来越受到大家的关注,而且这一行业就业面很广,薪资相对来说很高,就吸引了大多毕业生青睐。任何行业随着深入发展,都分为3个阶段:初级,中级,高级。
初级要求熟练使用Excel即可;
中级需要的核心技能:
高级需要掌握统计概率,精通SQL,编程语言Python或者是R。
数据分析岗位方向及工作内容可以简单分为业务和技术2大方向:
业务方向——数据运营、数据分析师、商业分析、用户研究、增长黑客、数据产品经理等。
技术方向——数据开发工程师、数据挖掘工程师、数据仓库工程师等。
业务类岗位的数据分析师大多在业务部门,主要工作是数据提取、支撑各部门相关的报表、监控数据异常和波动,找出问题、输出专题分析报告。
学习数据分析师职业规划前景的问题可以到CDA数据分析认证中心了解一下,CDA是大数据和人工智能时代面向国际范围全行业的数据分析专业人才职业简称,具体指在互联网、金融、咨询、电信、零售、医疗、旅游等行业专门从事数据的采集、清洗、处理、分析并能制作业务报告、提供决策的新型数据人才。
‘贰’ 大数据未来的发展前景怎么样呢
从我国数据产量和存量来看,广东、北京、浙江、江苏、上海、等地区数据资源较为丰富,东部地区数据产量和存量均高于西部地区。从省际数据流量来看,东部地区月均互联网省际出口总流量占全国比重超过一半。
在以北上广为代表的东部地区数据资源丰富的背景下,其大数据产业发展水平快于其他地区省份。其中,北上广大数据企业数量占全国比重近70%,广东和北京大数据发展水平较高。
东部地区数据产量整体高于西部,省际数据流量远高于其他地区
2019年,我国数据产量总规模为3.9ZB。从数据产量的地区分布看,2019年全国数据产量排名前十位的省份为广东、北京、浙江、江苏、上海、山东、四川、河南、河北和湖南。
从人均数据产量来看,2019年人均数据产量排名前十位的省份分别是北京、上海、浙江、天津、广东、内蒙古、西藏、海南、江苏和辽宁。整体来看,东部地区数据产量和人均数据产量均高于西部地区。
—— 更多数据来请参考前瞻产业研究院《中国大数据产业发展前景与投资战略规划分析报告》
‘叁’ 我国大数据发展的现状是怎样的
随着信息技术和人类生产生活交汇融合,全球数据呈现爆发增长、海量集聚的特点。无论是国家、企业还是社会公众,都越来越认识到数据的价值。因此,近年来,各地纷纷成立大数据发展局,企业纷纷推动数据资产治理,大数据辐射的行业也从传统的电信、金融逐渐扩展到工业、医疗、教育等。一时间,仿佛各行各业都在谈大数据,人人都在谈大数据。但也有声音说大数据迎来了“七年之痒”,面对大数据热潮也需要一些“冷思考”。我国大数据究竟发展得如何?未来我国大数据发展还有哪些机遇和挑战?
1、大数据产业进展显着
过去几年,大数据理念已经深入人心,“用数据说话”已经成为所有人的共识,数据也成了堪比石油、黄金、钻石的战略资源。五年来,我国大数据产业政策日渐完善,技术、应用和产业都取得了非常明显的进展。
在政策方面,我国从中央到地方的大数据政策体系已经基本完善,目前已经进入落地实施阶段。自从2014年“大数据”这个词写入政府工作报告以来,我国大数据发展的政策环境掀开了全新的篇章。在顶层设计上,国务院《促进大数据发展行动纲要》对政务数据共享开放、产业发展和安全三方面做了总体部署。《政务信息资源共享管理暂行办法》《大数据产业发展规划(2016-2020)》等文件也都已经出台。十九大报告中提出“推动大数据与实体经济深度融合”,“十三五”规划中提出“实施国家大数据战略”。卫健、农业、环保、检察、税务等部门还出台了领域大数据发展的具体政策。截至2019年初,所有省级行政区都发布了大数据相关的发展规划,十几个省市设立了大数据管理局,8个国家大数据综合试验区、11个国家工程实验室启动建设。可以说,大数据的政策体系已经基本搭建完成,目前已经纷纷进入落地实施甚至评估检查阶段。
在技术方面,我国大数据技术发展属于“全球第一梯队”,但国产核心技术能力严重不足。我国独有的大体量应用场景和多类型实践模式,促进了大数据领域技术创新速度和能力水平,处于国际领先地位。在技术全面性上,我国平台类、管理类、应用类技术均具有大面积落地案例和研究;在应用规模方面,我国已经完成大数据领域的最大集群公开能力测试,达到了万台节点;在效率能力方面,我国大数据产品在国际大数据技术能力竞争平台上也取得了前几名的好成绩;在知识产权方面,2018年我国大数据领域专利公开量约占全球的40%,位居世界第二。但我国大数据技术大部分为基于国外开源产品的二次改造,核心技术能力亟待加强。例如,目前国内主流大数据平台技术中,自研比例不超过10%。
在产业方面,我国大数据产业多年来保持平稳快速增长,但面临提质增效的关键转型。2018年,我国大数据产业延续多年来的增速,继续保持相对高速的增长。根据中国信息通信研究院的测算,2018年我国大数据产业整体规模有望达到5400亿元,同比增长15%。然而,综合国内外环境、新兴技术发展等多种因素,大数据产业的增速出现了下滑。我国的大数据产业也面临着从高速发展向高质量发展的关键转型期。
在应用方面,大数据的行业应用更加广泛,正加速渗透到经济社会的方方面面。随着大数据工具的门槛降低以及企业数据意识的不断提升,越来越多的行业开始尝到大数据带来的“甜头”。无论是从新增企业数量、融资规模还是应用热度来说,与大数据结合紧密的行业正在从传统的电信业、金融业扩展到政务、健康医疗、工业、交通物流、能源行业、教育文化等,行业应用“脱虚向实”趋势明显,与实体经济的融合更加深入。
2、产业的五大困局
虽然我国大数据总体发展形势良好,也面临难得的发展机遇,但仍然存在一些困难和问题。
一是,涉及核心技术的产业发展薄弱,未能有效提升我国核心技术竞争力。核心技术的影响力在大数据产业有着极高的重要性。由于大数据企业在完成产品开发后,可以近乎零成本无限制的复制,因此拥有核心技术的大企业,很容易将技术优势转化为市场优势,即凭借具体的信息产品赢得海量用户获得垄断地位。当前,从大数据技术与产品的供给侧看,我国虽然在局部技术实现了单点突破,但大数据领域系统性、平台级核心技术创新仍不多见。大数据处理工具都是“他山之石”,大部分企业用的都是国外的数据采集、数据处理、数据分析、数据可视化技术,自主核心技术突破还有待时日。尤其是开源产品的技术标准方面,我国的影响力尚亟待提升。
二是,数据孤岛和壁垒降低了大数据产业资源配置效率。大数据产业发展必须实现数据信息的自由流动和共享,如果数据不开放、不共享,数据整合就不能实现,数据价值也会大大降低。无论是政府数据、互联网数据还是其他数据,数据拥有者往往不愿对其进行开放流通。受制于前期信息基础设施建设,目前我国政府数据往往还存在着诸多“数据孤岛”和“数据烟囱”,数据价值难以发挥。
三是,数据安全管理薄弱增加了大数据产业的发展风险。大数据技术为经济社会发展带来创新活力的同时,也使数据安全、个人信息保护乃至大数据平台安全等面临新威胁与新风险。海量多源数据在大数据平台汇聚,来自多个用户的数据可能存储在同一个数据池中,并分别被不同用户使用,极易引发数据泄露风险。利用大数据技术对海量数据(21.90 -5.19%,诊股)进行挖掘分析所得结果可能包含涉及国家经济社会等各方面的敏感信息,需要对分析结果的共享和披露加强安全管理。
四是,产业垄断与恶性竞争现象频发,“劣币驱逐良币”现象明显。由于资源型产业门槛低、利润高,新兴的大数据企业往往首先将目光盯在获取数据资源上面。大量依托数据资源优势的企业诞生,为大数据产业带来了低附加值的垄断经济模式,使得依靠技术壁垒打江山的企业不得不面对残酷的市场竞争,放缓了技术研发的步伐。同时,数据垄断问题也愈发明显。少数互联网巨头企业拥有巨大数据,不但对产业发展不利,甚至存在巨大的数据聚集隐患。
五是,各地发展同质化严重,普遍存在重存储轻应用的现象。由于缺乏统一的大数据产业分类统计体系和产业运行监测手段,各地大数据产业的定位相似,同质化竞争加剧。而盲目的重复建设,更是可能导致大数据产业过剩。同时,由于部分地区信息化发展程度有限,大数据应用场景不够丰富,更是以数据中心等大数据存储设施的建设作为发展大数据产业的关键,且规模巨大,目标动辄以百万台计,后期若无法有效利用,将造成巨大的资源浪费。
‘肆’ 数据分析员是什么职业,未来前景如何
数据分析师职位具有鲜明的时代特点和巨大的需求,在大学本科阶段统计专业积极探索培养大学生的数据分析能力,进而为社会提供合格的数据分析师人才的有效对策,具有重要的研究价值和实践意义。
一、数据分析师培养的意义
(一)数据分析师的培养符合国家战略
为适应世界经济一体化的进程,彻底改变我国“项目数据分析”专业技术人才紧缺的现状,2005 年 4 月,全国第一家数据分析事务所在陕西成立,到目前,我国相继已有北京、陕西、江苏、新疆、甘肃、山东、浙江、上海、黑龙江等 14 个省、市、自治区约 80 家项目数据分析专业机构进入中国市场经济舞台,涉及项目已从最初的分析评估业和金融业,扩展至会计师、投融资机构、政府审批和企业管理等众多领域。随着大数据时代的来临,构建大数据研究平台、整合创新资源、实施“专项计划”等成为各个省市的工作重点之一。
(二)数据分析师的就业前景光明
在被视为“数据元年”的今天,数据分析师以待遇优厚和地位尊崇而闻名国际,曾被Times时代杂志誉为“21世纪最热门五大新兴行业”。今天,国内数据分析行业专业人才每年以千位数非速增长着,同期各行业领域空缺岗位已达近二十万,未来中国对数据分析师的需求更是呈井喷之势。
在数据分析人才培养上,国外已经将数据分析师人才作为国家战略。据统计,目前世界 500 强企业中,有90% 以上建立了数据分析部门。大数据时代对数据分析师的巨大需求也大大刺激了高等院校的培养热情。
二、数据分析师职业素养的培养
通过对各大招聘网站数据分析师、市场调查分析师等职位招聘信息的搜集整理和深入分析,挖掘并归纳出社会用人单位对数据分析师职位的知识技能和道德素质等方面的具体要求如下:
(一)数据分析师的职业内涵
数据分析师是指在不同行业中,专门从事数据搜集、整理、分析,并依据数据做出行业或市场研究、评估和预测的专业人员;是以实际数据为依据,对项目现状及远期进行统计、分析、预测并转化为决策信息的专业人才。数据分析师可以通过掌握的大量行业数据,运用科学的计算工具,将经济学原理与数学模型结合,进行科学合理的定量分析,数据分析师可以预测企业未来的收益及风险,为企业经营决策提供科学量化分析的依据。
目前数据分析师的认证主要有 2个:一是注册数据分析师(CDA),由CDA注册数据分析师协会Certified Data Analyst Institute)在顺应大数据、云计算的潮流下发起成立的职业简称;二是项目数据分析师(CPDA),由中国商业联合会数据分析专业委员会以及工信部教育考试中心共同考核认证,证书是申请成立项目数据分析事务所的必备条件之一。
(二)数据分析师的知识要求
掌握多元统计分析、应用回归分析、时间序列分析、计量经济学、经济预测研究等统计建模方法,了解本行业统计方法的新进展;掌握 SQL/oracle 等数据库的数据整理、查询、提取等方法;熟练使用相关的统计软件,准确解读软件的运行结果;了解相关行业的业务知识和数据构成。
(三)数据分析师的能力要求
对信息、数据敏感,具备较强的文字功底,能独立撰写研究报告;能熟练使用 SPSS/SAS/Eviews 等统计分析软件,具备数据分析或数据挖掘的综合能力;掌握数据库体系结构及数据架构,具备 Excel/SQL 或 Access 的查询语句运用技能与知识,有良好的数据处理、建立统计模型能力。
(四)数据分析师的岗位职责
承担行业、企业有关信息、数据的调查、搜集、整理、分析研究和发布工作;参与专项研究、课题和调研咨询项目,撰写行业分析文章和研究报告;对大数据进行深入挖掘,建立相关模型进行预测、分析,找出相关的联系,揭示内在规律,为行业、企业决策提供依据。
三、数据分析师的培养方案
培养方案是高等教育办学思想和办学理念的集中体现,为突出数据分析的培养特色,统计专业应在深入分析数据分析职业需求的前提下,最终制定出符合数据分析师培养要求的课程体系。
(一)培养目标
为学生毕业后能够成为各行业中数据分析领域的专门人才,确定了统计专业学生在本科教育阶段的培养目标:一是具备良好的经济学、管理学和财务管理等基本素养;二是了解相关行业知识、公司业务流程;三是掌握统计学的基本理论与方法,具备熟练使用 SPSS/SAS 等统计分析软件进行数据分析或数据挖掘的综合能力;四是掌握数据库体系结构及数据架构,具备 Excel/SQL 或Access 的查询语句运用技能与知识,有良好的数据处理、建立统计模型能力;五是具备较强的文字功底,能独立撰写数据分析研究报告。
(二)课程体系设立原则
在本科教育阶段,培养数据分析师的课程设置应贯彻“三结合”的原则。
1. 多门学科相结合。数据分析工作是多个学科、多门专业在企业决策中的综合应用,要成为优秀的数据分析师,必须做到多门学科的融会贯通。需熟悉或了解数学、统计学、经济学、金融学、管理学、营销学等学科的相关知识。
2. 理论研究与实践应用相结合。高等学校一般都建有比较成熟的教学实践基地和实习基地,学生在理论学习后,可以到企事业单位或财政、金融、保险等行业进行针对性的实习实践,了解相关行业的业务知识和数据构成,运用所学知识进行数据分析,独立或合作完成数据分析研究报告。
3. 专业教育与技术资格教育相结合。通过学习,学生可获得统计学专业理学学士学位或者经济学学士学位;通过参与社会上的技术资格考试,可获得数据分析、统计师、调查分析师等专业技术资格证书。两者的结合,更有利于学生从封闭校园走向开放社会,增加技能的同时,更好地融入社会、适应社会。
(三)课程体系的基本框架
在整个教学过程中,可以将每个学期分为长、短两个小学期,短学期内设置一些与就业岗位相关的、以技能培养为目标的短期集中实践教学环节,主要是岗位实训课程。长学期课程分为4个系列:基础课程、方向课程、综合实践课程、职业拓展课程。通过整合相关知识,优化课程结构,强化实践技能,突出岗位技能实训等手段构建课程体系,以达到培养学生具有数据分析师的基本技能和素养的目的。
四、数据分析师培养过程中的策略
(一)教学内容整合策略
在课程体系和课程设置的总体构建下,按照课程模块化的思路,重新梳理课程教学内容、教学进度和深度,剔除陈旧、重复的内容,加强理论联系实际内容,增添培养综合运用能力内容,实现教学内容的整合优化。例如,《应用回归分析》与《计量经济学》的内容多有重复,可以将《应用回归分析》并入《计量经济学》;又如,《描述统计学》《数理统计》《计量经济学》和《统计预测与决策》等课程有部分重复内容,必须在对知识的审慎梳理基础上,整合相应的教学内容,重新制定教学文件。
(二)实验环节设置策略
找准专业知识方法与实际问题的结合点,并分析研究当前的热点和难点问题,充实和丰富实践教学内容,编写具有应用背景、切实达到锻炼效果的实验指导书和指导材料,以明确实验的具体环节、目的与要求。每个实验项目应包含实验性质、实验目的、实验要求、实验内容、实验步骤和结果分析等部分。所有课程的实验内容由浅入深,循序渐进,实现实践教学规范化。
(三)软件教学安排策略
为使学生充分掌握相关的统计软件,熟练使用恰当的软件从事数据的整理、分析,将统计软件的教学分为三个层次:一是单独开设 SPSS、SQL Server 数据库课程;二是课堂内开设Lingo、Eviews、SAS 等软件实验;三是短学期和综合训练开设 Latex、R 等软件课程,实现软件教学层次化。
(四)实践课程操作策略
为了强化学生的实践能力和就业竞争力,在短学期实践开设职场礼仪与沟通实、PPT 制作、统计模型、实训统计调查方法与实务、办公自动化实训等项目;各学期综合训练分别开设统计流程与分析写作、会计实践软件、统计分析案例等项目,实现综合实践职业化。
(五)拓展课程设计策略
聘任有丰富实践经验的统计师、调查分析师和企业家为兼职教授或校外导师,强化校外实践;结合第二课堂,开展与专业教学相结合的、丰富多样的课外活动;同时利用大学生统计建模大赛、大学生市场调查分析大赛、大学生数学建模竞赛等学科竞赛锻炼学生综合能力,实现职业拓展多样化。
五、数据分析师培养的保障措施
(一)整合各种教育资源,提高教学效率
没有经费的保证,数据分析师的培养只能纸上谈兵。所以,学校、二级学院应设立加大资金投入,从软硬件两方面大力支持,保证经费落到实处。利用学校现有资源 , 筹建开放实验室与实习基地,创造培养数据分析师的良好环境。
数据分析师培养必须实行产学结合,坚持开门办学,与企业联合培养的方式。创立高校与行业企业联合培养人才的新机制,改变目前高校人才培养和行业企业需求脱节的现象。通过联合办学、共建等方式利用社会资源设立实习、实验基地。
(二)建立导师制,强化教师的指导作用
为提高学生数据分析的水平,进入大二后 , 二级学院应推行本科“导师制”;到了大三 , 已经具备了一定的科研能力的本科生可以在导师的指导下参加各种与数据分析有关的专业竞赛和创新实践活动,亲身体验数据分析活动的整个过程 , 提高数据分析的基本技能与创新意识;在导师的全程参与和指导下,完成大四阶段的校内综合实训、校外毕业实习和毕业论文的撰写工作,使实践锻炼全程得到有效监控,保证教学质量。
(三)充分利用各级社团组织,
开展第二课堂的活动第二课堂是课堂教学的延伸和补充。在各级社团组织的规划和部署下,加大人力、物力的投入,将第二课堂与第一课堂进行系统性、综合性考虑与设计,实施规范化管理与组织运作,制订好一系列的活动方案,为培养数据分析师通过更多的锻炼途径和方式。
(四)改革评价机制,激发学生的学习兴趣
评价是引导师生的指挥棒,大多数学生和教师总会在现行的评价体系引导下来寻求“佳绩”。要培养出未来的数据分析师,必须增强学生的学习主动性,提高学生的实践能力。通过各种活动、各种途径加强对学生能力的培养,必须要靠科学的评价体系来衡量。为此,建立“N+2”过程考核评价体系 , 对学生能力培养、训练的全过程进行跟踪调查,通过测试、信息反馈的结果来反映教育、培训的效果和评价学生创造力的变化。
总之,项目数据分析(师)事务所在国内正迅速增长,并为政府、金融机构、企业的决策提供着日益重要的参考信息,具有良好的成长和发展空间。如何在信息海洋中找到有效的信息,如何通过有效的数据来科学决策变得尤为重要,因此数据分析师的前景必定辉煌。
‘伍’ 如何学习数据分析
首先我说说这两种方向共同需要的技术面,当然以下只是按照数据分析入门的标准来写:
1. SQL(数据库),我们都知道数据分析师每天都会处理海量的数据,这些数据来源于数据库,那么怎么从数据库取数据?如何建立两表、三表之间的关系?怎么取到自己想要的特定的数据?等等这些数据选择问题就是你首要考虑的问题,而这些问题都是通过SQL解决的,所以SQL是数据分析的最基础的技能,零基础学习SQL可以阅读这里:SQL教程_w3cschool
2. 统计学基础,数据分析的前提要对数据有感知,数据如何收集?数据整体分布是怎样的?如果有时间维度的话随着时间的变化是怎样的?数据的平均值是什么?数据的最大值最小值指什么?数据相关与回归、时间序列分析和预测等等,这些在网易公开课上倒是有不错的教程:哈里斯堡社区大学公开课:统计学入门_全24集_网易公开课
3.Python或者R的基础,这一点是必备项也是加分项,在数据挖掘方向是必备项,语言相比较工具更加灵活也更加实用。至于学习资料:R语言我不太清楚,Python方向可以在廖雪峰廖老师的博客里看Python教程,面向零基础。
再说说两者有区别的技能树:
1.数据挖掘向
我先打个前哨,想要在一两个月内快速成为数据挖掘向的数据分析师基本不可能,做数据挖掘必须要底子深基础牢,编程语言基础、算法、数据结构、统计学知识样样不能少,而这些不是你自习一两个月就能完全掌握的。
所以想做数据挖掘方向的,一定要花时间把软件工程专业学习的计算机基础课程看完,这些课程包括:数据结构、算法,可以在这里一探究竟:如何学习数据结构?
在此之后你可以动手用Python去尝试实现数据挖掘的十八大算法:数据挖掘18大算法实现以及其他相关经典DM算法
2.产品经理向
产品经理向需要你对业务感知能力强,对数据十分敏感,掌握常用的一些业务分析模型套路,企业经常招聘的岗位是:商业分析、数据运营、用户研究、策略分析等等。这方面的学习书籍就很多,看得越多掌握的方法越多,我说几本我看过的或者很多人推荐的书籍:《增长黑客》、《网站分析实战》、《精益数据分析》、《深入浅出数据分析》、《啤酒与尿布》、《数据之魅》、《Storytelling with Data》
‘陆’ 数据分析师职业前景如何主要是在哪些行业的公司需要具备哪些技能
数据分析要学习Python、R、SAS等编程工具;对数据仓库需要了解可以去九道门做些实验项目;如果你觉得还是难,那就采用最基础的学习路径,直接买MYSQL关系型数据库的书看,随便到网上去找个免费的MYSQL课程听;分布式存储HDOOP需要简单了解;云计算的技术作为了解就可以了;数据可视化不是很难,如果不要求特别美工的话,大家先理解图表,再研究研究仪表板,阿里云的Quich BI及DataV,网络的echarts都不错,主要是展示的业务结构需要规划;大数据技术:这个相对来说有些难度,如果是学数学统计类专业小伙伴就非常有优势了,其他专业的小伙伴也不用担心,毕竟工作后还可以继续学习,在工作中用的比较多的是聚类、关联、决策树、线性回归等,如果你不去做模型和算法工程师那么只需要会用就可以了,实在不行有专业的工具让我们用,阿里云的机器学习PAN是可以直接出结果的工具。可以到九道门商业数据分析实训官网上去看一些案例,自己做做训练。如果自学的小伙伴觉得很难坚持,那就只能去报班了,如果要成为大数据分析师的话就要时间沉定,或者让老师带你,像我就是进到决明后由赵强老师带了半年,现在基本上已经能熟练的搞这一套了。