Ⅰ 大数据架构师岗位的主要职责概述
职责:
1、负责大数据平台及BI系统框架设计、规划、技术选型,架构设计并完成系统基础服务的开发;
2、负责海量埋点规则、SDK标准化、埋点数据采集、处理及存储,业务数据分布存储、流式/实时计算等应用层架构搭建及核心代码实现;
3、开发大数据平台的核心代码,项目敏捷开发流程管理,完成系统调试、集成与实施,对每个项目周期技术难题的解决,保证大数据产品的上线运行;
4、负责大数据平台的架构优化,代码评审,并根据业务需求持续优化数据架构,保证产品的可靠性、稳定性;
5、指导开发人员完成数据模型规划建设,分析模型构建及分析呈现,分享技术经验;
6、有效制定各种突发性研发技术故障的应对预案,有清晰的隐患意识;
7、深入研究大数据相关技术和产品,跟进业界先进技术;
任职要求
1、统计学、应用数学或计算机相关专业大学本科以上学历;
2、熟悉互联网移动端埋点方法(点击和浏览等行为埋点),无埋点方案等,有埋点SDK独立开发经验者优选;
3、熟悉Hadoop,MR/MapRece,Hdfs,Hbase,Redis,Storm,Python,zookeeper,kafka,flinkHadoop,hive,mahout,flume,ElasticSearch,KafkaPython等,具备实际项目设计及开发经验;
4、熟悉数据采集、数据清洗、分析和建模工作相关技术细节及流程
5、熟悉Liunx/Unix操作系统,能熟练使用shell/perl等脚本语言,熟练掌握java/python/go/C++中一种或多种编程语言
6、具备一定的算法能力,了解机器学习/深度学习算法工具使用,有主流大数据计算组件开发和使用经验者优先
7、熟悉大数据可视化工具Tableau/echarts
8、具有较强的执行力,高度的责任感、很强的学习、沟通能力,能够在高压下高效工作;
职责:
根据大数据业务需求,设计大数据方案及架构,实现相关功能;
搭建和维护大数据集群,保证集群规模持续、稳定、高效平稳运行;
负责大数据业务的设计和指导具体开发工作;
负责公司产品研发过程中的数据及存储设计;
针对数据分析工作,能够完成和指导负责业务数据建模。
职位要求:
计算机、自动化或相关专业(如统计学、数学)本科以上学历,3年以上大数据处理相关工作经验;
精通大数据主流框架(如Hadoop、hive、Spark等);
熟悉MySQL、NoSQL(MongoDB、Redis)等主流数据库,以及rabbit MQ等队列技术;
熟悉hadoop/spark生态的原理、特性且有实战开发经验;
熟悉常用的数据挖掘算法优先。
职责:
1、大数据平台架构规划与设计;
2、负责大数据平台技术框架的选型与技术难点攻关;
3、能够独立进行行业大数据应用的整体技术框架、业务框架和系统架构设计和调优等工作,根据系统的业务需求,能够指导开发团队完成实施工作;
4、负责数据基础架构和数据处理体系的升级和优化,不断提升系统的稳定性和效率,为相关的业务提供大数据底层平台的支持和保证;
5、培养和建立大数据团队,对团队进行技术指导。
任职要求:
1、计算机相关专业的背景专业一类院校毕业本科、硕士学位,8年(硕士5年)以上工作经验(至少拥有3年以上大数据项目或产品架构经验);
2、精通Java,J2EE相关技术,精通常见开源框架的架构,精通关系数据库系统(Oracle MySQL等)和noSQL数据存储系统的原理和架构;
3、精通SQL和Maprece、Spark处理方法;
4、精通大数据系统架构,熟悉业界数据仓库建模方法及新的建模方法的发展,有DW,BI架构体系的专项建设经验;
5、对大数据体系有深入认识,熟悉Kafka、Hadoop、Hive、HBase、Spark、Storm、greenplum、ES、Redis等大数据技术,并能设计相关数据模型;
6、很强的学习、分析和解决问题能力,可以迅速掌握业务逻辑并转化为技术方案,能独立撰写项目解决方案、项目技术文档;
7、具有较强的内外沟通能力,良好的团队意识和协作精神;
8、机器学习技术、数据挖掘、人工智能经验丰富者优先考虑;
9、具有能源电力行业工作经验者优先。
职责:
1.参与公司数据平台系统规划和架构工作,主导系统的架构设计和项目实施,确保项目质量和关键性能指标达成;
2.统筹和推进制造工厂内部数据系统的构建,搭建不同来源数据之间的逻辑关系,能够为公司运营诊断、运营效率提升提供数据支持;
3.负责数据系统需求对接、各信息化系统数据对接、软件供应商管理工作
5.根据现状制定总体的数据治理方案及数据体系建立,包括数据采集、接入、分类、开发标准和规范,制定全链路数据治理方案;深入挖掘公司数据业务,超强的数据业务感知力,挖掘数据价值,推动数据变现场景的落地,为决策及业务赋能;
6.定义不同的数据应用场景,推动公司的数据可视化工作,提升公司数据分析效率和数据价值转化。
任职要求:
1.本科以上学历,8年以上软件行业从业经验,5年以上大数据架构设计经验,熟悉BI平台、大数据系统相关技术架构及技术标准;
2.熟悉数据仓库、熟悉数据集市,了解数据挖掘、数据抽取、数据清洗、数据建模相关技术;
3.熟悉大数据相关技术:Hadoop、Hive、Hbase、Storm、Flink、Spark、Kafka、RabbitMQ;
4.熟悉制造企业信息化系统及相关数据库技术;
5.具备大数据平台、计算存储平台、可视化开发平台经验,具有制造企业大数据系统项目开发或实施经验优先;
6.对数据敏感,具备优秀的业务需求分析和报告展示能力,具备制造企业数据分析和数据洞察、大数据系统的架构设计能力,了解主流的报表工具或新兴的前端报表工具;
7.有较强的沟通和组织协调能力,具备结果导向思维,有相关项目管理经验优先。
职责:
1.负责产品级业务系统架构(如业务数据对象识别,数据实体、数据属性分析,数据标准、端到端数据流等)的设计与优化。协助推动跨领域重大数据问题的分析、定位、解决方案设计,从架构设计上保障系统高性能、高可用性、高安全性、高时效性、分布式扩展性,并对系统质量负责。
2.负责云数据平台的架构设计和数据处理体系的优化,推动云数据平台建设和持续升级,并制定云数据平台调用约束和规范。
3.结合行业应用的需求负责数据流各环节上的方案选型,主导云数据平台建设,参与核心代码编写、审查;数据的统计逻辑回归算法、实时交互分析;数据可视化方案等等的选型、部署、集成融合等等。
4.对云数据平台的关注业内技术动态,持续推动平台技术架构升级,以满足公司不同阶段的数据需求。
任职要求:
1.熟悉云计算基础平台,包括Linux(Ubuntu/CentOS)和KVM、OpenStack/K8S等基础环境,熟悉控制、计算、存储和网络;
2.掌握大型分布式系统的技术栈,如:CDN、负载均衡、服务化/异步化、分布式缓存、NoSQL、数据库垂直及水平扩容;熟悉大数据应用端到端的相关高性能产品。
3.精通Java,Python,Shell编程语言,精通SQL、NoSQL等数据库增删改查的操作优化;
4.PB级别实战数据平台和生产环境的实施、开发和管理经验;
5.熟悉Docker等容器的编排封装,熟悉微服务的开发和日常调度;
6.计算机、软件、电子信息及通信等相关专业本科以上学历,5年以上软件工程开发经验,2年以上大数据架构师工作经验。
职责描述:
1、负责集团大数据资产库的技术架构、核心设计方案,并推动落地;
2、带领大数据技术团队实现各项数据接入、数据挖掘分析及数据可视化;
3、新技术预研,解决团队技术难题。
任职要求:
1、在技术领域有5年以上相关经验,3年以上的架构设计或产品经理经验;
2、具有2年以上大数据产品和数据分析相关项目经验;
3、精通大数据分布式系统(hadoop、spark、hive等)的架构原理、技术设计;精通linux系统;精通一门主流编程语言,java优先。
岗位职责:
1、基于公司大数据基础和数据资产积累,负责大数据应用整体技术架构的设计、优化,建设大数据能力开放平台;负责大数据应用产品的架构设计、技术把控工作。
2、负责制定大数据应用系统的数据安全管控体系和数据使用规范。
3、作为大数据技术方案到产品实现的技术负责人,负责关键技术点攻坚工作,负责内部技术推广、培训及知识转移工作。
4、负责大数据系统研发项目任务规划、整体进度、风险把控,有效协同团队成员并组织跨团队技术协作,保证项目质量与进度。
5、负责提升产品技术团队的技术影响力,针对新人、普通开发人员进行有效辅导,帮助其快速成长。
任职资格:
1、计算机、数学或相关专业本科以上学历,5—20xx年工作经验,具有大型系统的技术架构应用架构数据架构相关的实践工作经验。
2、有分布式系统分析及架构设计经验,熟悉基于计算集群的软件系统架构和实施经验。
3、掌握Hadoop/Spark/Storm生态圈的主流技术及产品,深入了解Hadoop/Spark/Storm生态圈产品的工作原理及应用场景。
4、掌握Mysql/Oracle等常用关系型数据库,能够对SQL进行优化。
5、熟悉分布式系统基础设施中常用的技术,如缓存(Varnish、Memcache、Redis)、消息中间件(Rabbit MQ、Active MQ、Kafka、NSQ)等;有实践经验者优先。
6、熟悉Linux,Java基础扎实,至少3—5年以上Java应用开发经验,熟悉常用的设计模式和开源框架。
岗位职责:
1、负责公司大数据平台架构的技术选型和技术难点攻关工作;
2、依据行业数据现状和客户需求,完成行业大数据的特定技术方案设计与撰写;
3、负责研究跟进大数据架构领域新兴技术并在公司内部进行分享;
4、参与公司大数据项目的技术交流、解决方案定制以及项目的招投标工作;
5、参与公司大数据项目前期的架构设计工作;
任职要求:
1、计算机及相关专业本科以上,5年以上数据类项目(数据仓库、商务智能)实施经验,至少2年以上大数据架构设计和开发经验,至少主导过一个大数据平台项目架构设计;
2、精通大数据生态圈的技术,包括但不限于MapRece、Spark、Hadoop、Kafka、Mongodb、Redis、Flume、Storm、Hbase、Hive,具备数据统计查询性能优化能力。熟悉星环大数据产品线及有过产品项目实施经验者优先;
3、优秀的方案撰写能力,思路清晰,逻辑思维强,能够根据业务需求设计合理的解决方案;
4、精通ORACLE、DB2、mySql等主流关系型数据库,熟悉数据仓库建设思路和数据分层架构思想;
5。熟练掌握java、R、python等1—2门数据挖掘开发语言;
6。熟悉云服务平台及微服务相关架构思想和技术路线,熟悉阿里云或腾讯云产品者优先;
7、有烟草或制造行业大数据解决方案售前经验者优先;
8、能适应售前支持和项目实施需要的短期出差;
岗位职责:
1、负责相关开源系统/组件的性能、稳定性、可靠性等方面的深度优化;
2、负责解决项目上线后生产环境的各种实际问题,保障大数据平台在生产上的安全、平稳运行;
3、推动优化跨部门的业务流程,参与业务部门的技术方案设计、评审、指导;
4、负责技术团队人员培训、人员成长指导。
5、应项目要求本月办公地址在锦江区金石路316号新希望中鼎国际办公,月底项目结束后在总部公司办公
任职要求:
1、熟悉linux、JVM底层原理,能作为技术担当,解决核心技术问题;
2、3年以上大数据平台项目架构或开发经验,对大数据生态技术体系有全面了解,如Yarn、Spark、HBase、Hive、Elasticsearch、Kafka、PrestoDB、Phoenix等;
3、掌握git、maven、gradle、junit等工具和实践,注重文档管理、注重工程规范优先;
4、熟悉Java后台开发体系,具备微服务架构的项目实施经验,有Dubbo/Spring cloud微服务架构设计经验优先;
5、性格开朗、善于沟通,有极强的技术敏感性和自我驱动学习能力,注重团队意识。
职责描述:
1、负责大数据平台框架的规划设计、搭建、优化和运维;
2、负责架构持续优化及系统关键模块的设计开发,协助团队解决开发过程中的技术难题;
3、负责大数据相关新技术的调研,关注大数据技术发展趋势、研究开源技术、将新技术应用到大数据平台,推动数据平台发展;
4、负责数据平台开发规范制定,数据建模及核心框架开发。
任职要求:
1、计算机、数学等专业本科及以上学历;
2、具有5年及以上大数据相关工作经验;
3、具有扎实的大数据和数据仓库的理论功底,负责过大数据平台或数据仓库设计;
4、基于hadoop的大数据体系有深入认识,具备相关产品(hadoop、hive、hbase、spark、storm、 flume、kafka、es等)项目应用研发经验,有hadoop集群搭建和管理经验;
5、熟悉传统数据仓库数据建模,etl架构和开发流程,使用过kettle、talend、informatic等至少一种工具;
6、自驱力强、优秀的团队意识和沟通能力,对新技术有好奇心,学习能力和主动性强,有钻研精神,充满激情,乐于接受挑战;
Ⅱ 大数据架构师工作职能有哪些
职责一:全局的技术规划
全局技术规划是专职架构师必须要做的工作,全局技术规划要能非常明确的指引整个团队在同一时间向同一个方向前进,这对架构师的心力和体力都是有很大的考验,全局规划不仅要与业务紧密沟通,还必须有对应的技术深度和广度,应采取正确的方法论,勇敢做出判断和决策!
职责二:统一的方法&规范&机制
专职架构师不仅要能够做出全局技术规划,还要能提供统一的方法、规范和机制以保障全局技术规划的顺利有序进行,这是一项相对复杂且繁琐的过程,需进行全方位的拆解,直到权责清晰对等。
职责三:完备的基础构建
基础构建的完备程度对全局技术规划来说是十分重要的,为全局技术规划得以顺利实施提供了强大的武器库,因此,专职架构师要制定完备的基础构建。
职责四:落地的规划才是架构
这是对专职架构师最大的挑战,专职架构师应实时关注全局技术规划实施的进度,把控发展的方向,以确保与规划预期结果保持一致!
Ⅲ 大数据专业学什么 从事什么职业
大数据采集与管理专业是从大数据应用的数据管理、系统开发、海量数据分析与挖掘等层面系统地帮助企业掌握大数据应用中的各种典型问题的解决办法的专业。
大数据专业将从大数据应用的三个主要层面(即数据管理、系统开发、海量数据分析与挖掘)系统地帮助企业掌握大数据应用中的各种典型问题的解决办法,包括实现和分析协同过滤算法、运行和学习分类算法、分布式Hadoop集群的搭建和基准测试、分布式Hbase集群的搭建和基准测试、实现一个基于、Maprece的并行算法、部署Hive并实现一个的数据操作等等,实际提升企业解决实际问题的能力。
一、数据分析师
数据分析师应该是当下大家听到过最多的大数据岗位,这个工作指的是不同行业中,从事行业数据搜集、整理、分析,并依据数据做出行业研究、评估和预测的专业人员。在工作中通过运用工具,提取、分析数据,实现数据的商业意义。
二、数据架构师
数据架构师是负责平台的整体数据架构设计,完成从业务模型到数据模型的设计工作,根据业务功能、业务模型,进行数据库建模设计,完成各种面向业务目标的数据分析模型的定义和应用开发,平台数据提取、数据挖掘及数据分析。
三、数据挖掘工程师。
这个工作一般是指从大量的数据中通过算法搜索隐藏于其中知识的工程技术专业人员。这些知识可用使企业决策智能化,自动化,从而使企业提高工作效率,减少错误决策的可能性,以在激烈的竞争中处于不败之地。
四、数据算法工程师。
在企业中负责大数据产品数据挖掘算法与模型部分的设计,制定数据建模、数据处理和数据安全等架构规范并落地实施。
Ⅳ 大数据毕业后可以从事什么工作
学大数据从事的职业常常分为大数据系统研发人员、大数据应用开发人员和大数据分析人员,常见的职业有数据分析师、数据架构师、数据挖掘工程师、数据算法工程师等等。
以下是学大数据可以从事的职业介绍:
1、数据分析师:从事行业数据搜集、整理、分析方面的工作,依据数据做出行业研究、评估和预测。需要掌握SPSS、STATISTIC、Eviews、SAS等数据分析工具以及数据分析的营销思维。
2、数据架构师:负责平台的整体数据架构设计,完成从业务模型到数据模型的设计工作,根据业务功能、业务模型,进行数据库建模设计,完成各种面向业务目标的数据分析模型的定义和应用开发,平台数据提取、数据挖掘及数据分析。
3、数据应用师:用常人能理解的语言表述出数据所蕴含的信息,并根据数据分析结论推动企业内部做出调整。将数据还原到产品中,为产品所用。
4、数据挖掘工程师:从大量的数据中通过算法搜索隐藏于其中的信息,使企业决策智能化、自动化,提高企业工作效率,减少错误决策的可能性。需要具备深厚的统计学基础,需要熟悉R、SAS、 SPSS等统计分析软件。
5、数据算法工程师:负责大数据产品数据挖掘算法与模型部分的设计,制定数据建模、数据处理和数据安全等架构规范并落地实施。需要具备扎实的数据挖掘基础知识,精通机器学习、数学统计常用算法,掌握常见分布式计算框架和技术原理,如Hadoop、MapRece、 Yarn、Storm、Spark等;熟悉Linux操作系统和Shell编程,至少熟练掌握一门编程语言。
Ⅳ 学大数据可以从事什么职业
1、数据分析师。数据分析师 是数据师的一种,指的是不同行业中,专门从事行业数据搜集、整理、分析,并依据数据做出行业研究、评估和预测的专业人员。在工作中通过运用工具,提取、分析、呈现数据,实现数据的商业意义。
作为一名数据分析师、至少需要熟练SPSS、STATISTIC、Eviews、SAS等数据分析软件中的一门,至少能用Acess等进行数据库开发,至少掌握一门数学软件如matalab、mathmatics进行新模型的构建,至少掌握一门编程语言。总之,一个优秀的数据分析师,应该业务、管理、分析、工具、设计都不落下。
2、 数据架构师。
数据架构师是负责平台的整体数据架构设计,完成从业务模型到数据模型的设计工作 ,根据业务功能、业务模型,进行数据库建模设计,完成各种面向业务目标的数据分析模型的定义和应用开发,平台数据提取、数据挖掘及数据分析。
从事数据架构师这个职位,需要具备较强的业务理解和业务抽象能力,具备大容量事物及交易类互联网平台的数据库模型设计能力,对调度系统,元数据系统有非常深刻的认识和理解,熟悉常用的分析、统计、建模方法,熟悉数据仓库相关技术,如 ETL、报表开发,熟悉Hadoop,Hive等系统并有过实战经验。
6、Hadoop运维工程师
你需要具备的技术知识:平台大数据环境的部署维护和技术支持, 应用故障的处理跟踪及统计汇总分析,应用安全、数据的日常备份和应急恢复。
7、Hadoop开发工程师
Hadoop是一个分布式文件系统(Hadoop Distributed File System),简称HDFS。Hadoop是一个能够对大量数据进行分布式处理的软件框架, 以一种可靠、高效、可伸缩的方式进行数据处理。所以说Hadoop解决了大数据如何存储的问题,因而在大数据培训机构中是必须学习的课程。
Hadoop开发工程师需要具备的技术:基于hadoop、hive等构建数据分析平台,进行数据平台架构设计、开发分布式计算业务,应用大数据、数据挖掘、分析建模等技术,对海量数据进行挖掘,发现其潜在的关联规则,对hadoop、hive、hbase、Map/Rece相关产品进行预研、开发,Hadoop相关技术解决海量数据处理问题、大数据量的分析, Hadoop相关业务脚本的性能优化与提升,不断提高系统运行效率。
8、大数据可视化工程师
随着大数据在人们工作及日常生活中的应用,大数据可视化也改变着人类的对信息的阅读和理解方式。从网络迁徙到谷歌流感趋势,再到阿里云推出县域经济可视化产品,大数据技术和大数据可视化都是幕后的英雄。
Ⅵ 如何成为真正的数据架构师
1、为什么需要构建数据结构?
1)数据标准不一致
2)数据模型管理混乱
3)深入的性能的问题无法解决
4)SQL语句编写水平不高导致出现严重性能问题
5)开发人员对执行计划收悉
6)上线前缺乏审计
7)相对复杂的数据处理能力欠缺
8)数据质量差需要执行数据质量管理
2、数据管理组织角色
数据架构总监,企业数据构架管理的最高决策者,制定数据构架管理政策及指南,解决数据管理组织之间的争议问题;
数据架构师,制定数据标准,应用标准,运维标准。设计数据标准和模型管理流程,整理数据需求并为建模人员提供支持
数据建模设计师,整合应用功能对数据要求,根据相应功能的业务需求进行数据建模,确认并使用数据标准
数据库管理员,数据库物理架构设计,数据库配置、日程运维管理,数据库的监控、调优和安全管理
用户,提出数据使用请求,根据业务规则对数据质量进行检验
3、如何成为数据构架师?
认知阶段
1)了解数据架构师的定义
2)了解数据架构师从事哪些工作
3)了解数据架构师应该具备的能力
4)了解数据架构师在企业中的位置及职业生涯
学习阶段
1)了解成为数据架构师的途径
2)寻找合适的书籍及培训课程
3)向有经验的专业人士学习经验
4)参与相关交流活动
实战阶段
1)学习理论知识的同时,从技术上、组织上、流程上、产品上等方面逐渐尝试将其落地,并在实战中提升
2)扩大数据架构师在现有工作环境中影响力和价值,寻找合适定位
成熟阶段
1)稳定数据架构在企业系统设计、开发、运维环节的地位
2)将其作为企业架构中必不可少的组成部分,形成四足鼎立之势
4、成为数据架构师需要学习的技术
企业架构
1)企业架构概要
2)数据架构建设
3)企业架构管理及应用
数据库设计及应用
1)数据库设计
2)数据库应用
3)数据库性能优化
数据建模
1)概念数据建模技术
2)逻辑数据建模技术
3)物理数据建模技术
数据标准化
1)构建原子性单词词典
2)构建由原子性胆子自动拼接而成的用词词典
3)构建标准编码词典及标准管理体系
数据需求分析
1)信息需求事项概要
2)信息需求项调查
3)需求项分析及验证
数据质量管理
1)数据质量、标准、模型、管理等内容
2)数据结构、概念、逻辑、物理模型
3、数据管理流程、标准、策略、需求、模型、数据库、数据应用、数据流等管理