导航:首页 > 数据处理 > 大数据的期望膨胀在哪个阶段

大数据的期望膨胀在哪个阶段

发布时间:2022-04-12 15:21:30

A. Gartner发布2014技术成熟度曲线,大数据去哪儿

摘要:近日,Gartner发布了最新的新兴技术成熟度曲线(Hype Cycle for Emerging Technologies)。去年,大数据享有至高无上的地位,处于Gartner所说的“期望膨胀高峰期”。但现在,大数据已经跌入“幻灭的低谷期”。物联网取而代之,占据了成熟度曲线的最高点。

在2012年和2013年,Gartner的分析师们曾认为,物联网还需要10年以上的时间才会达到“生产率稳定期”。但今年,他们认为物联网只需要5到10年时间就会达到这个最终成熟阶段。
小编的理解是,无论是大数据还是物联网,数据和数据之上的信息都是不变的“主旋律”。物联网将数据流动的介质进一步“下沉”至具备联网功能和数据传输能力的“物件”上,让更多的机器、设备成为人们生产与生活交互的一部分。

今年成熟度曲线上的一个新面孔是“数据科学”,预计它将在2到5年时间里达到稳定期。与其说它是一项或一套具体的技术,不如说是一个处理大数据的学科。Gartner在《成熟度曲线特别报告》(Hype Cycle Special Report)中指出:“虽然对大数据的兴趣依然不减,但它已经离开高峰期,因为该市场已经安定下来,有了一整套合理的方法,新的技术和实践被添加进现有方案。”虽然大数据兴趣不减,市场趋向稳定,但Gartner认为,大数据还有5到10年才会达到稳定期。看来,大数据相关技术的演进在未来一段时间内仍将展现出强大的生命力,相关市场的营收也将不断放大。

对于Gartner对新兴技术起伏的判断,皮尤研究中心(Pew Research Center)的互联网、科学和技术研究主管李·雷尼(Lee Rainie)作出了如下评价:“虽然成熟度曲线不是严格地以数据为基础,但高德纳分析师们对技术采纳状况作出的判断常常与其他优秀观察者的看法相一致。在特定创新应该处于曲线什么位置的问题上,有时会有争议,但该曲线所勾勒的总体趋势很少受到质疑。”

2014年标志着新兴技术成熟度曲线这个有用的工具已经问世20周年。该工具旨在跟踪人们对技术和商业创新的周期性兴趣爆发和经常性失望的起起伏伏。Gartner副总裁兼着名分析师贝特西·伯顿(Betsy Burton)谈到了成熟度曲线作为跟踪创新及其商业影响力如何逐渐演变的工具,以及2014年版的新变化。伯顿说:“很多时候,我们看到的是人们的注意力从支持信息、应用、云端系统和大数据的基础设施,转向我们如何运用云计算、大数据和社交的某些能力来解决现实的商业问题。我们正目睹人们的注意力从技术本身转向将这项技术实际运用到现实的商业需求和商业成果中。”

B. 大数据时代,面临的七个挑战和八大趋势

大数据时代,面临的七个挑战和八大趋势

大数据挑战和机遇并存,大数据在未来几年的发展将从前几年的预期膨胀阶段、炒作阶段转入理性发展阶段、落地应用阶段,大数据在未来几年将逐渐步入理性发展期。未来的大数据发展依然存在诸多挑战,但前景依然非常乐观。

大数据发展的挑战

目前大数据的发展依然存在诸多挑战,包括七大方面的挑战:业务部门没有清晰的大数据需求导致数据资产逐渐流失;企业内部数据孤岛严重,导致数据价值不能充分挖掘;数据可用性低,数据质量差,导致数据无法利用;数据相关管理技术和架构落后,导致不具备大数据处理能力;数据安全能力和防范意识差,导致数据泄露;大数据人才缺乏导致大数据工作难以开展;大数据越开放越有价值,但缺乏大数据相关的政策法规,导致数据开放和隐私之间难以平衡,也难以更好的开放。

挑战一:业务部门没有清晰的大数据需求

很多企业业务部门不了解大数据,也不了解大数据的应用场景和价值,因此难以提出大数据的准确需求。由于业务部门需求不清晰,大数据部门又是非盈利部门,企业决策层担心投入比较多的成本,导致了很多企业在搭建大数据部门时犹豫不决,或者很多企业都处于观望尝试的态度,从根本上影响了企业在大数据方向的发展,也阻碍了企业积累和挖掘自身的数据资产,甚至由于数据没有应用场景,删除很多有价值历史数据,导致企业数据资产流失。因此,这方面需要大数据从业者和专家一起,推动和分享大数据应用场景,让更多的业务人员了解大数据的价值。

挑战二:企业内部数据孤岛严重

企业启动大数据最重要的挑战是数据的碎片化。在很多企业中尤其是大型的企业,数据常常散落在不同部门,而且这些数据存在不同的数据仓库中,不同部门的数据技术也有可能不一样,这导致企业内部自己的数据都没法打通。如果不打通这些数据,大数据的价值则非常难挖掘。大数据需要不同数据的关联和整合才能更好的发挥理解客户和理解业务的优势。如何将不同部门的数据打通,并且实现技术和工具共享,才能更好的发挥企业大数据的价值。

挑战三:数据可用性低,数据质量差

很多中型以及大型企业,每时每刻也都在产生大量的数据,但很多企业在大数据的预处理阶段很不重视,导致数据处理很不规范。大数据预处理阶段需要抽取数据把数据转化为方便处理的数据类型,对数据进行清洗和去噪,以提取有效的数据等操作。甚至很多企业在数据的上报就出现很多不规范不合理的情况。以上种种原因,导致企业的数据的可用性差,数据质量差,数据不准确。而大数据的意义不仅仅是要收集规模庞大的数据信息,还有对收集到的数据进行很好的预处理处理,才有可能让数据分析和数据挖掘人员从可用性高的大数据中提取有价值的信息。Sybase的数据表明,高质量的数据的数据应用可以显着提升企业的商业表现,数据可用性提高10%,企业的业绩至少提升在10%以上。

挑战四:数据相关管理技术和架构

技术架构的挑战包含以下几方面:(1)传统的数据库部署不能处理TB级别的数据,快速增长的数据量超越了传统数据库的管理能力。如何构建分布式的数据仓库,并可以方便扩展大量的服务器成为很多传统企业的挑战;(2)很多企业采用传统的数据库技术,在设计的开始就没有考虑数据类别的多样性,尤其是对结构化数据、半结构化和非结构化数据的兼容;(3)传统企业的数据库,对数据处理时间要求不高,这些数据的统计结果往往滞后一天或两天才能统计出来。但大数据需要实时处理数据,进行分钟级甚至是秒级计算。传统的数据库架构师缺乏实时数据处理的能力;(4)海量的数据需要很好的网络架构,需要强大的数据中心来支撑,数据中心的运维工作也将成为挑战。如何在保证数据稳定、支持高并发的同时,减少服务器的低负载情况,成为海量数据中心运维的一个重点工作。

挑战五:数据安全

网络化生活使得犯罪分子更容易获得关于人的信息,也有了更多不易被追踪和防范的犯罪手段,可能会出现更高明的骗局。如何保证用户的信息安全成为大数据时代非常重要的课题。在线数据越来越多,黑客犯罪的动机比以往都来的强烈,一些知名网站密码泄露、系统漏洞导致用户资料被盗等个人敏感信息泄露事件已经警醒我们,要加强大数据网络安全的建设。另外,大数据的不断增加,对数据存储的物理安全性要求会越来越高,从而对数据的多副本与容灾机制也提出更高的要求。目前很多传统企业的数据安全令人担忧。

挑战六:大数据人才缺乏

大数据建设的每个环节都需要依靠专业人员完成,因此,必须培养和造就一支掌握大数据技术、懂管理、有大数据应用经验的大数据建设专业队伍。目前大数据相关人才的欠缺将阻碍大数据市场发展。据Gartner预测,到2015年,全球将新增440万个与大数据相关的工作岗位,且会有25%的组织设立首席数据官职位。大数据的相关职位需要的是复合型人才,能够对数学、统计学、数据分析、机器学习和自然语言处理等多方面知识综合掌控。未来,大数据将会出现约100万的人才缺口,在各个行业大数据中高端人才都会成为最炙手可热的人才,涵盖了大数据的数据开发工程师、大数据分析师、数据架构师、大数据后台开发工程师、算法工程师等多个方向。因此需要高校和企业共同努力去培养和挖掘。目前最大的问题是很多高校缺乏大数据,所以拥有大数据的企业应该与学校联合培养人才。

挑战七:数据开放与隐私的权衡

在大数据应用日益重要的今天,数据资源的开放共享已经成为在数据大战中保持优势的关键。商业数据和个人数据的共享应用,不仅能促进相关产业的发展,也能给我们的生活带来巨大的便利。由于政府、企业和行业信息化系统建设往往缺少统一规划,系统之间缺乏统一的标准,形成了众多“信息孤岛”,而且受行政垄断和商业利益所限,数据开放程度较低,这给数据利用造成极大障碍。另外一个制约我国数据资源开放和共享的一个重要因素是政策法规不完善,大数据挖掘缺乏相应的立法。无法既保证共享又防止滥用。因此,建立一个良性发展的数据共享生态系统,是我国大数据发展需要迈过去的一道砍。同时,开放与隐私如何平衡,也是大数据开放过程中面临的最大难题。如何在推动数据全面开放、应用和共享的同时有效地保护公民、企业隐私,逐步加强隐私立法,将是大数据时代的一个重大挑战。

大数据发展趋势

虽然大数据仍在起步阶段,存在诸多挑战,但未来的发展依然非常乐观。大数据的发展呈现八大趋势:数据资源化,将成为最有价值的资产;大数据在更多的传统行业的企业管理落地;大数据和传统商业智能融合,行业定制化解决方案将涌现;数据将越来越开放,数据共享联盟将出现;大数据安全越来越受重视,大数据安全市场将愈发重要;大数据促进智慧城市发展,为智慧城市的引擎;大数据将催生一批新的工作岗位和相应的专业;大数据在多方位改善我们的生活。

趋势一:数据资源化,将成为最有价值的资产

随着大数据应用的发展,大数据价值得以充分的体现,大数据在企业和社会层面成为重要的战略资源,数据成为新的战略制高点,是大家抢夺的新焦点。《华尔街日报》在一份题为《大数据,大影响》的报告宣传,数据已经成为一种新的资产类别,就像货币或黄金一样。Google、Facebook、亚马逊、腾讯、网络、阿里巴巴和360等企业正在运用大数据力量获得商业上更大的成功,并且金融和电信企业也在运用大数据来提升自己的竞争力。我们有理由相信大数据将不断成为机构和企业的资产,成为提升机构和企业竞争力的有力武器。

趋势二:大数据在更多的传统行业的企业管理落地

一种新的技术往往在少数行业应用取得了好的效果,对其他行业就有强烈的示范效应。目前大数据在大型互联网企业已经得到较好的应用,其他行业的大数据尤其是电信和金融也逐渐在多种应用场景取得效果。因此,我们有理由相信,大数据作为一种从数据中创造新价值的工具,将会在许多行业的企业得到应用,带来广泛的社会价值。大数据将在帮助企业更好的理解和满足客户需求和潜在需求,更好的应用在业务运营智能监控、精细化企业运营、客户生命周期管理、精细化营销、经营分析和战略分析等方面。企业管理既有艺术也有科学,相信大数据在科学管理企业方面有更显着的促进,让更多拥抱大数据的企业实现智慧企业管理。

趋势三:大数据和传统商业智能融合,行业定制化解决方案将涌现

来自传统商业智能领域者将大数据当成一个新增的数据源,而大数据从业者则认为传统商业智能只是其领域中处理少量数据时的一种方法。大数据用户更希望能获得一种整体的解决方案,即不仅要能收集、处理和分析企业内部的业务数据,还希望能引入互联网上的网络浏览、微博、微信等非结构化数据。除此之外,还希望能结合移动设备的位置信息,这样企业就可以形成一个全面、完整的数据价值发展平台。毕竟,无论是大数据还是商业智能,目的都是为分析服务的,数据全面整合起来,更有利于发现新的商业机会,这就是大数据商业智能。同时,由于行业的差异性,很难研发出一套适用于各行业的大数据商业智能分析系统,因此,在一些规模较大的行业市场,大数据服务提供商将会以更加定制化的商业智能解决方案提供大数据服务。我们相信更多的大数据商业智能定制化解决方案将在电信、金融、零售等行业出现。

趋势四:数据将越来越开放,数据共享联盟将出现

大数据越关联越有价值,越开放越有价值。尤其是公共事业和互联网企业的数据开放数据将越来越多。我们看到,美国、英国、澳大利亚等国家的政府都在政府和公共事业上的数据做出努力。而国内的一些城市和部门也在逐渐开展数据开放的工作。比如北京市在2012年就开始试运行政务数据资源网,在2013年年底正式开放;上海在2012年启动了政府数据资源开放试点工作,数据涉及地理位置、交通、经济统计和资格资质等数据;2014年,贵州省也加入数据开放之列,10月份云上贵州正式上线。对于不同的行业,数据越共享也是越有价值。如果每一个医院想获得更多病情特征库以及药效信息,那么就需要全国,甚至全世界的医疗信息共享,从而可以通过平台进行分析,获取更大的价值。我们相信数据会呈现一种共享的趋势,不同领域的数据联盟将出现。

趋势五:大数据安全越来越受重视,大数据安全市场将愈发重要

随着数据的价值的越来越重要,大数据的安全稳定也将会逐渐被重视。网络和数字化生活也使得犯罪的分子更容易获取关于他人的信息,也有更多的骗术和犯罪手段出现,所以,在大数据时代,无论对于数据本身的保护,还是对于由数据而演变的一些信息的安全,对大数据分析有较高要求的企业将至关重要。大数据安全是跟大数据业务相对应的,与传统安全相比,大数据安全的最大区别是安全厂商在思考安全问题的时候首先要进行业务分析,并且找出针对大数据的业务的威胁,然后提出有针对性的解决方案。比如,对于数据存储这个场景,目前很多企业采用开源软件如Hadoop技术来解决大数据问题,由于其开源性,但是其安全问题也是突出的。因此,市场需要更多专业的安全厂商针对不同的大数据安全问题来提供专业的服务。

趋势六:大数据促进智慧城市发展,为智慧城市的引擎

随着大数据的发展,大数据在智慧城市将发挥着越来越重要的作用。由于人口聚集给城市带来了交通、医疗、建筑等各方面的压力,需要城市能够更合理地进行资源布局和调配,而智慧城市正是城市治理转型的最优解决方案。智慧城市是通过物与物、物与人、人与人的互联互通能力、全面感知能力和信息利用能力,通过物联网、移动互联网、云计算等新一代信息技术,实现城市高效的政府管理、便捷的民生服务、可持续的产业发展。智慧城市相对于之前数字城市概念,最大的区别在于对感知层获取的信息进行了智慧的处理。由城市数字化到城市智慧化,关键是要实现对数字信息的智慧处理,其核心是引入了大数据处理技术。大数据是智慧城市的核心智慧引擎。智慧安防、智慧交通、智慧医疗、智慧城管等,都是以大数据为基础的的智慧城市应用领域。

趋势七:大数据将催生一批新的工作岗位和相应的专业

一个新行业的出现,必将在工作职位方面有新的需求,大数据的出现也将推出一批新的就业岗位,例如,大数据分析师、数据管理专家、大数据算法工程师、数据产品经理等等。具有有丰富经验的数据分析人才将成为稀缺的资源,数据驱动型工作将呈现爆炸式的增长。而由于有强烈的市场需求,高校也将逐步开设大数据相关的专业,以培养相应的专业人才。企业也将和高校紧密合作,协助高校联合培养大数据人才。如2014年,IBM 全面推进与高校在大数据领域的合作,引入强大的研发团队和业务伙伴,推动“大数据平台”和“大数据分析”的面向行业产学研创新合作以及系统化知识体系建设和高价值人才培养,建设符合中国教学特色及人才需求的大数据相关学分课程,为未来建设特色专业方向做准备。

趋势八:大数据在多方位改善我们的生活

大数据不仅用于企业和政府,也应用于我们的生活。在健康方面:我们可以利用智能手环监测,对我们的睡眠模式来进行追踪,了解睡眠质量;我们可以利用智能血压计、智能心率仪远程的监控身在异地的家里老人的健康情况,让远在他方的外出工作者更加放心;在出行方面:我们可以利用智能导航出行GPS数据了解交通状况,并根据拥堵情况进行路线实时调优。在居家生活方面:大数据将成为智能家居的核心,智能家电实现了拟人智能,产品通过传感器和控制芯片来捕捉和处理信息,可以根据住宅空间环境和用户需求自动设置控制,甚至提出优化生活质量的建议,如我们的冰箱可能会在每天一大早建议我们当天的菜谱。

以上是小编为大家分享的关于大数据时代,面临的七个挑战和八大趋势的相关内容,更多信息可以关注环球青藤分享更多干货

C. 大数据、物联网与智慧城市三者是什么关系@《控制与传动》杂志

大数据是信息化社会无形的生产资料,其概念被社会各界不断演绎出多种版本,但关于大数据、物联网、智慧城市三者之间的关系,很多人不甚明了。对此,同方物联网产业应用本部技术总监赵英,对此做出了详细的解读。

大数据、物联网、智慧城市三者之间的关系简单来说就是:大数据的发展源于物联网技术的应用,并用于支撑智慧城市的发展。物联网技术作为互联网应用的拓展,正处于大发展阶段。物联网是智慧城市的基础,但智慧城市的范畴相比物联网而言更为广泛;智慧城市的衡量指标由大数据来体现,大数据促进智慧城市的发展;物联网是大数据产生的催化剂,大数据源于于物联网应用。
中国已步入大数据时代
有人说大数据来了,但只是在美国而不是中国。专做政府数据管理的同方对此的看法是:中国对大数据的理解普遍还不那么深入或者与美国的理解有所不同,但不能否认的是,中国已经步入大数据时代。现在中国的很多部委都已经在研究大数据、运用大数据。美国将大数据提升为国家战略,中国还没有明确提出,但已经把大数据上升为与国防一样的高度,多部委还联合发布了鼓励措施。我国政府对大数据的敏感度快速提高,并正在采取措施。所以说,中国已经步入大数据时代,这种重视是由政府层面自上而下进行普及的,可能还未普及到普通百姓层面,但各级政府已经有了高度重视。邬贺铨院士也曾表示:“我国将产生全球最大量的数据,要重视大数据的开发利用和管理。”
大数据的关键在于分享。我国智慧城市发展的一个瓶颈在于信息孤岛效应,各政府部门间不愿公开、分项数据,这就造成数据之间的割裂,无法产生数据的深度价值。关于这一问题,一些政府部门也有清醒的认识,开始寻求解决方案,这是受自身的需求驱动的。比如,一些政府部门原来不愿分享自己的数据,但现在开始寻求数据交换伙伴,因为他们逐渐意识到单一的数据是没法发挥最大效能的,部门之间相互交换数据已经成为一种发展趋势。同时,随着各方面的发展及政策的推进,很多以前不公开的数据也逐渐公开了,这对大数据的发展都是有力的支持。
物联网技术推进大数据发展
物联网对大数据的意义方面,赵英举了个例子来说明物联网技术对大数据的推进。去年北京7.21暴雨之后,政府采取了很多解决措施,很重要的一个体现是,北京市科委很快就立了专项基金去给受灾的房山和门头沟这两个区进行应急管理能力的提升以及信息化的建设。同方参与了门头沟的项目,帮助门头沟提升预警能力。同方对门头沟原来的应急平台进行了改造和提升。比如对水位的监测,在有些重点立交桥下安装水位计,水位到一定程度会发生预警,相关部门就可以据此采取一些措施,这就是物联网技术的应用。
物联网技术跟大数据什么关系?当水位计的点增多后,就会收集到更多的数据,这样更便于发现一些规律并发出预警,这是采用大数据的技术手段自然而然就能做的事情。在点位数少的情况下,数据量不够大,只能解决一部分问题。所以说,正因为有了物联网,大数据布的点越来越多,自然而然就要会去分析实时数据。数据的挖掘,原本是对于历史数据的挖掘,现在对于实时数据的挖掘也是一种趋势,说明物联网的技术在推进着大数据相关技术的发展。
大数据支撑智慧城市的发展
城市运行体征是通过数据进行量化表现出来的,但这些数据散乱在政府的各个部门中,同方的职责是收集各部门有关城市运行体征的数据,帮助城市管理者进行数据汇总、分析,最终对城市体征的量化形态即各类数据进行管理,供政府管理者使用。
政府部门做的每一个决策都需要长期的调研,调研的资料来源于政府部门运行、城市运行的长期积累。政府信息化的高速发展已使政府产生了几百TB的数据。但数据本身没有任何意义,只有经过一定的系统分析之后,才能发挥数据的价值。智慧城市的每一个细节都会产生庞大的数据,同时,智慧城市的运行基础也来源于对大数据的深度分析。
大数据的表面是一系列静态的数据堆砌,但其实质是对数据进行复杂的分析之后得出一系列规律的动态过程。政府部门本身没有去做这样的事,这就需要企业对其进行支撑,同方看到了大数据对城市运行的重要意义,选择政府作为突破口,是形势发展的要求,也是同方大数据的独特之处。值得说明的是,同方大数据不参与政府决策,只是为政府决策提供数据支持。用数据的直观形式展现业务之间的关系,用数据表现城市发展变化和趋势,分析总结出城市存在的问题,为政府部门的决策提供辅助。
城市运行体征的管理也需要大数据的推动。大数据在反映城市运行体征的时候,并不需要了解城市部门的主要业务及运作流程,单纯从数据的角度出发,通过计算机软件分析之后,数据就能得出一些规律,不关乎业务,不关乎结果,但能完全反映出数据之间的关联性。从大数据的角度出发,驱动城市运行体征发展,是一个可以在决策前段刨出人力的纯计算机运作模式,这样的好处是运作的量化和规范化。
对于大数据、物联网与智慧城市的发展,中国信息技术权威专家――国务院物联网领导小组组长、中国工程院邬贺铨院士曾有一个很深奥的表述:从物联网到大数据再到智慧城市,是“格物致知”的过程,通过分析决策达到“知行合一”。
智慧城市惠及每个人
大数据驱动下的智慧城市,关乎每个人的生活。最普遍的例子就是天气预报,以前的天气预报只会预测一下天气,但现今的天气预报会告诉公众更多的信息,如气象指数、空气污染指数、穿衣指数、驱车安全指数等,甚至是否有利于运动,对发型及妆容的影响都有说明。这是能让普通百姓切身体会的智慧生活,未来,教育、交通等关乎人们衣食住行的方方面面都会变得智慧起来。教育方面,我们可以看看美国的做法,美国每个大学都会将升学率、就业率、毕业生的年薪水平等如实展示,这对学生选择学校专业等是很有利的数据支持。交通方面,怎样畅通城市交通,怎样寻找停车位,选择哪种交通方式更便利安全等,都是智慧城市的未来状态。
当提到智慧城市的未来发展时,赵英表示:智慧城市来源于智慧决策,智慧决策来源于人的智慧。当每个人都很智慧的时候,一个城市也会变得智慧起来。(以上内容来自中国传动网http://www.chuandong.com/tech/detail.aspx?id=29123)

D. 大数据的生命周期的九个阶段

大数据的生命周期的九个阶段
企业建立大数据的生命周期应该包括这些部分:大数据组织、评估现状、制定大数据战略、数据定义、数据收集、数据分析、数据治理、持续改进。

一、大数据的组织
没有人,一切都是妄谈。大数据生命周期的第一步应该是建立一个专门预算和独立KPI的“大数据规划、建设和运营组织”。包括高层的首席数据官,作为sponsor,然后是公司数据管理委员会或大数据执行筹划指导委员会,再往下就是大数据的项目组或大数据项目组的前身:大数据项目预研究团队或大数据项目筹备组。这个团队是今后大数据战略的制定和实施者的中坚力量。由于人数众多,建议引入RACI模型来明确所有人的角色和职责。
二、大数据的现状评估和差距分析
定战略之前,先要做现状评估,评估前的调研包括三个方面:一是对外调研:了解业界大数据有哪些最新的发展,行业顶尖企业的大数据应用水平如何?行业的平均尤其是主要竞争对手的大数据应用水准如何?二是对内客户调研。管理层、业务部门、IT部门自身、我们的最终用户,对我们的大数据业务有何期望?三是自身状况摸底,了解自己的技术、人员储备情况。最后对标,作差距分析,找出gap。
找出gap后,要给出成熟度现状评估。一般而言,一个公司的大数据应用成熟度可以划分为四个阶段:初始期(仅有概念,没有实践);探索期(已经了解基本概念,也有专人进行了探索和探讨,有了基本的大数据技术储备);发展期(已经拥有或正在建设明确的战略、团队、工具、流程,交付了初步的成果);成熟期(有了稳定且不断成熟的战略、团队、工具、流程,不断交付高质量成果)。
三、大数据的战略
有了大数据组织、知道了本公司大数据现状、差距和需求,我们就可以制定大数据的战略目标了。大数据战略的制定是整个大数据生命周期的灵魂和核心,它将成为整个组织大数据发展的指引。
大数据战略的内容,没有统一的模板,但有一些基本的要求:
1. 要简洁,又要能涵盖公司内外干系人的需求。
2. 要明确,以便清晰地告诉所有人我们的目标和愿景是什么。
3. 要现实,这个目标经过努力是能达成的。
四、大数据的定义
我认为:“数据不去定义它,你就无法采集它;无法采集它,你就无法分析它;无法分析它,你就无法衡量它;无法衡量它,你就无法控制它;无法控制它,你就无法管理它;无法管理它,你就无法利用它”。所以“在需求和战略明确之后,数据定义就是一切数据管理的前提”。
五、 数据采集
1. 大数据时代的数据源很广泛,它们可能来自于三个主要方面:现有公司内部网各应用系统产生的数据(比如办公、经营生产数据),也有来自公司外互联网的数据(比如社交网络数据)和物联网等。
2.大数据种类很多,总的来讲可以分为:传统的结构化数据,大量的非结构化数据(比如音视频等)。
3. 数据采集、挖掘工具很多。可以基于或集成hadoop的ETL平台、以交互式探索及数据挖掘为代表的数据价值发掘类工具渐成趋势。
4. 数据采集的原则:在数据源广泛、数据量巨大、采集挖掘工具众多的背景下,大数据决策者必须清楚地确定数据采集的原则:“能够采集到的数据,并不意味着值得或需要去采集它。需要采集的数据和能够采集到的数据的"交集",才是我们确定要去采集的数据。”
六、数据处理和分析
业界有很多工具能帮助企业构建一个集成的“数据处理和分析平台”。对企业大数据管理者、规划者来讲,关键是“工具要满足平台要求,平台要满足业务需求,而不是业务要去适应平台要求,平台要去适应厂商的工具要求”。那么这个集成的平台应该有怎样的能力构成呢?它应该能检索、分类、关联、推送和方便地实施元数据管理等。见下图:
七、 数据呈现
大数据管理的价值,最终要通过多种形式的数据呈现,来帮助管理层和业务部门进行商业决策。大数据的决策者需要将大数据的系统与BI(商业智能)系统和KM(知识管理)系统集成。下图就是大数据的各种呈现形式。
八、 审计、治理与控制
1.大数据的审计、治理和控制指的是大数据管理层,组建专门的治理控制团队,制定一系列策略、流程、制度和考核指标体系,来监督、检查、协调多个相关职能部门的目标,从而优化、保护和利用大数据,保障其作为一项企业战略资产真正发挥价值。
2.大数据的治理是IT治理的组成部分,大数据的审计是IT审计的组成部分,这个体系要统筹规划和实施,而不是割裂的规划和实施。
3.大数据的审计、治理与控制的核心是数据安全、数据质量和数据效率。
九、 持续改进
基于不断变化的业务需求和审计与治理中发现的大数据整个生命周期中暴露的问题,引入PDCA等方法论,去不断优化策略、方法、流程、工具,不断提升相关人员的技能,从而确保大数据战略的持续成功!

E. 大数据的期望膨胀期在哪个阶段

大海实际上是抱着星空的倒影睡觉,根据全文意思理解,大海犹如一位慈爱的母亲,哄着孩子睡着了,明月、星星映照在海洋里,就像是躺在大海的怀里,犹如抱着孩子一样。
《大海睡了》是一首优美的小诗,其描述了风平浪静、明月高悬的夜晚大海美景,其语言优美,富于想象,令人不由在脑海里勾勒出一幅绝美的夜晚海景图。

F. 大数据概述及基本概念

  1. 大数据的定义首先,还是要重新审视大数据的定义。

行业里对大数据的定义有很多,有广义的定义,也有狭义的定义。
广义的定义,有点哲学味道——大数据,是指物理世界到数字世界的映射和提炼。通过发现其中的数据特征,从而做出提升效率的决策行为。
狭义的定义,是技术工程师给的——大数据,是通过获取、存储、分析,从大容量数据中挖掘价值的一种全新的技术架构。
相比较而言,我还是喜欢技术定义,哈哈。
大家注意,关键词我都在上面原句加粗了哈!
要做什么?——获取数据、存储数据、分析数据
对谁做?——大容量数据
目的是什么?——挖掘价值
获取数据、存储数据、分析数据,这一系列的行为,都不算新奇。我们每天都在用电脑,每天都在干这个事。
例如,每月的月初,考勤管理员会获取每个员工的考勤信息,录入Excel表格,然后存在电脑里,统计分析有多少人迟到、缺勤,然后扣TA工资。
但是,同样的行为,放在大数据身上,就行不通了。换言之,传统个人电脑,传统常规软件,无力应对的数据级别,才叫“大数据”。

2.大数据,到底有多大?


我们传统的个人电脑,处理的数据,是GB/TB级别。例如,我们的硬盘,现在通常是1TB/2TB/4TB的容量。
TB、GB、MB、KB的关系,大家应该都很熟悉了:
1 KB = 1024 B (KB - kilobyte)

1 MB = 1024 KB (MB - megabyte)
1 GB = 1024 MB (GB - gigabyte)
1 TB = 1024 GB (TB - terabyte)
而大数据是什么级别呢?PB/EB级别。
大部分人都没听过。其实也就是继续翻1024倍:
1 PB = 1024 TB (PB - petabyte)
1 EB = 1024 PB (EB - exabyte)
只是看这几个字母的话,貌似不是很直观。我来举个例子吧。
1TB,只需要一块硬盘可以存储。容量大约是20万张照片或20万首MP3音乐,或者是671部《红楼梦》小说。
1PB,需要大约2个机柜的存储设备。容量大约是2亿张照片或2亿首MP3音乐。如果一个人不停地听这些音乐,可以听1900年。
1EB,需要大约2000个机柜的存储设备。如果并排放这些机柜,可以连绵1.2公里那么长。如果摆放在机房里,需要21个标准篮球场那么大的机房,才能放得下。
阿里、网络、腾讯这样的互联网巨头,数据量据说已经接近EB级。
EB还不是最大的。目前全人类的数据量,是ZB级。
1 ZB = 1024 EB (ZB - zettabyte)
2011年,全球被创建和复制的数据总量是1.8ZB。
而到2020年,全球电子设备存储的数据,将达到35ZB。如果建一个机房来存储这些数据,那么,这个机房的面积将比42个鸟巢体育场还大。
数据量不仅大,增长还很快——每年增长50%。也就是说,每两年就会增长一倍。
目前的大数据应用,还没有达到ZB级,主要集中在PB/EB级别。
大数据的级别定位:1 KB = 1024 B (KB - kilobyte)

1 MB = 1024 KB (MB - megabyte)
1 GB = 1024 MB (GB - gigabyte)
1 TB = 1024 GB (TB - terabyte)
1 PB = 1024 TB (PB - petabyte)
1 EB = 1024 PB (EB - exabyte)
1 ZB = 1024 EB (ZB - zettabyte)

3.数据的来源


数据的增长,为什么会如此之快?
说到这里,就要回顾一下人类社会数据产生的几个重要阶段。
大致来说,是三个重要的阶段。
第一个阶段,就是计算机被发明之后的阶段。尤其是数据库被发明之后,使得数据管理的复杂度大大降低。各行各业开始产生了数据,从而被记录在数据库中。
这时的数据,以结构化数据为主(待会解释什么是“结构化数据”)。数据的产生方式,也是被动的。如果你对大数据开发感兴趣,想系统学习大数据的话,可以戳我加入大数据技术学习交流群,私信管理员即可免费领取开发工具以及入门学习资料
第二个阶段,是伴随着互联网2.0时代出现的。互联网2.0的最重要标志,就是用户原创内容。
随着互联网和移动通信设备的普及,人们开始使用博客、facebook、youtube这样的社交网络,从而主动产生了大量的数据。
第三个阶段,是感知式系统阶段。随着物联网的发展,各种各样的感知层节点开始自动产生大量的数据,例如遍布世界各个角落的传感器、摄像头。
经过了“被动-主动-自动”这三个阶段的发展,最终导致了人类数据总量的极速膨胀。

4.大数据的4Vs


行业里对大数据的特点,概括为4个V。前面所说的庞大数据体量,就是Volume(海量化)。除了Volume之外,剩下三个,分别是Variety、Velocity、Value。
我们一个一个来介绍。

G. 大数据分析项目需要经历哪些阶段

发现(目标定义):把业务问题转化为分析目标,制定初始假设。

数据准备:准备好分析沙盘,对分析沙盘中的数据执行ETL或ELT,转化成使用和分析的格式,逐步治理数据

规划模型:了解数据之间的关系,确定模型的关键变量,和合适的分析模型

模型建立:创建测试数据集,学习数据集,和生产数据集。运行模型,修正参数,测试模型的可用性,和对运行环境的要求

沟通结果:评判是否达到第一阶段的目标,是否满足业主的要求,是否可以上线运行。

实施:在生产环境部署和实施一个试点项目,应用项目模型。

关于大数据分析项目需要经历哪些阶段的内容,青藤小编就和您分享到这里了。如果您对大数据工程有浓厚的兴趣,希望这篇文章可以为您提供帮助。如果您还想了解更多关于数据分析师、大数据工程师的技巧及素材等内容,可以点击本站的其他文章进行学习。

H. 大数据应用的三个阶段是什么

1、大数据应用的第一阶段:辅助产品



最初的应用比较简单,就是用以辅助产品人员和市场人员做判断。过去的实体产品做一次调研很麻烦。比如饮料公司,调研人员要用各种方式观看他们喝饮料的场景和步骤。



问卷是最常见的,但不准。所以会组织各种各样专业的现场试验,要搭建环境(一般是有单面玻璃或摄像头的)、邀请志愿者,然后引导他们按照日常的习惯去完成一些操作。



比如通过摄像头监视观察室。显然这种办法非常笨重。而现在的互联网产品则根本无须这么麻烦。用户所有的使用数据、行为,都是记录在案的,想知道什么,瞬间就能分析出来。



2、大数据应用的第二阶段:创造价值



在数据的数量和质量达到一定程度后,事情开始变化了。元数据将不仅作为产品的辅助,而是变成了最有价值的产生本身。很简单的,全中国最熟悉老百姓消费习惯的是工商局吗?是哪个协会吗?是哪个科研机构吗?都不是,是淘宝。



拥有最全面的个人信用信息的,是人事局吗?是银行吗?是咨询公司吗?都不是,是支付宝。道理也简单得很,所有行为(消费、交易)发生在了这个平台上,而这个平台又有所有数据的记录,那这些数据就能产生巨大的价值。



3. 大数据应用的第二阶段:创造价值



在数据的数量和质量达到一定程度后,事情开始变化了。元数据将不仅作为产品的辅助,而是变成了最有价值的产生本身。



春节的时候,支付宝为什么要和微信争抢小额支付和社交场景的支付?不是为了那点手续费,就是为了它缺失的社交支付这一块。这块数据的价值,远超想象。



未来我们每个人的衣食住行、生活起居,都将有大量的数据记录。我们的行为会变成一串串数字成为可量化的数据,成为描述我们的信息。我们工作用云笔记、吃饭用饿了么、打车用滴滴、搜东西用网络、社交用微信,每一步都事无巨细被记了下来。



关于大数据应用的三个阶段是什么,青藤小编就和您分享到这里了。如果您对大数据工程有浓厚的兴趣,希望这篇文章可以为您提供帮助。如果您还想了解更多关于数据分析师、大数据工程师的技巧及素材等内容,可以点击本站的其他文章进行学习。


以上是小编为大家分享的关于大数据应用的三个阶段是什么?的相关内容,更多信息可以关注环球青藤分享更多干货

阅读全文

与大数据的期望膨胀在哪个阶段相关的资料

热点内容
双十一成交数据什么概念 浏览:424
小数据怎么换分数 浏览:630
王者荣耀怎么样玩技术才会好 浏览:754
子腾电话手表怎么安装程序 浏览:918
批发市场哪里便宜实惠 浏览:559
广州南沙进口代理报关怎么操作 浏览:219
触摸驱动程序哪里下载 浏览:920
孟加拉产品有哪些 浏览:989
农产品直播为什么那么火 浏览:996
数据包是多少kb 浏览:85
如何通过二维码查询产品 浏览:325
西安啤酒代理要多少钱 浏览:941
聊城人事代理怎么找工作 浏览:530
麻省理工技术学院在哪里 浏览:785
乌海市货车怎么进入302市场 浏览:654
乳白的产品出现白纹怎么解决 浏览:656
当日交易次数是多少 浏览:649
靖江市如何申请农产品深加工补贴 浏览:686
哪里有学习飞行技术的 浏览:463
做程序员英语需要多少级 浏览:700