導航:首頁 > 數據處理 > 大數據的期望膨脹在哪個階段

大數據的期望膨脹在哪個階段

發布時間:2022-04-12 15:21:30

A. Gartner發布2014技術成熟度曲線,大數據去哪兒

摘要:近日,Gartner發布了最新的新興技術成熟度曲線(Hype Cycle for Emerging Technologies)。去年,大數據享有至高無上的地位,處於Gartner所說的「期望膨脹高峰期」。但現在,大數據已經跌入「幻滅的低谷期」。物聯網取而代之,占據了成熟度曲線的最高點。

在2012年和2013年,Gartner的分析師們曾認為,物聯網還需要10年以上的時間才會達到「生產率穩定期」。但今年,他們認為物聯網只需要5到10年時間就會達到這個最終成熟階段。
小編的理解是,無論是大數據還是物聯網,數據和數據之上的信息都是不變的「主旋律」。物聯網將數據流動的介質進一步「下沉」至具備聯網功能和數據傳輸能力的「物件」上,讓更多的機器、設備成為人們生產與生活交互的一部分。

今年成熟度曲線上的一個新面孔是「數據科學」,預計它將在2到5年時間里達到穩定期。與其說它是一項或一套具體的技術,不如說是一個處理大數據的學科。Gartner在《成熟度曲線特別報告》(Hype Cycle Special Report)中指出:「雖然對大數據的興趣依然不減,但它已經離開高峰期,因為該市場已經安定下來,有了一整套合理的方法,新的技術和實踐被添加進現有方案。」雖然大數據興趣不減,市場趨向穩定,但Gartner認為,大數據還有5到10年才會達到穩定期。看來,大數據相關技術的演進在未來一段時間內仍將展現出強大的生命力,相關市場的營收也將不斷放大。

對於Gartner對新興技術起伏的判斷,皮尤研究中心(Pew Research Center)的互聯網、科學和技術研究主管李·雷尼(Lee Rainie)作出了如下評價:「雖然成熟度曲線不是嚴格地以數據為基礎,但高德納分析師們對技術採納狀況作出的判斷常常與其他優秀觀察者的看法相一致。在特定創新應該處於曲線什麼位置的問題上,有時會有爭議,但該曲線所勾勒的總體趨勢很少受到質疑。」

2014年標志著新興技術成熟度曲線這個有用的工具已經問世20周年。該工具旨在跟蹤人們對技術和商業創新的周期性興趣爆發和經常性失望的起起伏伏。Gartner副總裁兼著名分析師貝特西·伯頓(Betsy Burton)談到了成熟度曲線作為跟蹤創新及其商業影響力如何逐漸演變的工具,以及2014年版的新變化。伯頓說:「很多時候,我們看到的是人們的注意力從支持信息、應用、雲端系統和大數據的基礎設施,轉向我們如何運用雲計算、大數據和社交的某些能力來解決現實的商業問題。我們正目睹人們的注意力從技術本身轉向將這項技術實際運用到現實的商業需求和商業成果中。」

B. 大數據時代,面臨的七個挑戰和八大趨勢

大數據時代,面臨的七個挑戰和八大趨勢

大數據挑戰和機遇並存,大數據在未來幾年的發展將從前幾年的預期膨脹階段、炒作階段轉入理性發展階段、落地應用階段,大數據在未來幾年將逐漸步入理性發展期。未來的大數據發展依然存在諸多挑戰,但前景依然非常樂觀。

大數據發展的挑戰

目前大數據的發展依然存在諸多挑戰,包括七大方面的挑戰:業務部門沒有清晰的大數據需求導致數據資產逐漸流失;企業內部數據孤島嚴重,導致數據價值不能充分挖掘;數據可用性低,數據質量差,導致數據無法利用;數據相關管理技術和架構落後,導致不具備大數據處理能力;數據安全能力和防範意識差,導致數據泄露;大數據人才缺乏導致大數據工作難以開展;大數據越開放越有價值,但缺乏大數據相關的政策法規,導致數據開放和隱私之間難以平衡,也難以更好的開放。

挑戰一:業務部門沒有清晰的大數據需求

很多企業業務部門不了解大數據,也不了解大數據的應用場景和價值,因此難以提出大數據的准確需求。由於業務部門需求不清晰,大數據部門又是非盈利部門,企業決策層擔心投入比較多的成本,導致了很多企業在搭建大數據部門時猶豫不決,或者很多企業都處於觀望嘗試的態度,從根本上影響了企業在大數據方向的發展,也阻礙了企業積累和挖掘自身的數據資產,甚至由於數據沒有應用場景,刪除很多有價值歷史數據,導致企業數據資產流失。因此,這方面需要大數據從業者和專家一起,推動和分享大數據應用場景,讓更多的業務人員了解大數據的價值。

挑戰二:企業內部數據孤島嚴重

企業啟動大數據最重要的挑戰是數據的碎片化。在很多企業中尤其是大型的企業,數據常常散落在不同部門,而且這些數據存在不同的數據倉庫中,不同部門的數據技術也有可能不一樣,這導致企業內部自己的數據都沒法打通。如果不打通這些數據,大數據的價值則非常難挖掘。大數據需要不同數據的關聯和整合才能更好的發揮理解客戶和理解業務的優勢。如何將不同部門的數據打通,並且實現技術和工具共享,才能更好的發揮企業大數據的價值。

挑戰三:數據可用性低,數據質量差

很多中型以及大型企業,每時每刻也都在產生大量的數據,但很多企業在大數據的預處理階段很不重視,導致數據處理很不規范。大數據預處理階段需要抽取數據把數據轉化為方便處理的數據類型,對數據進行清洗和去噪,以提取有效的數據等操作。甚至很多企業在數據的上報就出現很多不規范不合理的情況。以上種種原因,導致企業的數據的可用性差,數據質量差,數據不準確。而大數據的意義不僅僅是要收集規模龐大的數據信息,還有對收集到的數據進行很好的預處理處理,才有可能讓數據分析和數據挖掘人員從可用性高的大數據中提取有價值的信息。Sybase的數據表明,高質量的數據的數據應用可以顯著提升企業的商業表現,數據可用性提高10%,企業的業績至少提升在10%以上。

挑戰四:數據相關管理技術和架構

技術架構的挑戰包含以下幾方面:(1)傳統的資料庫部署不能處理TB級別的數據,快速增長的數據量超越了傳統資料庫的管理能力。如何構建分布式的數據倉庫,並可以方便擴展大量的伺服器成為很多傳統企業的挑戰;(2)很多企業採用傳統的資料庫技術,在設計的開始就沒有考慮數據類別的多樣性,尤其是對結構化數據、半結構化和非結構化數據的兼容;(3)傳統企業的資料庫,對數據處理時間要求不高,這些數據的統計結果往往滯後一天或兩天才能統計出來。但大數據需要實時處理數據,進行分鍾級甚至是秒級計算。傳統的資料庫架構師缺乏實時數據處理的能力;(4)海量的數據需要很好的網路架構,需要強大的數據中心來支撐,數據中心的運維工作也將成為挑戰。如何在保證數據穩定、支持高並發的同時,減少伺服器的低負載情況,成為海量數據中心運維的一個重點工作。

挑戰五:數據安全

網路化生活使得犯罪分子更容易獲得關於人的信息,也有了更多不易被追蹤和防範的犯罪手段,可能會出現更高明的騙局。如何保證用戶的信息安全成為大數據時代非常重要的課題。在線數據越來越多,黑客犯罪的動機比以往都來的強烈,一些知名網站密碼泄露、系統漏洞導致用戶資料被盜等個人敏感信息泄露事件已經警醒我們,要加強大數據網路安全的建設。另外,大數據的不斷增加,對數據存儲的物理安全性要求會越來越高,從而對數據的多副本與容災機制也提出更高的要求。目前很多傳統企業的數據安全令人擔憂。

挑戰六:大數據人才缺乏

大數據建設的每個環節都需要依靠專業人員完成,因此,必須培養和造就一支掌握大數據技術、懂管理、有大數據應用經驗的大數據建設專業隊伍。目前大數據相關人才的欠缺將阻礙大數據市場發展。據Gartner預測,到2015年,全球將新增440萬個與大數據相關的工作崗位,且會有25%的組織設立首席數據官職位。大數據的相關職位需要的是復合型人才,能夠對數學、統計學、數據分析、機器學習和自然語言處理等多方面知識綜合掌控。未來,大數據將會出現約100萬的人才缺口,在各個行業大數據中高端人才都會成為最炙手可熱的人才,涵蓋了大數據的數據開發工程師、大數據分析師、數據架構師、大數據後台開發工程師、演算法工程師等多個方向。因此需要高校和企業共同努力去培養和挖掘。目前最大的問題是很多高校缺乏大數據,所以擁有大數據的企業應該與學校聯合培養人才。

挑戰七:數據開放與隱私的權衡

在大數據應用日益重要的今天,數據資源的開放共享已經成為在數據大戰中保持優勢的關鍵。商業數據和個人數據的共享應用,不僅能促進相關產業的發展,也能給我們的生活帶來巨大的便利。由於政府、企業和行業信息化系統建設往往缺少統一規劃,系統之間缺乏統一的標准,形成了眾多「信息孤島」,而且受行政壟斷和商業利益所限,數據開放程度較低,這給數據利用造成極大障礙。另外一個制約我國數據資源開放和共享的一個重要因素是政策法規不完善,大數據挖掘缺乏相應的立法。無法既保證共享又防止濫用。因此,建立一個良性發展的數據共享生態系統,是我國大數據發展需要邁過去的一道砍。同時,開放與隱私如何平衡,也是大數據開放過程中面臨的最大難題。如何在推動數據全面開放、應用和共享的同時有效地保護公民、企業隱私,逐步加強隱私立法,將是大數據時代的一個重大挑戰。

大數據發展趨勢

雖然大數據仍在起步階段,存在諸多挑戰,但未來的發展依然非常樂觀。大數據的發展呈現八大趨勢:數據資源化,將成為最有價值的資產;大數據在更多的傳統行業的企業管理落地;大數據和傳統商業智能融合,行業定製化解決方案將涌現;數據將越來越開放,數據共享聯盟將出現;大數據安全越來越受重視,大數據安全市場將愈發重要;大數據促進智慧城市發展,為智慧城市的引擎;大數據將催生一批新的工作崗位和相應的專業;大數據在多方位改善我們的生活。

趨勢一:數據資源化,將成為最有價值的資產

隨著大數據應用的發展,大數據價值得以充分的體現,大數據在企業和社會層面成為重要的戰略資源,數據成為新的戰略制高點,是大家搶奪的新焦點。《華爾街日報》在一份題為《大數據,大影響》的報告宣傳,數據已經成為一種新的資產類別,就像貨幣或黃金一樣。Google、Facebook、亞馬遜、騰訊、網路、阿里巴巴和360等企業正在運用大數據力量獲得商業上更大的成功,並且金融和電信企業也在運用大數據來提升自己的競爭力。我們有理由相信大數據將不斷成為機構和企業的資產,成為提升機構和企業競爭力的有力武器。

趨勢二:大數據在更多的傳統行業的企業管理落地

一種新的技術往往在少數行業應用取得了好的效果,對其他行業就有強烈的示範效應。目前大數據在大型互聯網企業已經得到較好的應用,其他行業的大數據尤其是電信和金融也逐漸在多種應用場景取得效果。因此,我們有理由相信,大數據作為一種從數據中創造新價值的工具,將會在許多行業的企業得到應用,帶來廣泛的社會價值。大數據將在幫助企業更好的理解和滿足客戶需求和潛在需求,更好的應用在業務運營智能監控、精細化企業運營、客戶生命周期管理、精細化營銷、經營分析和戰略分析等方面。企業管理既有藝術也有科學,相信大數據在科學管理企業方面有更顯著的促進,讓更多擁抱大數據的企業實現智慧企業管理。

趨勢三:大數據和傳統商業智能融合,行業定製化解決方案將涌現

來自傳統商業智能領域者將大數據當成一個新增的數據源,而大數據從業者則認為傳統商業智能只是其領域中處理少量數據時的一種方法。大數據用戶更希望能獲得一種整體的解決方案,即不僅要能收集、處理和分析企業內部的業務數據,還希望能引入互聯網上的網路瀏覽、微博、微信等非結構化數據。除此之外,還希望能結合移動設備的位置信息,這樣企業就可以形成一個全面、完整的數據價值發展平台。畢竟,無論是大數據還是商業智能,目的都是為分析服務的,數據全面整合起來,更有利於發現新的商業機會,這就是大數據商業智能。同時,由於行業的差異性,很難研發出一套適用於各行業的大數據商業智能分析系統,因此,在一些規模較大的行業市場,大數據服務提供商將會以更加定製化的商業智能解決方案提供大數據服務。我們相信更多的大數據商業智能定製化解決方案將在電信、金融、零售等行業出現。

趨勢四:數據將越來越開放,數據共享聯盟將出現

大數據越關聯越有價值,越開放越有價值。尤其是公共事業和互聯網企業的數據開放數據將越來越多。我們看到,美國、英國、澳大利亞等國家的政府都在政府和公共事業上的數據做出努力。而國內的一些城市和部門也在逐漸開展數據開放的工作。比如北京市在2012年就開始試運行政務數據資源網,在2013年年底正式開放;上海在2012年啟動了政府數據資源開放試點工作,數據涉及地理位置、交通、經濟統計和資格資質等數據;2014年,貴州省也加入數據開放之列,10月份雲上貴州正式上線。對於不同的行業,數據越共享也是越有價值。如果每一個醫院想獲得更多病情特徵庫以及葯效信息,那麼就需要全國,甚至全世界的醫療信息共享,從而可以通過平台進行分析,獲取更大的價值。我們相信數據會呈現一種共享的趨勢,不同領域的數據聯盟將出現。

趨勢五:大數據安全越來越受重視,大數據安全市場將愈發重要

隨著數據的價值的越來越重要,大數據的安全穩定也將會逐漸被重視。網路和數字化生活也使得犯罪的分子更容易獲取關於他人的信息,也有更多的騙術和犯罪手段出現,所以,在大數據時代,無論對於數據本身的保護,還是對於由數據而演變的一些信息的安全,對大數據分析有較高要求的企業將至關重要。大數據安全是跟大數據業務相對應的,與傳統安全相比,大數據安全的最大區別是安全廠商在思考安全問題的時候首先要進行業務分析,並且找出針對大數據的業務的威脅,然後提出有針對性的解決方案。比如,對於數據存儲這個場景,目前很多企業採用開源軟體如Hadoop技術來解決大數據問題,由於其開源性,但是其安全問題也是突出的。因此,市場需要更多專業的安全廠商針對不同的大數據安全問題來提供專業的服務。

趨勢六:大數據促進智慧城市發展,為智慧城市的引擎

隨著大數據的發展,大數據在智慧城市將發揮著越來越重要的作用。由於人口聚集給城市帶來了交通、醫療、建築等各方面的壓力,需要城市能夠更合理地進行資源布局和調配,而智慧城市正是城市治理轉型的最優解決方案。智慧城市是通過物與物、物與人、人與人的互聯互通能力、全面感知能力和信息利用能力,通過物聯網、移動互聯網、雲計算等新一代信息技術,實現城市高效的政府管理、便捷的民生服務、可持續的產業發展。智慧城市相對於之前數字城市概念,最大的區別在於對感知層獲取的信息進行了智慧的處理。由城市數字化到城市智慧化,關鍵是要實現對數字信息的智慧處理,其核心是引入了大數據處理技術。大數據是智慧城市的核心智慧引擎。智慧安防、智慧交通、智慧醫療、智慧城管等,都是以大數據為基礎的的智慧城市應用領域。

趨勢七:大數據將催生一批新的工作崗位和相應的專業

一個新行業的出現,必將在工作職位方面有新的需求,大數據的出現也將推出一批新的就業崗位,例如,大數據分析師、數據管理專家、大數據演算法工程師、數據產品經理等等。具有有豐富經驗的數據分析人才將成為稀缺的資源,數據驅動型工作將呈現爆炸式的增長。而由於有強烈的市場需求,高校也將逐步開設大數據相關的專業,以培養相應的專業人才。企業也將和高校緊密合作,協助高校聯合培養大數據人才。如2014年,IBM 全面推進與高校在大數據領域的合作,引入強大的研發團隊和業務夥伴,推動「大數據平台」和「大數據分析」的面向行業產學研創新合作以及系統化知識體系建設和高價值人才培養,建設符合中國教學特色及人才需求的大數據相關學分課程,為未來建設特色專業方向做准備。

趨勢八:大數據在多方位改善我們的生活

大數據不僅用於企業和政府,也應用於我們的生活。在健康方面:我們可以利用智能手環監測,對我們的睡眠模式來進行追蹤,了解睡眠質量;我們可以利用智能血壓計、智能心率儀遠程的監控身在異地的家裡老人的健康情況,讓遠在他方的外出工作者更加放心;在出行方面:我們可以利用智能導航出行GPS數據了解交通狀況,並根據擁堵情況進行路線實時調優。在居家生活方面:大數據將成為智能家居的核心,智能家電實現了擬人智能,產品通過感測器和控制晶元來捕捉和處理信息,可以根據住宅空間環境和用戶需求自動設置控制,甚至提出優化生活質量的建議,如我們的冰箱可能會在每天一大早建議我們當天的菜譜。

以上是小編為大家分享的關於大數據時代,面臨的七個挑戰和八大趨勢的相關內容,更多信息可以關注環球青藤分享更多干貨

C. 大數據、物聯網與智慧城市三者是什麼關系@《控制與傳動》雜志

大數據是信息化社會無形的生產資料,其概念被社會各界不斷演繹出多種版本,但關於大數據、物聯網、智慧城市三者之間的關系,很多人不甚明了。對此,同方物聯網產業應用本部技術總監趙英,對此做出了詳細的解讀。

大數據、物聯網、智慧城市三者之間的關系簡單來說就是:大數據的發展源於物聯網技術的應用,並用於支撐智慧城市的發展。物聯網技術作為互聯網應用的拓展,正處於大發展階段。物聯網是智慧城市的基礎,但智慧城市的范疇相比物聯網而言更為廣泛;智慧城市的衡量指標由大數據來體現,大數據促進智慧城市的發展;物聯網是大數據產生的催化劑,大數據源於於物聯網應用。
中國已步入大數據時代
有人說大數據來了,但只是在美國而不是中國。專做政府數據管理的同方對此的看法是:中國對大數據的理解普遍還不那麼深入或者與美國的理解有所不同,但不能否認的是,中國已經步入大數據時代。現在中國的很多部委都已經在研究大數據、運用大數據。美國將大數據提升為國家戰略,中國還沒有明確提出,但已經把大數據上升為與國防一樣的高度,多部委還聯合發布了鼓勵措施。我國政府對大數據的敏感度快速提高,並正在採取措施。所以說,中國已經步入大數據時代,這種重視是由政府層面自上而下進行普及的,可能還未普及到普通百姓層面,但各級政府已經有了高度重視。鄔賀銓院士也曾表示:「我國將產生全球最大量的數據,要重視大數據的開發利用和管理。」
大數據的關鍵在於分享。我國智慧城市發展的一個瓶頸在於信息孤島效應,各政府部門間不願公開、分項數據,這就造成數據之間的割裂,無法產生數據的深度價值。關於這一問題,一些政府部門也有清醒的認識,開始尋求解決方案,這是受自身的需求驅動的。比如,一些政府部門原來不願分享自己的數據,但現在開始尋求數據交換夥伴,因為他們逐漸意識到單一的數據是沒法發揮最大效能的,部門之間相互交換數據已經成為一種發展趨勢。同時,隨著各方面的發展及政策的推進,很多以前不公開的數據也逐漸公開了,這對大數據的發展都是有力的支持。
物聯網技術推進大數據發展
物聯網對大數據的意義方面,趙英舉了個例子來說明物聯網技術對大數據的推進。去年北京7.21暴雨之後,政府採取了很多解決措施,很重要的一個體現是,北京市科委很快就立了專項基金去給受災的房山和門頭溝這兩個區進行應急管理能力的提升以及信息化的建設。同方參與了門頭溝的項目,幫助門頭溝提升預警能力。同方對門頭溝原來的應急平台進行了改造和提升。比如對水位的監測,在有些重點立交橋下安裝水位計,水位到一定程度會發生預警,相關部門就可以據此採取一些措施,這就是物聯網技術的應用。
物聯網技術跟大數據什麼關系?當水位計的點增多後,就會收集到更多的數據,這樣更便於發現一些規律並發出預警,這是採用大數據的技術手段自然而然就能做的事情。在點位數少的情況下,數據量不夠大,只能解決一部分問題。所以說,正因為有了物聯網,大數據布的點越來越多,自然而然就要會去分析實時數據。數據的挖掘,原本是對於歷史數據的挖掘,現在對於實時數據的挖掘也是一種趨勢,說明物聯網的技術在推進著大數據相關技術的發展。
大數據支撐智慧城市的發展
城市運行體征是通過數據進行量化表現出來的,但這些數據散亂在政府的各個部門中,同方的職責是收集各部門有關城市運行體征的數據,幫助城市管理者進行數據匯總、分析,最終對城市體征的量化形態即各類數據進行管理,供政府管理者使用。
政府部門做的每一個決策都需要長期的調研,調研的資料來源於政府部門運行、城市運行的長期積累。政府信息化的高速發展已使政府產生了幾百TB的數據。但數據本身沒有任何意義,只有經過一定的系統分析之後,才能發揮數據的價值。智慧城市的每一個細節都會產生龐大的數據,同時,智慧城市的運行基礎也來源於對大數據的深度分析。
大數據的表面是一系列靜態的數據堆砌,但其實質是對數據進行復雜的分析之後得出一系列規律的動態過程。政府部門本身沒有去做這樣的事,這就需要企業對其進行支撐,同方看到了大數據對城市運行的重要意義,選擇政府作為突破口,是形勢發展的要求,也是同方大數據的獨特之處。值得說明的是,同方大數據不參與政府決策,只是為政府決策提供數據支持。用數據的直觀形式展現業務之間的關系,用數據表現城市發展變化和趨勢,分析總結出城市存在的問題,為政府部門的決策提供輔助。
城市運行體征的管理也需要大數據的推動。大數據在反映城市運行體征的時候,並不需要了解城市部門的主要業務及運作流程,單純從數據的角度出發,通過計算機軟體分析之後,數據就能得出一些規律,不關乎業務,不關乎結果,但能完全反映出數據之間的關聯性。從大數據的角度出發,驅動城市運行體征發展,是一個可以在決策前段刨出人力的純計算機運作模式,這樣的好處是運作的量化和規范化。
對於大數據、物聯網與智慧城市的發展,中國信息技術權威專家――國務院物聯網領導小組組長、中國工程院鄔賀銓院士曾有一個很深奧的表述:從物聯網到大數據再到智慧城市,是「格物致知」的過程,通過分析決策達到「知行合一」。
智慧城市惠及每個人
大數據驅動下的智慧城市,關乎每個人的生活。最普遍的例子就是天氣預報,以前的天氣預報只會預測一下天氣,但現今的天氣預報會告訴公眾更多的信息,如氣象指數、空氣污染指數、穿衣指數、驅車安全指數等,甚至是否有利於運動,對發型及妝容的影響都有說明。這是能讓普通百姓切身體會的智慧生活,未來,教育、交通等關乎人們衣食住行的方方面面都會變得智慧起來。教育方面,我們可以看看美國的做法,美國每個大學都會將升學率、就業率、畢業生的年薪水平等如實展示,這對學生選擇學校專業等是很有利的數據支持。交通方面,怎樣暢通城市交通,怎樣尋找停車位,選擇哪種交通方式更便利安全等,都是智慧城市的未來狀態。
當提到智慧城市的未來發展時,趙英表示:智慧城市來源於智慧決策,智慧決策來源於人的智慧。當每個人都很智慧的時候,一個城市也會變得智慧起來。(以上內容來自中國傳動網http://www.chuandong.com/tech/detail.aspx?id=29123)

D. 大數據的生命周期的九個階段

大數據的生命周期的九個階段
企業建立大數據的生命周期應該包括這些部分:大數據組織、評估現狀、制定大數據戰略、數據定義、數據收集、數據分析、數據治理、持續改進。

一、大數據的組織
沒有人,一切都是妄談。大數據生命周期的第一步應該是建立一個專門預算和獨立KPI的「大數據規劃、建設和運營組織」。包括高層的首席數據官,作為sponsor,然後是公司數據管理委員會或大數據執行籌劃指導委員會,再往下就是大數據的項目組或大數據項目組的前身:大數據項目預研究團隊或大數據項目籌備組。這個團隊是今後大數據戰略的制定和實施者的中堅力量。由於人數眾多,建議引入RACI模型來明確所有人的角色和職責。
二、大數據的現狀評估和差距分析
定戰略之前,先要做現狀評估,評估前的調研包括三個方面:一是對外調研:了解業界大數據有哪些最新的發展,行業頂尖企業的大數據應用水平如何?行業的平均尤其是主要競爭對手的大數據應用水準如何?二是對內客戶調研。管理層、業務部門、IT部門自身、我們的最終用戶,對我們的大數據業務有何期望?三是自身狀況摸底,了解自己的技術、人員儲備情況。最後對標,作差距分析,找出gap。
找出gap後,要給出成熟度現狀評估。一般而言,一個公司的大數據應用成熟度可以劃分為四個階段:初始期(僅有概念,沒有實踐);探索期(已經了解基本概念,也有專人進行了探索和探討,有了基本的大數據技術儲備);發展期(已經擁有或正在建設明確的戰略、團隊、工具、流程,交付了初步的成果);成熟期(有了穩定且不斷成熟的戰略、團隊、工具、流程,不斷交付高質量成果)。
三、大數據的戰略
有了大數據組織、知道了本公司大數據現狀、差距和需求,我們就可以制定大數據的戰略目標了。大數據戰略的制定是整個大數據生命周期的靈魂和核心,它將成為整個組織大數據發展的指引。
大數據戰略的內容,沒有統一的模板,但有一些基本的要求:
1. 要簡潔,又要能涵蓋公司內外干係人的需求。
2. 要明確,以便清晰地告訴所有人我們的目標和願景是什麼。
3. 要現實,這個目標經過努力是能達成的。
四、大數據的定義
我認為:「數據不去定義它,你就無法採集它;無法採集它,你就無法分析它;無法分析它,你就無法衡量它;無法衡量它,你就無法控制它;無法控制它,你就無法管理它;無法管理它,你就無法利用它」。所以「在需求和戰略明確之後,數據定義就是一切數據管理的前提」。
五、 數據採集
1. 大數據時代的數據源很廣泛,它們可能來自於三個主要方面:現有公司內部網各應用系統產生的數據(比如辦公、經營生產數據),也有來自公司外互聯網的數據(比如社交網路數據)和物聯網等。
2.大數據種類很多,總的來講可以分為:傳統的結構化數據,大量的非結構化數據(比如音視頻等)。
3. 數據採集、挖掘工具很多。可以基於或集成hadoop的ETL平台、以互動式探索及數據挖掘為代表的數據價值發掘類工具漸成趨勢。
4. 數據採集的原則:在數據源廣泛、數據量巨大、採集挖掘工具眾多的背景下,大數據決策者必須清楚地確定數據採集的原則:「能夠採集到的數據,並不意味著值得或需要去採集它。需要採集的數據和能夠採集到的數據的"交集",才是我們確定要去採集的數據。」
六、數據處理和分析
業界有很多工具能幫助企業構建一個集成的「數據處理和分析平台」。對企業大數據管理者、規劃者來講,關鍵是「工具要滿足平台要求,平台要滿足業務需求,而不是業務要去適應平台要求,平台要去適應廠商的工具要求」。那麼這個集成的平台應該有怎樣的能力構成呢?它應該能檢索、分類、關聯、推送和方便地實施元數據管理等。見下圖:
七、 數據呈現
大數據管理的價值,最終要通過多種形式的數據呈現,來幫助管理層和業務部門進行商業決策。大數據的決策者需要將大數據的系統與BI(商業智能)系統和KM(知識管理)系統集成。下圖就是大數據的各種呈現形式。
八、 審計、治理與控制
1.大數據的審計、治理和控制指的是大數據管理層,組建專門的治理控制團隊,制定一系列策略、流程、制度和考核指標體系,來監督、檢查、協調多個相關職能部門的目標,從而優化、保護和利用大數據,保障其作為一項企業戰略資產真正發揮價值。
2.大數據的治理是IT治理的組成部分,大數據的審計是IT審計的組成部分,這個體系要統籌規劃和實施,而不是割裂的規劃和實施。
3.大數據的審計、治理與控制的核心是數據安全、數據質量和數據效率。
九、 持續改進
基於不斷變化的業務需求和審計與治理中發現的大數據整個生命周期中暴露的問題,引入PDCA等方法論,去不斷優化策略、方法、流程、工具,不斷提升相關人員的技能,從而確保大數據戰略的持續成功!

E. 大數據的期望膨脹期在哪個階段

大海實際上是抱著星空的倒影睡覺,根據全文意思理解,大海猶如一位慈愛的母親,哄著孩子睡著了,明月、星星映照在海洋里,就像是躺在大海的懷里,猶如抱著孩子一樣。
《大海睡了》是一首優美的小詩,其描述了風平浪靜、明月高懸的夜晚大海美景,其語言優美,富於想像,令人不由在腦海里勾勒出一幅絕美的夜晚海景圖。

F. 大數據概述及基本概念

  1. 大數據的定義首先,還是要重新審視大數據的定義。

行業里對大數據的定義有很多,有廣義的定義,也有狹義的定義。
廣義的定義,有點哲學味道——大數據,是指物理世界到數字世界的映射和提煉。通過發現其中的數據特徵,從而做出提升效率的決策行為。
狹義的定義,是技術工程師給的——大數據,是通過獲取、存儲、分析,從大容量數據中挖掘價值的一種全新的技術架構。
相比較而言,我還是喜歡技術定義,哈哈。
大家注意,關鍵詞我都在上面原句加粗了哈!
要做什麼?——獲取數據、存儲數據、分析數據
對誰做?——大容量數據
目的是什麼?——挖掘價值
獲取數據、存儲數據、分析數據,這一系列的行為,都不算新奇。我們每天都在用電腦,每天都在干這個事。
例如,每月的月初,考勤管理員會獲取每個員工的考勤信息,錄入Excel表格,然後存在電腦里,統計分析有多少人遲到、缺勤,然後扣TA工資。
但是,同樣的行為,放在大數據身上,就行不通了。換言之,傳統個人電腦,傳統常規軟體,無力應對的數據級別,才叫「大數據」。

2.大數據,到底有多大?


我們傳統的個人電腦,處理的數據,是GB/TB級別。例如,我們的硬碟,現在通常是1TB/2TB/4TB的容量。
TB、GB、MB、KB的關系,大家應該都很熟悉了:
1 KB = 1024 B (KB - kilobyte)

1 MB = 1024 KB (MB - megabyte)
1 GB = 1024 MB (GB - gigabyte)
1 TB = 1024 GB (TB - terabyte)
而大數據是什麼級別呢?PB/EB級別。
大部分人都沒聽過。其實也就是繼續翻1024倍:
1 PB = 1024 TB (PB - petabyte)
1 EB = 1024 PB (EB - exabyte)
只是看這幾個字母的話,貌似不是很直觀。我來舉個例子吧。
1TB,只需要一塊硬碟可以存儲。容量大約是20萬張照片或20萬首MP3音樂,或者是671部《紅樓夢》小說。
1PB,需要大約2個機櫃的存儲設備。容量大約是2億張照片或2億首MP3音樂。如果一個人不停地聽這些音樂,可以聽1900年。
1EB,需要大約2000個機櫃的存儲設備。如果並排放這些機櫃,可以連綿1.2公里那麼長。如果擺放在機房裡,需要21個標准籃球場那麼大的機房,才能放得下。
阿里、網路、騰訊這樣的互聯網巨頭,數據量據說已經接近EB級。
EB還不是最大的。目前全人類的數據量,是ZB級。
1 ZB = 1024 EB (ZB - zettabyte)
2011年,全球被創建和復制的數據總量是1.8ZB。
而到2020年,全球電子設備存儲的數據,將達到35ZB。如果建一個機房來存儲這些數據,那麼,這個機房的面積將比42個鳥巢體育場還大。
數據量不僅大,增長還很快——每年增長50%。也就是說,每兩年就會增長一倍。
目前的大數據應用,還沒有達到ZB級,主要集中在PB/EB級別。
大數據的級別定位:1 KB = 1024 B (KB - kilobyte)

1 MB = 1024 KB (MB - megabyte)
1 GB = 1024 MB (GB - gigabyte)
1 TB = 1024 GB (TB - terabyte)
1 PB = 1024 TB (PB - petabyte)
1 EB = 1024 PB (EB - exabyte)
1 ZB = 1024 EB (ZB - zettabyte)

3.數據的來源


數據的增長,為什麼會如此之快?
說到這里,就要回顧一下人類社會數據產生的幾個重要階段。
大致來說,是三個重要的階段。
第一個階段,就是計算機被發明之後的階段。尤其是資料庫被發明之後,使得數據管理的復雜度大大降低。各行各業開始產生了數據,從而被記錄在資料庫中。
這時的數據,以結構化數據為主(待會解釋什麼是「結構化數據」)。數據的產生方式,也是被動的。如果你對大數據開發感興趣,想系統學習大數據的話,可以戳我加入大數據技術學習交流群,私信管理員即可免費領取開發工具以及入門學習資料
第二個階段,是伴隨著互聯網2.0時代出現的。互聯網2.0的最重要標志,就是用戶原創內容。
隨著互聯網和移動通信設備的普及,人們開始使用博客、facebook、youtube這樣的社交網路,從而主動產生了大量的數據。
第三個階段,是感知式系統階段。隨著物聯網的發展,各種各樣的感知層節點開始自動產生大量的數據,例如遍布世界各個角落的感測器、攝像頭。
經過了「被動-主動-自動」這三個階段的發展,最終導致了人類數據總量的極速膨脹。

4.大數據的4Vs


行業里對大數據的特點,概括為4個V。前面所說的龐大數據體量,就是Volume(海量化)。除了Volume之外,剩下三個,分別是Variety、Velocity、Value。
我們一個一個來介紹。

G. 大數據分析項目需要經歷哪些階段

發現(目標定義):把業務問題轉化為分析目標,制定初始假設。

數據准備:准備好分析沙盤,對分析沙盤中的數據執行ETL或ELT,轉化成使用和分析的格式,逐步治理數據

規劃模型:了解數據之間的關系,確定模型的關鍵變數,和合適的分析模型

模型建立:創建測試數據集,學習數據集,和生產數據集。運行模型,修正參數,測試模型的可用性,和對運行環境的要求

溝通結果:評判是否達到第一階段的目標,是否滿足業主的要求,是否可以上線運行。

實施:在生產環境部署和實施一個試點項目,應用項目模型。

關於大數據分析項目需要經歷哪些階段的內容,青藤小編就和您分享到這里了。如果您對大數據工程有濃厚的興趣,希望這篇文章可以為您提供幫助。如果您還想了解更多關於數據分析師、大數據工程師的技巧及素材等內容,可以點擊本站的其他文章進行學習。

H. 大數據應用的三個階段是什麼

1、大數據應用的第一階段:輔助產品



最初的應用比較簡單,就是用以輔助產品人員和市場人員做判斷。過去的實體產品做一次調研很麻煩。比如飲料公司,調研人員要用各種方式觀看他們喝飲料的場景和步驟。



問卷是最常見的,但不準。所以會組織各種各樣專業的現場試驗,要搭建環境(一般是有單面玻璃或攝像頭的)、邀請志願者,然後引導他們按照日常的習慣去完成一些操作。



比如通過攝像頭監視觀察室。顯然這種辦法非常笨重。而現在的互聯網產品則根本無須這么麻煩。用戶所有的使用數據、行為,都是記錄在案的,想知道什麼,瞬間就能分析出來。



2、大數據應用的第二階段:創造價值



在數據的數量和質量達到一定程度後,事情開始變化了。元數據將不僅作為產品的輔助,而是變成了最有價值的產生本身。很簡單的,全中國最熟悉老百姓消費習慣的是工商局嗎?是哪個協會嗎?是哪個科研機構嗎?都不是,是淘寶。



擁有最全面的個人信用信息的,是人事局嗎?是銀行嗎?是咨詢公司嗎?都不是,是支付寶。道理也簡單得很,所有行為(消費、交易)發生在了這個平台上,而這個平台又有所有數據的記錄,那這些數據就能產生巨大的價值。



3. 大數據應用的第二階段:創造價值



在數據的數量和質量達到一定程度後,事情開始變化了。元數據將不僅作為產品的輔助,而是變成了最有價值的產生本身。



春節的時候,支付寶為什麼要和微信爭搶小額支付和社交場景的支付?不是為了那點手續費,就是為了它缺失的社交支付這一塊。這塊數據的價值,遠超想像。



未來我們每個人的衣食住行、生活起居,都將有大量的數據記錄。我們的行為會變成一串串數字成為可量化的數據,成為描述我們的信息。我們工作用雲筆記、吃飯用餓了么、打車用滴滴、搜東西用網路、社交用微信,每一步都事無巨細被記了下來。



關於大數據應用的三個階段是什麼,青藤小編就和您分享到這里了。如果您對大數據工程有濃厚的興趣,希望這篇文章可以為您提供幫助。如果您還想了解更多關於數據分析師、大數據工程師的技巧及素材等內容,可以點擊本站的其他文章進行學習。


以上是小編為大家分享的關於大數據應用的三個階段是什麼?的相關內容,更多信息可以關注環球青藤分享更多干貨

閱讀全文

與大數據的期望膨脹在哪個階段相關的資料

熱點內容
牛奶祛痘痘產品有哪些 瀏覽:233
反映信息的技術是什麼 瀏覽:264
qq有多少個地方泄露信息 瀏覽:259
亞太罐頭代理公司怎麼樣 瀏覽:656
咸陽西關舊貨市場有哪些 瀏覽:975
ps如何邊看數據邊修圖 瀏覽:101
滬深a股交易規則有哪些 瀏覽:496
百貨公司如何申請支付寶小程序 瀏覽:652
在網上代理什麼合適 瀏覽:328
sock4代理干什麼用 瀏覽:485
如何給產品配圖案 瀏覽:418
穿孔石有哪些產品 瀏覽:675
交易系統買點怎麼選擇 瀏覽:801
如何通過現有資源推廣產品 瀏覽:957
如何講解技術方案 瀏覽:327
怎麼關閉手機應用程序 瀏覽:158
如何消除理財產品 瀏覽:311
程序員和工廠有什麼不同 瀏覽:117
寧波哪個市場賣家用開關插座的 瀏覽:757
怎麼排查小程序 瀏覽:622