『壹』 在當前大數據的新環境下it企業面臨哪些機會與挑戰
挑戰一:數據來源錯綜復雜,豐富的數據源是大數據產業發展的前提。而我國數字化的數據資源總量遠遠低於美歐。
挑戰二:數據挖掘分析模型建立,關於大數據分析,人們鼓吹其神奇價值的喧囂聲浪很高,卻鮮見其實際運用得法的模式和方法。
挑戰三:數據開放與隱私的權衡,目前我國一些部門和機構擁有大量數據但寧願自己不用也不願提供給有關部門共享,導致信息不完整或重復投資。
挑戰四:大數據管理與決策,在今時今日的商業世界中,高管的決策仍然更多地依賴個人經驗和直覺,而不是基於數據。
挑戰五:大數據人才缺口,精通大數據技術的相關人才也成為一個大缺口。
『貳』 如何應對大數據的挑戰
大數據行業面臨的五大挑戰如下:
挑戰一:數據來源錯綜復雜
豐富的數據源是大數據產業發展的前提。而我國數字化的數據資源總量遠遠低於美歐,每年新增數據量僅為美國的7%,歐洲的12%,其中政府和製造業的數據資源積累遠遠落後於國外。就已有有限的數據資源來說,還存在標准化、准確性、完整性低,利用價值不高的情況,這大大降低了數據的價值。
現如今,幾乎任何規模企業,每時每刻也都在產生大量的數據,但這些數據如何歸集、提煉始終是一個困擾。而大數據技術的意義確實不在於掌握規模龐大的數據信息,而在於對這些數據進行智能處理,從中分析和挖掘出有價值的信息,但前提是如何獲取大量有價值的數據。
挑戰二:數據挖掘分析模型建立
步入大數據時代,人們紛紛在談論大數據,似乎這已經演化為新的潮流趨勢。數據比以往任何時候都更加根植於我們生活中的每個角落。我們試圖用數據去解決問題、改善福利,並且促成新的經濟繁榮。人們紛紛流露出去大數據的高期待以及對大數據分析技術的格外看好。然而,關於大數據分析,人們鼓吹其神奇價值的喧囂聲浪很高,卻鮮見其實際運用得法的模式和方法。造成這種窘境的原因主要有以下兩點:一是對於大數據分析的價值邏輯尚缺乏足夠深刻的洞察;其次便是大數據分析中的某些重大要件或技術還不成熟。大數據時代下數據的海量增長以及缺乏這種大數據分析邏輯以及大數據技術的待發展,正是大數據時代下我們面臨的挑戰。
挑戰三:數據開放與隱私的權衡
數據應用的前提是數據開放,這已經是共識。有專業人士指出,中國人口居世界首位,但2010年中國新存儲的數據為250PB,僅為日本的60%和北美的7%。目前我國一些部門和機構擁有大量數據但寧願自己不用也不願提供給有關部門共享,導致信息不完整或重復投資。2012年中國的數據存儲量達到64EB,其中55%的數據需要一定程度的保護,然而目前只有不到一半的數據得到保護。
挑戰四:大數據管理與決策
大數據的技術挑戰顯而易見,但其帶來的決策挑戰更為艱巨。大數據至關重要的方面,就是它會直接影響組織怎樣作決策、誰來作決策。在信息有限、獲取成本高昂且沒有被數字化的時代,組織內作重大決策的人,都是典型的位高權重的人,要不然就是高價請來的擁有專業技能和顯赫履歷的外部智囊。但是,在今時今日的商業世界中,高管的決策仍然更多地依賴個人經驗和直覺,而不是基於數據。
挑戰五:大數據人才缺口
如果說,以Hadoop為代表的大數據是一頭小象,那麼企業必須有能夠馴服它的馴獸師。在很多企業熱烈擁抱這類大數據技術時,精通大數據技術的相關人才也成為一個大缺口。
『叄』 大數據時代所面臨的挑戰
大數據時代所面臨的挑戰
大數據時代臨近,企業數據呈現爆炸式增長,如何為了更大的發掘企業數據價值將是很多公司必須要面對的挑戰。首當其沖的是大數據的快速發展對我們原有的IT基礎設施提供了更高的挑戰,原有的IT基礎設施以及很難滿足大數據時代的需求。發現價值的過程離不開基礎平台技術的創新與發展。
基礎平台的改變
首先大數據挑戰的就是企業的存儲系統,大數據爆炸式的增長使得存儲系統的容量、擴展能力、傳輸瓶頸等方面都面臨著挑戰。與之相連的還有伺服器的計算能力,內存的存儲能力等等都面臨著新的技術攻關。目前快閃記憶體技術的發展以及英特爾、IBM等公司在大數據方面都已經投入相當大的資金進行研發,主要也是為了解決大數據對基礎平台所帶來的挑戰。
同樣,大數據分析同樣面臨著軟體方面的挑戰,同時也引發資料庫、數據倉庫、數據挖掘、商業智能、人工智慧、內容/知識管理等領域的技術變革。Hadoop是近年大家經常提到了一個能夠對大量數據進行分布式處理的軟體框架,用戶可以輕松地在Hadoop上開發和運行處理海量數據的應用程序。
商業模式的挑戰
大數據具有強大的數據價值,當我們可以利用大數據挖掘到需要信息的時候,則需要我們根據得到的信息對企業的商業模型、產品和服務等方面進行創新,這樣才能夠真正的讓大數據的價值得到體現。
如何利用大數據信息來改變商業模式最終實現價值呢,這里我們引用Tesco為案例。Tesco收集了海量的顧客數據,並且通過對每位顧客海量數據的分析,Tesco對每位顧客的信用程度和相關風險都會有一個極為准確的評估。在這個基礎上,Tesco推出了自己的信用卡,未來Tesco還有野心推出自己的存款服務。
以上是小編為大家分享的關於大數據時代所面臨的挑戰的相關內容,更多信息可以關注環球青藤分享更多干貨
『肆』 大數據面臨的技術挑戰
上周在大數據的趨勢和特點中,說到了人類這次面臨的問題不是問題無法解決,而是問題過於復雜。採用機械思維,其速度和效率已經趕不上新問題的產生。正是在這種分工越來越細,協作越來越緊密,問題越來越復雜的背景下,產生了大數據思維。大數據思維也由其獨特的體量大、多樣性和完備性,使得過去看來很復雜很難處理的問題變得可以解決了。
其實早在20世紀60年代就有研究學者提出採用人工智慧的方法來解決社會問題。當時的人工智慧方法還是局限於通過首先了解人類是如何產生智能,然後讓計算機按照人的思路去做。吳軍老師在《智能時代》中說到:「在人類發明的歷史上,很多領域早期的嘗試都是模仿人或者動物的行為,因為這是我們的直覺最容易想到的方法。」 但是經過十幾年的發展,科學家們發現採用上面的思路去發展人工智慧,似乎解決不了什麼實際問題。很多科學家開始反思人工智慧的發展,而在之後的20年左右的時間,在人工智慧學術界的研究是處於低谷的。20世紀70年代,人類開始嘗試智能的另一條發展道路,即採用數據驅動和超級計算的方法。即便在10年前,那時我還在念書,也曾接觸過人工神經網路演算法。很顯然,當時對機器智能的概念大家都還是比較模糊的,人工智慧也還沒有被我們提高到現在的高度。
機器智能的概念在60多年就被提出來了,真正的突破卻在具有了大數據的今天。為什麼大數據的拐點會發生在今天?大數據到底面臨何種技術挑戰?
過去的10年,最容易看到的特徵就是全球數據量呈爆炸式增長。大數據的第一個來源是電腦本身;第二個來源是感測器;第三個來源是將那些過去已經存在的、以非數字化形式儲存的信息數字化。據2015年思科公司的統計數據顯示,從2009~2015年的6年時間內,企業級數據增長了50倍。當然數據的爆炸式增長,離不開電腦硬體、軟體、互聯網、數據儲存、數據處理等一系列配套技術的發展和支撐。大數據實際上是對計算機科學、電機工程、通信、應用數學和認知科學發展的一個綜合考量。目前這些技術難題不一定有最佳的解決方案,甚至不存在什麼絕對好的解決辦法。
一、數據收集
傳統的數據方法常常是先有一個目的,然後開始收集數據。比如,海王星的發現就是在人們發現天王星運動軌跡和牛頓力學預測出來的不一樣之後,天文學家拍了很多星空的照片後發現的;心理學研究也是在有了一個明確的研究課題後,再通過實驗的方法採集數據,如 「棉花糖測驗」系列實驗,以及關於認知失調的「追隨者案例」等等。大數據則避免了采樣之苦,因為大數據常常以全集(大數據的特徵之一)作為樣本集。
但是,如何收集到全集就是一件很有挑戰的事情了。目前一些聰明公司,比如Google, Facebook, 網路,京東都是繞一個彎子,間接地去收集數據,然後利用數據的相關性,導出自己想要的結論。但是即便是這些如此成功的公司,仍然也有很多失敗的案例。2010年,Google推出了自己的電視機頂盒Google TV,為了獲取數據為進入電視廣告做准備。但是,由於Google TV銷售得很差,最終Google徹底地放棄了這產品。到目前為止,無論是Google過去的機頂盒,還是後來的Chromecast,蘋果的Apple TV,除了統計一下收視率,計算一下可能的廣告觀眾,並沒有什麼大的作為。數據收集是一個開放性的話題,不存在唯一性或最佳方法,目前仍然面臨著很大的挑戰。
二、數據儲存
僅Google街景地圖每天產生的數據量就有1TB,假如一份數據存三個拷貝,一年下來就1PB。即使使用當今最大容量的10TB硬碟,也需要用100個。因此,不能簡單地依靠設備來解決數據儲存的問題,而是需要技術解決方案來提高儲存效率,保證不斷產生出來的數據都能存得下。目前的數據儲存手段主要是從如下2個方面考慮:去除數據冗餘和便於使用。去除數據冗餘可以簡單理解為去除數據中的重復部分,比如同一份附件在所有的郵件中只儲存一次。這樣,在去除數據冗餘的過程中,相應的數據讀寫處理就要改變。是否有比現在更有效率的儲存格式或方式,仍然是大數據所面臨的挑戰。另外,便於使用的思路是從使用者的角度就去考慮數據的儲存。大數據之前,數據在設計文件系統的數據儲存格式時,主要考慮的是規模小、維度少的結構化數據。到了大數據時代,不僅數據量和維度都劇增,而且大數據在形式上也沒有固定模式,因此需要重新設計通用、有效和便捷的數據表示方式和儲存方式。
三、數據處理
大數據由於體量大、維度多,處理起來計算量巨大,其處理效率是一大技術挑戰。並行計算是目前解決計算量巨大的重要手段,但仍然存在一些的問題。例如,任何一個問題總用一部分計算是無法並行計算的,這類計算佔比越大,並行處理的效率就越低;再次,並行計算中無法保證每一個小任務的計算量是相同的,這樣一來,並行計算的效率也會大打折扣,即完成了自己計算任務的伺服器需要等待個別尚未完成的伺服器,最終的計算速度取決於最後完成的子任務。
四、數據挖掘
如何從一堆雜亂無章的數據中挖掘出有價值的信息,是機器智能的關鍵,也是大數據的使命。數據在進行降噪處理之後,基本就可以直接使用了,接下來的關鍵一步就是機器學習。目前廣泛使用的機器學習演算法有人工神經網路演算法、最大熵模型、邏輯自回歸等。Google公司的AlphaGo的訓練演算法就是人工神經網路。機器學習的過程是一個不斷迭代、不斷進化的過程,只要事先定出一個目前,這些演算法就會不斷地優化模型,讓它越來越接近真實的情況。尋找更優演算法一直也是科學家們探索的難題。
五、數據安全
大數據應用的一個挑戰還來自數據安全的擔憂和對隱私的訴求。2014年爆出的索尼公司丟失數據時,造成的損失高達1億美元。比商業數據丟失後損失更大的是醫療數據的被盜。在中國,除了在北京建立了大數據中心,還在貴陽建立了大數據災備中心,而且正籌備在內蒙古再建立另一個數據災備中心。而關於數據隱私,我想大家應該是深有感觸,由於信息泄露而帶來的騷擾電話以及電信詐騙,就發生在我們每個人身上。據《智能時代》中記載:「在美國的黑市上,一個醫療記錄的賣家是商業數據的50倍左右」。可見,數據安全已然成為大數據發展的一大隱患和難題。
上述大數據5個方面的技術挑戰並不是獨立的,而是相輔相成、互相影響的。關於大數據的技術挑戰在此僅談談個人的一點認識,希望對大家在這方面的思考有所幫助。下周我們繼續聊,大數據給我們帶來便利以及隱患。
『伍』 大數據應用都面臨什麼挑戰
第一個挑戰就是對數據資源及其價值的認識不足。這是因為全社會尚未形成對大數據客觀、科學的認識,對數據資源及其在人類生產、生活和社會管理方面的價值利用認識不足,存在盲目追逐硬體設施投資、輕視數據資源積累和價值挖掘利用等現象。所以說這是我國大數據長期內最大的挑戰,但也是比較容易實現的目標。
第二個挑戰就是技術創新與支撐能力不夠。這主要是因為大數據需要從底層晶元到基礎軟體再到應用分析軟體等信息產業全產業鏈的支撐,無論是新型計算平台、分布式計算架構,還是大數據處理、分析和呈現方面與國外均存在較大差距,對開源技術和相關生態系統的影響力仍然較弱,總體上難以滿足各行各業大數據應用需求。而這是大數據短期內最大的挑戰。
第三個挑戰就是數據資源建設和應用水平不高。這是因為用戶普遍不重視數據資源的建設,即使有數據意識的機構也大多隻重視數據的簡單存儲,很少針對後續應用需求進行加工整理。而且數據資源普遍存在質量差,標准規范缺乏,管理能力弱等現象。在很多跨部門、跨行業的數據共享仍不順暢,有價值的公共信息資源和商業數據開放程度低。數據價值難以被有效挖掘利用,所以說,大數據應用整體上處於起步階段,潛力遠未釋放。
第四個挑戰就是信息安全和數據管理體系尚未建立。數據所有權、隱私權等相關法律法規和信息安全、開放共享等標准規范缺乏,技術安全防範和管理能力不夠,尚未建立起兼顧安全與發展的數據開放、管理和信息安全保障體系。
第五個挑戰就是人才隊伍建設還需加強。就目前而言,我國的綜合掌握數學、統計學、計算機等相關學科及應用領域知識的綜合性數據科學人才缺乏,遠不能滿足發展需要,尤其是缺乏既熟悉行業業務需求,又掌握大數據技術與管理的綜合型人才。
『陸』 大數據帶來的挑戰有哪些 會導致數據盲點
大數據帶來的第一個挑戰就是還要不要調查數據。
事實上對調查數據的挑戰,取決於對調查數據的替代程度和擴大程度。相對於大數據而言,調查數據,就是小數據。
大數據與小數據有一個交集,兩種數據交集重疊的部分會怎麼樣增長,取決於兩個因素,一個是感測器技術的發展,一是數據挖掘的演算法技術的發展,這兩項技術未來的發展,直接影響到社會科學未來發展的走向。
第二個挑戰,社會學研究範式還有用嗎?在《大數據時代》中,提到過去的研究範式是抽樣、精確、因果。作者說這三個過去我們為之努力奮斗的範式可能面臨著革命性的轉變。事實是否如此,這是一個值得認真思考的信號。