① 簡述什麼是大數據
大數據是指那些數據量特別大、數據類別特別復雜的數據集,這種數據集不能用傳統的資料庫進行轉存、管理和處理,是需要新處理模式才能具有更強大的決策力、洞察發現力和流程優化能力的海量、高增差率和多樣化的信息資產。
大數據的主要特點就是數據量大、數據處理速度快、數據真實性高、數據類別復雜等,它們合起來被稱為4大數據也可以應用在警察預測犯罪的發生、預測選舉結果,同時還能通過手機定位數據和交通數據建立城市規劃,現在醫療行業也在做大數據的分析。
(1)用自己的話總結什麼是大數據擴展閱讀:
社會發展速度非常快,科技也很發達,信息的流通和人們之間的交流也非常密切,而大數據就是這個時代高科技的產物。對於大部分行業而言,怎麼運用這些大規模數據是贏得競爭的關鍵,但同時,大數據在經濟發展中的意義不能取代一切對於社會問題的理性思考。
數據行業非常的受歡迎,人才需要求量也非常大,而且企業給大數據工程師的薪資比一般工程師的薪資也要高很多。
② 什麼是大數據
大數據(big data)是指無法在一定時間范圍內用常規軟體工具進行捕捉、管理和處理的數據集合,是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的信息資產。
在維克托·邁爾-舍恩伯格及肯尼斯·庫克耶編寫的《大數據時代》中大數據指不用隨機分析法(抽樣調查)這樣捷徑,而採用所有數據進行分析處理。大數據的5V特點(IBM提出):Volume(大量)、Velocity(高速)、Variety(多樣)、Value(低價值密度)、Veracity(真實性)。
大數據的特徵:
容量(Volume):數據的大小決定所考慮的數據的價值和潛在的信息;
種類(Variety):數據類型的多樣性;
速度(Velocity):指獲得數據的速度;
可變性(Variability):妨礙了處理和有效地管理數據的過程。
真實性(Veracity):數據的質量。
復雜性(Complexity):數據量巨大,來源多渠道。
價值(value):合理運用大數據,以低成本創造高價值。
③ 大數據是什麼
大數據的概念可能不同的人會有不同的理解,我自己從08年開始從事大數據相關的工作,那個時候我們是覺得自己搞的是雲計算和數據倉庫,而到了2011、2012年的時候,國內大數據的概念才興起來,之後就是炒了三年的概念。
因為從事這一方向,這幾年不斷會有人問我什麼是大數據?我一直都回答不好。在最近的幾個月,我對這一概念思考的更多一些,結合看過的一些資料(如《大數據時代》、《數學之美》第二版、《矽谷之謎》、吳軍的演講材料等)和實際的經歷,算是有了一些認識。與其說認識,還不如說是總結,換個角度看待這個問題,分為大數據概念和大數據思維。
我把大數據的概念總結為四個字:大、全、細、時。
大數據之大
我們先來看一組數據:
網路每天採集的用戶行為數據有1.5PB以上
全國各地級市今天的蘋果價格數據有2MB
1998年Google抓取的互聯網頁面共有47GB(壓縮後)
一台風力發電機每天產生的振動數據有50GB
網路每天的行為數據1.5個PB夠大吧?我們毫無懷疑這是大數據。但全國各個地級市今天的蘋果價格只有2MB大小,是典型的小數據吧?但如果我們基於這個數據,做一個蘋果分銷的智能調度系統,這就是個牛逼的大數據應用了。Google在剛成立的時候,佩奇和布林下載了整個互聯網的頁面,在壓縮後也就47GB大小,現在一個U盤都能裝的下,但Google搜索顯然是個大數據的應用。如果再來看一台風機每天的振動數據可能都有50GB,但這個數據只是針對這一台風機的,並不能從覆蓋面上,起到多大的作用,這我認為不能叫大數據。
這里就是在強調大,是Big不是Large,我們強調的是抽象意義的大。
④ 大數據的定義是什麼
大數據(big data)是指無法在一定時間內用常規軟體工具對其內容進行抓取、管理和處理的數據集合。大數據有五大特點,即大量(Volume)、高速(Velocity)、多樣(Variety)、低價值密度(Value)、真實性(Veracity)。它並沒有統計學的抽樣方法,只是觀察和追蹤發生的事情。
大數據的用法傾向於預測分析、用戶行為分析或某些其他高級數據分析方法的使用。
⑤ 用簡單的話說說什麼是大數據
大數據基本含義其實就是是海量數據。
有人說,大數據就像國王的新衣,每個人都在國王面前說著動聽的話,國王信以為真,其實竟然不知道自己在裸奔。
的確,網路上有很多人在談大數據,但是他們只會談,不會做,因為他們根本就沒有做過,包括那些所謂的「大數據專家」,他們真的做過嗎?沒有。
事實上,這些人對大數據內在的問題一點兒都不了解,更別說知道大數據的水有多深了。
大數據基本含義其實就是是海量數據。
而現在大家聊得最多的大數據是基於已經存在的大數據的應用開發。目前,在大數據方面,無法深入應用的原因在於,從收集到使用的大數據價值鏈出現了問題。從理論上來說,從收到用的螺旋式循環是一個巨大的渦輪,只有先數據化運營,然後才能運營數據。而現在的情況是,用數據的人不知道大數據從哪裡來,做數據的人不知道大數據如何使用。用的人不敢用,因為大數據的真實性;做的人不知道怎麼用,因為大數據的復雜性。這一問題造成的結果就是,數據量變得越來越大,而且越來越無法有效地使用。
大數據怎麼玩?
大數據源:首先確保有足夠龐大的數據源作為數據資源,才能玩的起來大數據。再次,對於大數據真實性的核實也非常關鍵。如果所採用的數據為虛假數據,那麼基本上可以宣告以此為基礎的所有分析,應用都是空中樓閣。或者還可能帶來致命的錯誤。嚴謹,真實,0誤差,是對數據源的基本要求。
玩數據的人員:
人員的素質。包括,技術素質:數據採集,數據錄入,數據分析等環節的人員的素質。都包含在大數據體系中。
道德素質:對於有些人員惡意泄露數據,或者對數據惡意篡改的行為都是潛在風險。
數據模型設置:
數據模型建設非常重要。可能只是一個參數或者關注數值的變化,就能給大數據帶來巨大的偏差。
數據備份的安全:
龐大的數據,不僅是存儲和備份的問題。其本身的安全保障性能也是需要人們亟待去解決的問題。近幾年互聯網排頭兵們龐大的資料庫屢屢被攻破和信息泄露,讓人們不得不加強對於網路數據安全的關注和保護措施。
大數據應用創新:
對於大數據的核心輸出模式。也就是應用場景的創新還需要進行更加精準的定位和創新設計。再好的原材料,碰不上個好廚子,也是白費。
追捧熱詞和時代的潮流毋庸置疑,但是在追求熱潮的時候,作為科技領域的踐行者,一定要保持一顆嚴謹的心。這樣才能真正的成為弄潮兒!
⑥ 什麼是「大數據」,如何理解「大數據」
你好,大數據是指巨量的數據,指的是需要新處理模式才能具有更強的決策力、洞察力和流程優化能力的海量、高增長率和多樣化的信息資產。
當下,大數據技術作為新興技術被許多互聯網大廠所需,以華為為例。
1、華為雲推出大數據稽核方案解決偷逃費
很多朋友可能發現,部分省界收費站變少而ETC通道在增加,高速公路的出行體驗比以前更加順暢。然而,在公眾體驗節省費用、便捷通行等利好的同時,高速公路的管理運營單位卻飽受新情況的困擾。
部分車主偷逃費方式多樣化,包括換卡逃費、車頭掛車分離逃費、倒換電子標簽、ETC車道跟車逃費等。同時偷逃費行為向專業化、團伙化演變,給高速運營單位帶來大量經濟損失和嚴峻挑戰。
以華為為例,華為給1-3年經驗的大數據開發工程師開到了高達4萬的月薪,在其他大廠的招聘中30k-60k的大數據開發工程師,也只要1-3年工作經驗,可以說大數據、雲計算仍是當下的紅利崗位。
希望我的回答對你有所幫助!