㈠ 有什麼比較好的大數據入門的書推薦
比較好的大數據入門的書有《大數據日知錄:架構與演算法》。
《大數據日知錄:架構與演算法》是2014年電子工業出版社出版的圖書,作者是張俊林。《大數據日知錄:架構與演算法》從架構與演算法的角度全面梳理了大數據存儲與處理的相關技術。大數據技術具有涉及的知識點異常眾多且正處於快速演進發展過程中等特點。
其技術點包括底層的硬體體系結構、相關的基礎理論、大規模數據存儲系統、分布式架構設計、各種不同應用場景下的差異化系統設計思路、機器學習與數據挖掘並行演算法以及層出不窮的新架構、新系統等。
主要介紹
本書對眾多紛繁蕪雜的相關技術文獻和系統進行了擇優汰劣並系統性地對相關知識分門別類地進行整理和介紹,將大數據相關技術分為大數據基礎理論、大數據系統體系結構、大數據存儲。
以及包含批處理、流式計算、互動式數據分析、圖資料庫、並行機器學習的架構與演算法以及增量計算等技術分支在內的大數據處理等幾個大的方向。通過這種體系化的知識梳理與講解,相信對於讀者整體和系統地了解、吸收和掌握相關的技術有很大的幫助與促進作用。
㈡ 零基礎學習大數據要看哪些書
1、《為數據而生》
書中分別闡述在大數據1.0、大數據2.0和大數據3.0時代下,相對應的數據分析需要做到分析、外化、集成。
2、《智能時代》
這本書作者分七章從不同角度對大數據進行介紹,分別以技術和思維方式的改變為主線,從工業革命這個角度嵌入,順理成章的延伸出大數據與智能化,但是沒有將過多筆墨放在技術的深究上,而是選擇從應用層面體現大數據的理念。大數據應用則會滲透到各行各業,這正是作者的用心之處。
3、《R語言預測實戰》
R語言橫跨了金融、生物、醫學、互聯網等多個領域,主要用於統計、建模及可視化。由於上手快、效率高,備受技術人員青睞。預測是大數據挖掘的主要作用之一,藉助R語言來做大數據預測,可以兼具效率與價值於一身。
4、《數據之巔》
這本書中,從小數據時代到大數據的崛起,作者以宏大的歷史觀、文化觀、大數據觀,給我們描繪了一幅數據科學、智慧文化的全景圖。
5、《Hadoop權威指南》
《Hadoop權威指南(中文版)》從Hadoop的緣起開始,由淺入深,結合理論和實踐,全方位地介紹Hadoop這一高性能處理海量數據集的理想工具。
6、《Hive編程指南》
《Hive編程指南》是一本Apache Hive的編程指南,旨在介紹如何使用Hive的SQL方法HiveQL來匯總、查詢和分析存儲在Hadoop分布式文件系統上的大數據集合。
進行完大數據編程語言的學習,這時候你就可以真正的接觸大數據技術知識了,我們知道大數據以Hadoop、spark、storm等核心技術組成,自然也會以此為重點突破。
㈢ 推薦兩本關於大數據時代的書,謝謝。
新人們被」大數據「、」人工智慧「、」21世紀是數據分析師的時代「等等信息吸引過來,立志成為一名數據分析師,於是問題來了,數據分析到底是干什麼的?數據分析都包含什麼內容?
市面上有很多講數據分析內容的書籍,在此我推薦《深入淺出數據分析》,此書對有基礎人士可稱消遣讀物, 但對新人們還是有一定的作用。閱讀時可不求甚解,重點了解數據分析的流程、應用場景、以及書中提到的若干數據分析工具,無需糾結分析模型的實現。5個小時,足夠你對數據分析工作建立初步的印象,消除陌生感。
15個小時只夠你了解一下統計學知識,作為入門足夠,但你要知道,今後隨著工作內容的深入,需要學習更多的統計知識。
本階段推薦書籍有二:《深入淺出統計學》《統計學:從數據到結論》,要了解常用數理統計模型(描述統計指標、聚類、決策樹、貝葉斯分類、回歸等),重點放在學習模型的工作原理、輸入內容和輸出內容,至於具體的數學推導,學不會可暫放一邊,需要用的時候再回來看。
對於非技術類數據分析人員,初級工具只推薦一個:EXCEL。推薦書籍為《誰說菜鳥不會數據分析》,基礎篇必須學習,提高篇不一定學(可用其他EXCEL進階書籍),也可以學習網上的各種公開課。
本階段重點要學習的是EXCEL中級功能使用(數據透視表,函數,各類圖表使用場景及如何製作),如有餘力可學習VBA。
作為數據分析人員,PPT製作能力是極其重要的一項能力,因此需要花一點時間來了解如何做重點突出,信息明確的PPT,以及如何把各類圖表插入到PPT中而又便於更新數據。10個小時並不算多,但已經足夠(你從來沒做過PPT的話,需要再增加一些時間)。具體書籍和課程就不推薦了,網上一抓一大把,請自行搜索。
這個階段有兩個目標:學習基礎的資料庫和編程知識以提升你將來的工作效率,以及測試一下你適合學習哪一種高級數據分析工具。對於前者,資料庫建議學MySQL(雖然Hadoop很有用但你不是技術職位,初期用不到),編程語言建議學Python(繼續安利《深入淺出Python》,我真沒收他們錢……)。資料庫學到聯合查詢就好,性能優化、備份那些內容用不到;Python則是能學多少學多少。
雖然EXCEL可以解決70%以上的問題,但剩下30%還是需要高級工具來做(不信用EXCEL做個聚類)。高級分析工具有兩個選擇:SPSS和R。雖然R有各種各樣的好處,但我給的建議是根據你在上一步中的學習感覺來定學哪一個工具,要是學編程語言學的很痛苦,就學SPSS,要是學的很快樂,就學R。不管用哪一種工具,都要把你學統計學時候學會的重點模型跑一遍,學會建立模型和小幅優化模型即可。
這里我在時間上寫了個」+「號,因為這一步並不一定要用整塊時間來學習,它是貫穿在你整個學習過程中的。數據分析師最需要不斷提升的能力就是行業和業務知識,沒有之一。你將來想投入哪個行業和哪個職位的方向,就要去學習相關的知識(比如你想做網站運營,那就要了解互聯網背景知識、網站運營指標體系、用戶運營知識等內容)。
你學習了那麼多內容,但現在出去的話你還是找不到好工作。所有的招聘人員都會問你一句話:你做過哪些實際項目?(即使你是應屆生也一樣) 如果你有相關的項目經驗或者實習經驗,當然可以拿出來,但是如果沒有,怎麼辦?答案很簡單,做個報告給他們看,告訴招聘者:我已經有了數據分析入門級(甚至進階級)職位的能力。同時,做報告也會是你將來工作的主要內容,因此也有可能出現另外一種情況:你費盡心血做了一個報告,然後發現這不是你想要的生活,決定去干別的工作了……這也是件好事,有數據分析能力的人做其他工作也算有一項優勢。
㈣ 有什麼比較好的大數據入門的書推薦
1. 《大數據分析:點「數」成金》
你現在正坐在一座金礦上,這些金子或被埋於備份,或正藏在你眼前的數據集里,他們是提升公司效益、拓展新的商業關系、制定更直觀決策的秘訣所在,足以使你的企業更上一層樓。你將明白如何利用、分析和駕馭數據來獲得豐厚回報。作者Frank Ohlhorst厚積數十年的技術經驗寫了此書。該書介紹了如何將大數據應用於各行各業,你將了解到如何對數據進行挖掘,怎樣從數據中揭示趨勢並轉化為競爭策略及提取價值的方法。這些更有意思也是更有效的方法能夠提升企業的智能化水平,將有助於企業解決實際問題,提升利潤空間,提高生產率並發現更多的商業機會。
2.《大數據時代》
《大數據時代》是國外大數據系統研究的先河之作,本書作者維克托被譽為」大數據商業應用第一人」,擁有再哈佛大學、牛津大學和新加坡國立大學等多個互聯網研究重鎮任教經歷,早在2010年就在《經濟學人》上發布了長達14頁對大數據應用的前瞻性研究。該書主要講了大數據時代的變革、商業變革和管理變革。《大數據時代》認為大數據的核心就是預測。大數據為人類的生活創造了前所未有的可量化的維度。大數據已經成為了新發明和新服務的源泉,而更多的改變正蓄勢待發。
3.《雲端時代殺手級應用:大數據分析》
《雲端時代殺手級應用:大數據分析》分析了什麼是大數據、大數據大商機、技術與前瞻三個部分。第一個部分介紹大數據分析的概念,以及企業、政府部門可應用的范疇。什麼是大數據分析?與個人與企業有什麼關系?將對全球產業造成什麼樣的沖擊?第二部分完整介紹了大數據在各產業的應用實況,為企業及政府部門提供應用的方向。提供了全球各地的實際應用案例,涵蓋了零售、金融、政府部門、能源、製造、娛樂等各個行業,充分展示了大數據分析產生的效益。第三部分則簡單介紹了大數據分析所需要的技術及未來的發展趨勢,為讀者提供了應用與研究的方向。
4.《大數據》
本書通過講述美國半個多世紀信息開放、技術創新的歷史,以別開生面的經典案例奧巴馬建設」前所未有的開放政府「的雄心、公開財務透明的曲折。《數據質量法》背後隱情,全國醫改法案的波瀾、統一身份證的百年糾結以及雲計算、Facebook和推特等社交媒體等等,為您一一講解數據創新給社會帶來的種種變革和挑戰。
5.《大數據互聯網大規模數據挖掘與分布式處理》。
該書主要講的是海量數集數據挖掘常用的演算法。書中分析了海量數據集數據挖掘常用的演算法,介紹了目前WEB端應用的許多重要話題等。