① 數據分析師的具體工作內容是什麼
很多人對於數據分析師的工作內容不是很清楚,一般數據分析行業都是有很多職業的,不同的職業承擔著不同的職責以及工作內容,對於數據分析行業來說,不管是什麼職業,作為數據分析師,都需要懂得很多的知識,那麼數據分析師的具體工作內容是什麼呢?一般來說,數據分析師的工作內容就是數據採集、數據存儲、數據提取、數據提取、數據挖掘、數據分析,數據展現等內容。
首先給大家說一下數據提取,數據提取就是講數據取出來的過程,需要明確三個事情,就是數據去那取?數據何時取?數據如何取?從哪取?需要確定數據來源。何時取?需要注意提取時間。如何取?需要提取規則。
第二給大家數一下數據採集,一般來說數據採集的意義就是了解數據的原始面貌,數據的原始外貌就是數據產生的時間、條件、格式、內容、長度、限制條件內容。這會幫助數據分析師更有針對性的控制數據生產和採集過程,避免由於違反數據採集規則導致的數據問題。
其次說一下數據存儲,數據儲存需要懂得資料庫的知識。在數據存儲階段,數據分析師需要了解數據存儲內部的工作機制和流程,最核心的因素是在原始數據基礎上經過哪些加工處理,最後得到了怎樣的數據。數據的及時性、完整性、有效性、一致性、准確性很多時候由於軟硬體、內外部環境問題無法保證,這些都會導致後期數據應用問題。
然後說一下數據挖掘,數據挖掘就是面對海量數據時進行數據價值提煉的關鍵,數據挖掘需要演算法的配合。沒有最好的演算法,只有最適合的演算法,大家需要意識到了一個問題,沒有一種演算法能解決所有問題,但精通一門演算法可以解決很多問題。挖掘演算法最難的是演算法調優,同一種演算法在不同場景下的參數設定相同,實踐是獲得調優經驗的重要途徑。
接著說一下而數據分析相對於數據挖掘更多的是偏向業務應用和解讀,當數據挖掘演算法得出結論後,如何解釋演算法在結果、可信度、顯著程度等方面對於業務的實際意義,如何將挖掘結果反饋到業務操作過程中便於業務理解和實施是關鍵。
最後說一下數據展現是一個非常重要的階段,一般來說,數據展現即數據可視化的部分,數據分析師如何把數據觀點展示給業務的過程。數據展現的具體形式還要根據實際需求和場景而定。
對於上述的內容想必大家已經知道了數據分析的具體內容了吧,大家在了解數據分析的時候一定要多多注意這些問題,這樣才能夠更加深入的了解數據分析這個行業,數據分析的工作內容就是上面提到的數據採集、數據存儲、數據提取、數據提取、數據挖掘、數據分析,數據展現等內容,希望這篇文章能夠給大家帶來幫助。
② 未來什麼技術有前景
未來幾年行業比較有前景:
一、雲計算
企業向雲端遷移是大勢所趨。可以看到:
1)公有雲和私有雲市場增長依然齊頭並進,不是零和博弈;
2)IaaS層面:擁有多元化的商業應用生態圈越來越重要,如亞馬遜、谷歌、微軟等;
3)SaaS層面:主要集中在人力資源、OA、CRM、市場營銷、B2B 大宗商品采購等領域,如SalesForce、Sap、Oracle等;
4)PaaS層面:沒有出現獨立巨頭,未來更可能由IaaS巨頭向上或SaaS巨頭向下延伸。
國內雲計算市場還處在萌芽期,市場蛋糕正變得越來越誘人。我們預測:
1)雖然阿里、騰訊、華為等IT巨頭等紛紛進入,但中國企業級市場的復雜性使得IaaS層面依然存在機會;
2)SaaS層面:除重點關注以上幾個細分領域,還應重點分析具體的產品和服務是否符合國內客戶的實際市場需求。
二、大數據
大數據行業的融資總額2013-2015年分別為8億美金、15.4億美金及20億美金;2013-2015年融資事件分別為10起、42起及超過50起。「大數據+」已經滲透到幾乎所有行業,如以阿里巴巴為代表的「大數據+零售」、以丁香園為代表的「大數據+醫療」、以搜房網為代表的「大數據+房地產」等等。該領域我們的投資策略為:
1)對於資源型大數據公司:數據資源足夠龐大完整,數據價值足夠有想像空間,數據挖掘整合能力足夠強;
2)對於技術型大數據公司:技術門檻夠高,並足以讓公司快速形成規模效應、網路效應,從而快速佔領足夠市場份額;
3)對於應用型大數據公司:應用市場足夠大,公司成長性好且可實現性強。
三、虛擬現實
我們認為虛擬現實行業已經處在爆發前夜,從一個簡單的邏輯來看,人們已經無法滿足於2D畫面和3D影像的服務。虛擬現實其實是藉助計算機系統及感測器技術生成一個全景環境,讓用戶在這個嶄新的環境下調動起所有的感官去產生人機互動,給用戶帶來完美的沉浸感,同時用戶可以在該環境里發揮無窮的想像力去進行創造。
目前全球虛擬現實行業經過近百年的發展仍處於早期起步階段,供應鏈及各類配套設施還在摸索。然而虛擬現實的發展前景引人想像,具備廣泛的應用空間,如游戲、影視、教育、體育、星際探索、醫療等等。當前各大咨詢機構均看好虛擬現實在未來5年將實現超高速增長,爆發近在咫尺。我們認為:
1)短期內,能夠布局虛擬現實產業鏈的廠商,從硬體設備、內容生產到平台分發,均具備投資價值;
2)從長遠來看,虛擬現實的內容將是行業靈魂存在,投資成熟內容產業廠商將充滿機會。
四、人工智慧
根據Tractica預測,2024年人工智慧市場規模將增長至111億美元。初步的技術積累和數據積累已經在過去有了比較顯著的規模效應,因而人工智慧重塑各行各業的大潮即將來襲,並引發新一輪IT設備投資。
未來3-5年智能化大潮將帶來萬億級市場。在人工智慧領域內,2016年我們主要關注的方向包括:
1)計算機視覺識別(以人臉識別為典型);
2)計算機自適應(以各類機器人為例);
3)各項細分底層技術領域(比如自然語言處理、機器學習和知識圖譜)。
五、3D技術
經過過去幾年3D列印的投資熱,3D列印技術步入到了一個新的階段,但應用市場仍有待突破。專家預測2016年,中國3D列印機市場規模預測將擴大到100億元;與此同時,Wohlers報告顯示2016年全球市場規模可達70億美金。如果應用市場能夠打開,到2020年該市場有可能突破一千億元甚至達到二千億元,僅以醫療行業為例,預計到2015年僅該市場規模可達19億美元。
接下來新一輪的3D技術的投資熱點,包括:
1)3D列印專用材料及其工藝技術;
2)3D建模和個性化定製設計軟體;
3)圍繞3D列印技術出現的行業模式創新企業(即3D列印與教育、醫療和工業4.0等行業的結合)。
六、無人技術
無人技術目前主要應用在無人機、無人駕駛汽車等領域。美國蒂爾集團預測全球無人機市場規模會從2015年的64億美元增至2024年的115億美元,發展態勢迅猛。無人駕駛汽車至今仍未揭面紗,但麥肯錫預測到2025年該領域將會有2000億美元到1.9萬億美元產值,屆時中國無人駕駛汽車產值空間至少也在萬億規模,潛力無限。
該領域我們已經布局工業級無人機第一品牌易瓦特,亦會長期持續關注如下標的:
1)隨著政策逐漸放開,網路、谷歌、寶馬、奧迪等巨頭加緊布局無人駕駛汽車,我們重點側重汽車電子相關硬體、車聯網相關軟體、整車等各個領域領導企業;
2)無人機領域,我們將重點挖掘部件製造與總體設計細分領域及無人機解決方案提供商中非常有潛力的優質企業。
七、機器人
中國人口老齡化問題日益突出、人工成本急劇上升以及整體經濟結構面臨轉型,機器人未來的崛起及其巨大的市場規模已經被各大機構認可。我們認為未來無論短期或是長期,機器人行業的投資機遇巨大,從工業機器人、協作機器人到服務機器人均有十分可觀的市場規模:
1)未來的工業機器人將具備強大的自我學習能力和專業化能力,向更細分的領域和結構進行創新延伸;
2)協作機器人可以與人協同工作並且廣泛應用在生活中各種領域,屬於「跨界」的產物;
3)服務機器人則沒有上限,具有遠超工業機器人和協作機器人的市場規模潛力,我們認為助老和醫用的服務型機器人將領先發展。
八、新能源
中國是最大的新能源市場,發展新能源產業是改變我國的能源結構,降低對化石能源的依賴度,同事減少環境污染的必然選擇。大力度的財政補貼推動新能源產業快速走向成熟,蘊含豐富投資機會:
1)鋰電池在中國已經形成完整的產業鏈,下游動力和儲能電池需求巨大;
2)中國新能源汽車市場在2015年實現井噴式發展,產銷量均超過30萬輛,同比增長超過300%,是全球第一大新能源汽車市場;
3)超級電容在快速充放電、高循環壽命、高功率密度方面相比較鋰電池有明顯優勢,能夠廣泛用於城市公交、軌道交通、風力發電、石油鑽探、港口機械等領域。
九、新材料
新材料是新經濟的基石,我國在軍工、高鐵、核電、航天航空等尖端製造領域的快速發展均離不開基礎材料領域的突破。隨著基礎化學、基礎材料、納米技術等方面的科研實力的不斷積累,新材料領域的創新點將不斷涌現,新材料將成為數萬億產值的市場:
1)石墨烯的柔性、力學、光學、電學和微觀量子特性與目前現有材料相比整體有明顯優勢,未來應用行業橫跨電子、生物醫療、軍工、精密製造業、化工等;
2)碳纖維是應用相對成熟的新興材料,相對於傳統材料品質好,重量輕,未來需要在降低成本、突破國外技術封鎖方面繼續努力;
3)新型膜材料,可廣泛應用於水處理、廢氣治理、鋰電池等多個領域;
4)生物基材料,用於齒科、骨科等,可取代、修復人體組織器官功能。
十、醫療服務
2016年醫療服務行業的驅動因素來自於葯品行業景氣度持續下滑,以及葯品價格形成機制的變化。分級診療和醫生多點執業的推動下,公立醫院藉助民營資本盤活存量資產創造增量價。醫療服務業務為新技術提供了商業化的出口,而新技術給醫療服務業務提供了高附加值的項目。我們投資邏輯是:
1)符合醫院利益訴求、以醫為本的商業模式,比如康復醫療、檢驗領域,以及高端醫學影像領域;
2)具有一定門檻的連鎖專科醫院如婦兒、輔助生殖、眼科、骨科、醫療美容等;
3)連鎖第三方服務如健康管理、第三方診斷等;
4)一線城市的具有核心技術和專家資源的高端醫院。
十一、生命技術與生命科學
隨著基因組學、分子生物學等基礎學科的發展,生物制劑與生命科學技術正在治療中發揮越來越重要的作用:生物制劑方面,越來越多的單抗葯物對腫瘤、糖尿病等疑難雜症產生突破性療效,「重磅炸彈」級新葯頻出。2014年全球銷量前十大葯物中,有7個為生物制劑,其中阿達木單抗位居全球銷量首位,年銷售額達110億美元;生命科學方面,全球范圍內,基因測序市場從2007年的794.1萬美元增長到2013年的45億美元,復合增長率為33.5%,預計未來幾年依舊會保持快速增長;細胞免疫療法等新興技術也日漸成為重要的治療方法。
基於以上背景,我們認為生物技術與生命科學無疑是大健康領域極為重要的投資方向,重點關注的細分領域包括:
1)先進的基因測序及數據分析公司;
2)技術驅動型生物制劑公司;
3)與基因測序解讀、個體化給葯相結合的精準醫療公司;
4)技術上取得突破的新型生物治療方式,如CAR-T細胞免疫療法等。
十二、醫療器械
醫療器械市場在國內起步較晚,但發展迅速,2001年至2014年,我國醫療器械市場規模從173億元增長至2556億元,增長了近15倍,復合增速達到23%。但從醫療器械市場規模與葯品市場規模的對比來看,全球醫療器械市場規模大致為全球葯品市場規模的40%,而我國這一比例低於15%,隨著經濟的發展以及國內老齡化程度的提高,醫療器械市場發展潛力巨大。同時,《創新醫療器械特別審批程序(試行)》等一批政策的出台,為國產創新醫療器械的快速成長奠定了堅實的基礎。重點關注的細分領域包括:
1)與機器人、人工智慧等先進技術相結合的高端醫療器械;
2)國產創新型醫療器械;
3)智能家用醫療器械;
4)現有成熟醫療器械的進口替代產品。
十三、互聯網醫療
信息技術的高速發展引發各個行業的巨大變革,也為醫療行業帶來巨大機遇。隨著大數據、雲計算、物聯網等多領域技術與互聯網的跨界融合,新技術與新商業模式快速滲透到醫療各個細分領域,從預防、診斷、治療、購葯都將全面開啟一個智能化時代。同時,中國醫療行業特有的資源配置不合理、服務質量低、醫患關系緊張等問題,都有賴於憑借互聯網技術加以改善。
同時也應看到,互聯網醫療在國內仍然處於起步階段,對傳統醫療的改革必然是漫長而艱巨的過程,因此我們認為對該領域的投資應保持樂觀但謹慎的態度。重點關注的細分領域包括:
1)醫葯類電商平台;
2)醫療大數據分析公司;
3)慢病管理/健康管理在線平台;
4)智能及可穿戴式醫療設備。
十四、健康養老
健康養老產業受需求迫切和政策鼓勵雙向驅動,將迎來十分確定的發展機會。未來我國政府和個人將面對很大的養老壓力,截止2014年65歲及以上老年人口達1.4億,占總人口比重10.1%,到2020年老年人口將增至2.6億。同時,養老作為"健康中國"的一部分已被提升到國家戰略性高度。我們將沿著國家提出的建設以居家為基礎、社區為依託、機構為補充的多層次養老服務體系挖掘投資機會:
1)涉足養老核心產業---康復醫療,並已具備可行性和連鎖化潛力發展模式的企業;
2)積極探索創新養老模式的企業。
十五、體育
在過去的一年,中國各路巨頭開始瞄準海外優質體育標的資產(尤其是賽事轉播權和體育運營公司),漸漸向成熟體育盈利模式靠攏– 門票、媒體轉播權、贊助和體育衍生品,如樂視購得香港英超和MLB三個賽季轉播獨家權益;萬達購得盈方體育傳媒和世界鐵人三項公司(WTC)成為萬達體育;阿里體育獲得 NFL 在中國大陸地區的轉播權等等。因此,擁有優質賽事資源和廣大受眾的體育行業標的將會持續收到資本的追捧。
信中利作為中國最早最廣布局體育行業的投資機構,會繼續關注如下領域:
1)體育各個細分領域擁有優質體育賽事IP的運營公司;
2)沖擊傳統體育的電競行業,包括內容方和直播平台;
3)體育運動相關的智能硬體+數據分析軟體+可以導流到健康醫療領域的創業公司;
4)聚焦大眾健身的互聯網健身上下游公司。
十六、娛樂
中國的2015年是投資圈和BAT們在文化娛樂領域進擊的一年。消費升級使得國人的消費習慣逐漸向文化娛樂進行傾斜,消費人群和消費金額也越來越低齡化和增長化。2015年也是獨立IP火熱的一年,花千骨、琅琊榜、盜墓筆記等一大波影視劇熱播,夏洛特煩惱、捉妖記、「囧」系列、鬼吹燈等不斷刷新國內電影票房記錄。此外,伴隨游戲、動漫衍生而來的二次元文化興起,生產數字化、碎片化、娛樂化內容的自媒體大爆發,都將聚集大量新一代年輕用戶,引發新的商業模式和機會。我們將關注以下細分領域:
1)擁有優質IP內容(生產或購買)和強大IP運營能力的公司;
2)有海量用戶及盈利能力的自媒體和新媒體;
3)文化娛樂行業的大數據分析公司;
4)二次元內容聚合社區;
5)泛娛樂直播平台等。
十七、教育
國內的民辦教育市場規模超過6000億元,而在線教育五分之一的市場份額吸引了無數資本和創業者競折腰。經過過去一兩年的洗禮,教育O2O(Online to Offline)舉步維艱,不僅沒有革了傳統教育的命,還在盈利模式的探索上不知所措。而傳統線下教育培訓機構除了擁有穩定的線下資源和師資以外,也在互聯網+ 的攻勢下順應時代發展做出了很多改革。此外,新一輪的高考改革也將帶來新的商業模式和創業機會。教育行業對於投資機構來說仍是一座金礦,但隨著我們會重點關注如下領域:
1)順應高考改革而生的素質教育和應試教育的優質線下培訓機構;
2)職業教育培訓機構與職業經驗分享平台;
3)(性價比高的)可以幫助學生提升課堂體驗的虛擬現實技術公司(硬體+軟體+內容);
4)專注在兒童教育領域的優質IP內容生產者。
③ 學大數據需要什麼基礎知識和能力
1.計算機基本理論知識
了解計算機的基本原理,計算機的發展歷史等計算機的基本常識和理論。
示例說明
總結:以上條件並不是一定要達到很高的標准,只要基本都熟悉,都有印象,能夠簡單運用即可。
④ 未來五年最吃香的6個專業有哪些
今天我們就來盤點一下未來五年最熱門的六大大學專業,讓你就業更快!據悉,目前中國人工智慧相關人才需求高達500萬,這意味著人工智慧相關工作崗位需求處於供大於求的狀態。人工智慧專業的畢業生一出來就是搶手的香餑餑,也是高薪從業者。人工智慧是朝陽產業,未來五年社會需求將持續增加。另外,我們的生活和工作越來越離不開人工智慧,人工智慧也給我們的生活和工作帶來了便利,生活的方方面面都在慢慢向智能化發展。機械專業近年來,機械專業一直是高校最熱門的專業之一,尤其是機械設計、製造及其自動化專業。機械每年的就業率都在90%以上,一直居高不下。未來五年對該專業人才的需求只會越來越大。業內專家表示,隨著近年來大型產業的逐漸復甦,研發、設計、工藝、組裝等高級製造業人才短缺。所以這個專業畢業的學生一般不會面臨失業的危險。專業互聯網正處於快速發展階段。無論是軟體開發還是網站建設,對計算機專業人才的需求都很大,工資也在不斷增加。該專業技術性強,畢業後就業率高。找一份待遇好的工作一般不難,而且很多企業的高管都是計算機專業出身,事業單位或者公務員對計算機專業的需求比較大。車輛工程隨著人們生活水平的提高,對汽車的需求不斷增加,以安全、節能、環保三大主題的汽車技術的興起帶動了整個汽車行業的發展,產品設計開發、製造、試驗檢測、應用研究、技術服務、運營銷售、管理等與車輛工程相關的崗位需求,,也在不斷增加,尤其是對實踐能力強、創新精神強的高級專業人才。遙感科學與技術專業未來五年,除了地質勘探、環境調查等國家的一些院校和研究機構外,一些互聯網公司也有同樣的需求,而且需求也呈增加趨勢。目前人才缺口已經很大了。在職業經濟飛速發展的今天,金融專業的人才不可或缺。金融專業的畢業生可以走很多崗位,比如企業中的財務分析師、財務顧問、經濟預測分析、管理顧問、外貿人等相關崗位,甚至可以在政府和事業單位、中外資銀行、保險、信託等工作。除了就業方向多,就業收入也高。
僅代表個人觀點:大數據專業,未來是人工智慧時代,所以大數據專業肯定會有很大需求;能源和化石能源告急,未來新能源資源的轉化不可避免,這方面的人才需求會很大。航天,進入太空,航天工業的發展也成為一種趨勢。其實還涉及到物理、化學等基礎科學。計算機和計算機編程已經成為基礎學科,各行各業都離不開編程語言。醫學,老齡化加速,慢性病和各種傳染病逐漸增多,醫療水平是人類的發展趨勢;心理學,人類文明發展到現在,很多人心裡也有很多問題,所以心理健康被納入了健康的新標准。
未來五年可能最熱門的專業一定是國家戰略相關的。比如對於理科生,大家可以關注《中國製造2025》。與該戰略相關的專業主要有信息技術專業、新能源、新材料、互聯網政策相關的計算機專業、軟體工程、電子科學與技術、物聯網工程等。對於文科生來說,要關注與一帶一路相關的專業,比如我們的對外交流文化和貿易相關的專業,這樣在填報的時候可以多關注一些。1.電氣工程及其自動化專業(本科5000左右)應用廣泛,從家庭到社會都有。社會需求很大,這個專業就業率95.5%,可以說很吃香。況且該專業就業領域與國家電力系統接軌,工作穩定性和福利待遇都不錯。TOP 2:人工智慧(本科畢業生6000人左右)隨著國內市場的產業升級,人工智慧相關專業日漸熱門,人才供給嚴重不足,導致就業市場供不應求。前段時間各大互聯網公司在北大清華招聘相關專業的大學生,年薪30萬。這足以說明智能R&D工程專業未來幾年前景非常好,更不用說工資了。但這也是一個非常具有挑戰性的課題。因為學生必須學習一些計算機知識和心理學、哲學,對這方面感興趣的同學可以考慮。TOP 3:新能源(本科學歷6000左右)隨著環境的惡化,新能源開始得到極大的關注,未來發展新能源的行業特別受歡迎,尤其是汽車行業。再加上國家財政對節能減排的支持,促進了新能源產業的加速發展,成為新一輪汽車推廣的亮點,未來就業前景不錯!TOP 4:大數據(本科畢業生約7000人)大數據應用廣泛,覆蓋99%的行業。至少在幾十年內有很好的發展前景,人才緊缺。這不僅僅是一個職位。在積累經驗的過程中,可以從事數據挖掘專家、資深行業分析師等。,就業前景好,薪資可觀。TOP 5:醫學(剛畢業研究生一萬左右)很多人都知道學醫很累,但是學醫很有前途。人們越來越重視健康和保健,醫療行業發展迅速。尤其是臨床醫學的就業前景還是很可觀的,因為中國的醫生數量相對於中國的大眾來說是不夠的,而且隨著現在很多醫院的擴張,臨床上還是需要很多醫生的。Top:軟體工程專業(本科剛
選大學其實就是選專業,幫你分析專業問題..教師。教育部近日發布的首份中國教育與人力資源報告《從人口大國到人力資源強國》指出,中國仍屬於教育欠發達國家之列。高中階段毛入學率不足43%,高等教育入學率僅為13%,教師短缺是教育發展的主要瓶頸之一。根據「十五」計劃的發展要求,高中階段教育毛入學率要達到60%。按照18:1的生師比,教師缺口將達到116萬,按照15:1的師生比,教師缺口也將達到11萬。簡而言之,中國有120多萬高中和高等教育教師。2.軟體人才。全球IT行業的低迷影響了一系列相關行業,但也有一些例外——IT培訓市場表現出了強大的生命力。中國作為IT領域潛力巨大的市場,對IT專業人才的需求更加迫切。資料顯示,目前我國軟體人才缺口每年在35萬人以上,而如果用傳統的教育模式培養這些人才,不僅難以填補數量上的缺口,也遠遠不能滿足我國軟體產業發展對人才結構的要求。3.醫學人才緊缺。北京市人才服務中心提供的數據顯示,由於北京郊區縣醫療服務的發展,醫療人才市場的需求和供給都在蓬勃發展。根據1月12日舉行的醫療人才招聘會,醫療用人單位提供3765個崗位,其中需要臨床醫學和生物制劑專業人才1780人。但北京600多名醫學畢業生明顯供不應求。4.速記天賦。隨著北京成為國際化大都市,會展經濟空前發展,對速記人才的需求越來越大。據北京速記協會培訓中心唐老師介紹,這個協會培養的學員都不是失業人員,北京市幾個有資質的機構培養的速記人才,比如北京政法管理幹部學院,也很受歡迎。速記市場肯定會吸引越來越多的大學生。5.特色突出、「崗位匹配」的高校畢業生,如航運專業、高級護理專業、高級技術技能專業的畢業生也供不應求。6.隨著北京申奧成功,市政和社區管理維護相關專業人員將有更好的就業空間。祝你法律和會計好運!!
一、人工智慧:據悉,到2020年,中國人工智慧產業規模將超過1500億元。目前我國人工智慧人才缺口超過500萬,供需比為1:10。在未來很長一段時間內,人工智慧專業的人才將是企業爭奪的重要資源,加上國家政策的大力支持,前景十分廣闊。2.大數據專業:據悉國內數據分析人才供給指數最低,高度稀缺;未來3-5年,大數據人才缺口估計高達150萬。可以說就業前景一片光明。3.信息安全專業:在當今信息時代,無論是我們的個人隱私,還是企業或國家的隱私,可以說信息安全已經上升到國家戰略層面。社會對信息安全專業人才需求巨大,人才缺口巨大,就業前景非常好。4.經濟學專業:經濟學一直是高校的熱門專業。很多人可能會覺得以前太熱門的專業現在已經不吃香了,但其實金融行業在未來會是一個黃金發展期。即使是國家機關招錄公務員的時候,經濟學專業的畢業生能夠報考的職位數量也一直名列前茅。5.控制科學與工程專業:這個專業本科階段叫自動化,研究生階段叫控制科學與工程。近年來,由於自動化和各種新技術的發展,該專業對人才的需求非常大,就業范圍廣,就業前景好。6.漢語言文字與新聞媒體傳播專業:現在各行各業的公司大多都有新媒體運營崗位。初期主要負責新媒體矩陣(微信官方賬號、微博、百家號等媒體)文章的選題、撰寫和推送,後期負責整個新媒體矩陣的設計和策劃,包括文案策劃、活動策劃、數據監測分析等。未來最熱門的專業
⑤ BAT三巨頭開始挖掘大數據
BAT三巨頭開始挖掘大數據
阿里巴巴CTO即阿里雲負責人王堅博士說過一句話:雲計算和大數據,你們都理解錯了。
實際上,對於大數據究竟是什麼業界並無共識。大數據並不是什麼新鮮事物。信息革命帶來的除了信息的更高效地生產、流通和消費外,還帶來數據的爆炸式增長。「引爆點」到來之後,人們發現原有的零散的對數據的利用造成了巨大的浪費。移動互聯網浪潮下,數據產生速度前所未有地加快。人類達成共識開始系統性地對數據進行挖掘。這是大數據的初心。數據積累的同時,數據挖掘需要的計算理論、實時的數據收集和流通通道、數據挖掘過程需要使用的軟硬體環境都在成熟。
概念、模式、理論很重要,但在最具實干精神的互聯網領域,行動才是最好的答案。國內互聯網三巨頭BAT坐擁數據金礦,已陸續踏上了大數據掘金之路。
BAT都是大礦主,但礦山性質不同
數據如同蘊藏能量的煤礦。煤炭按照性質有焦煤、無煙煤、肥煤、貧煤等分類,而露天煤礦、深山煤礦的挖掘成本又不一樣。與此類似,大數據並不在「大」,而在於「有用」。價值含量、挖掘成本比數量更為重要。
網路擁有兩種類型的大數據:用戶搜索表徵的需求數據;爬蟲和阿拉丁獲取的公共web數據。
阿里巴巴擁有交易數據和信用數據。這兩種數據更容易變現,挖掘出商業價值。除此之外阿里巴巴還通過投資等方式掌握了部分社交數據、移動數據。如微博和高德。
騰訊擁有用戶關系數據和基於此產生的社交數據。這些數據可以分析人們的生活和行為,從裡面挖掘出政治、社會、文化、商業、健康等領域的信息,甚至預測未來。
下面,就將三家公司的情況一一掃描與分析。
一、網路:含著數據出生且擁有挖掘技術,研究和實用結合
搜索巨頭網路圍繞數據而生。它對網頁數據的爬取、網頁內容的組織和解析,通過語義分析對搜索需求的精準理解進而從海量數據中找准結果,以及精準的搜索引擎關鍵字廣告,實質上就是一個數據的獲取、組織、分析和挖掘的過程。
除了網頁外,網路還通過阿拉丁計劃吸收第三方數據,通過業務手段與葯監局等部門合作拿到封閉的數據。但是,盡管網路擁有核心技術和數據礦山,卻還沒有發揮出最大潛力。網路指數、網路統計等產品算是對數據挖掘的一些初級應用,與Google相比,網路在社交數據、實時數據的收集和由數據流通到數據挖掘轉換上有很大潛力,還有很多事情要做。
2月底在北京出差時,寫了一篇《搜索引擎的大數據時代》發在虎嗅。創造了零回復的記錄。盡管如此,仍然沒有打消我對搜索引擎在大數據時代深層次變革的思考。 搜索引擎在大數據時代面臨的挑戰有:更多的暗網數據;更多的WEB化但是沒有結構化的數據;更多的WEB化、結構化但是封閉的數據。這幾個挑戰使得數據正在遠離傳統搜索引擎。不過,搜索引擎在大數據上畢竟具備技術沉澱以及優勢。
接下來,網路會向企業提供更多的數據和數據服務。前期網路與寶潔、平安等公司合作,為其提供消費者行為分析和挖掘服務,通過數據結論指導企業推出產品,是一種典型的基於大數據的C2B模式。與此類似的還有Netflix的《紙牌屋》美劇,該劇的男主角凱文·史派西和導演大衛·芬奇都是通過對網路數據挖掘之後,根據受歡迎情況選中的。
網路還會利用大數據完成移動互聯網進化。核心攻關技術便是深度學習。基於大數據的機器學習將改善多媒體搜索效果和智能搜索,如語音搜索、視覺搜索和自然語言搜索。這將催生移動互聯網的革命性產品的出現。盡管網路已經出發,其在大數據上可做的事情還有很多。
在數據收集方面,網路需要聚合更多高價值的交易、社交和實時數據。例如加強自己貼吧知道的社交能力、盡快讓地圖服務與O2O結合進而掌握交易數據,以及推進移動App、穿戴式設備等數據收集系統。
在數據處理技術上,網路成立深度學習研究院加強自己在人工智慧領域的探索,在多媒體和中文自然語言處理領域已經有一些進展;雲存儲、雲計算的基礎設施建設也在逐步完善。但深度學習仍然是一個巨大的挑戰,網路等探索者還有很多待解問題,如:無監督式學習、立體圖像識別。
在數據變現方面,網路需將數據挖掘能力、數據內容聚合和提取等形成標准化的服務和產品,進而開拓大數據領域的企業和開發者市場。而不僅僅是頗為個性化、定製化地為大型企業提供解決。
網路的優勢體現在海量的數據、沉澱十多年的用戶行為數據、自然語言處理能力和深度學習領域的前沿研究。在技術人才方面網路是聚集國內最多大數據相關領域頂尖人才的公司。聽說網路前段時間花五千萬挖了數據挖掘、自然語言處理、深度學習領域的十來位大牛,包括一些學者和教授。例如Facebook科學家徐偉。
在挖人上,捨得花錢不夠,還得用心。對於真正的大牛來說,錢只是一個影響因素。能否實現自己的夢想,公司的資源能否幫助自己的研究至關重要。徐偉在回國前就曾問過其他從矽谷回國工程師的意見,得到答案是積極的,最終促成他作出決定。
總體來看,網路擁有大數據也具備大數據挖掘的能力,並且正在進行積極地准備和探索。在加強面向未來的研究和人才布局的同時,也注重實用性的技術產出。
二、騰訊:數據為產品所用,自產自銷
微創新提出者金錯刀有個關於騰訊的故事。 1999年騰訊公司剛剛成立不久,天使投資人劉曉松決定向其注資的一個主要原因就是因為他發現,「當時雖然他們的公司還很小,但已經有用戶運營的理念,後台對於用戶的每一個動作都有記錄和分析。」而另一個投資人卻因為馬化騰在公司很小時就花錢在數據上表示不滿。此後騰訊的產品生產及運營、騰訊游戲的崛起都離不開對數據的重視。
騰訊擁有社交大數據,在企鵝帝國完成數據的製造、流通、消費和挖掘。 騰訊大數據目前釋放價值更多是改進產品。據騰訊Q1財報,增值服務占總收入的78.7%;電子商務業務佔14.1%;網路廣告收入佔6.3%。從廣告收入比例可以看出騰訊的大數據在精準營銷領域暫時還未大量釋放出價值。與其產品線對應的GMAIL、Google+的Google以及社交巨頭Facebook則通過廣告賺得盆滿缽滿。
在筆者看來,騰訊的思路主要是補齊產品,注重QZONE、微信、電商等產品的後端數據打通。例如最近騰訊微博利用「大數據技術」實現好友關系自動分組、低質量信息自動過濾、優質信息分類閱讀等智能化功能。明顯的用數據改進產品的思路。 那麼如果騰訊要深入大數據挖掘缺少什麼呢?筆者認為其只需馬化騰「摁下啟動按鈕」。數據已經准備好了,就差模式,也就是找到需求或者能更深層次驅動大數據利用的產品,而不是用大數據改進自己的產品。騰訊還在觀望,等其他人去試錯驗證出一套模式或者產品後,自己可以「站在巨人肩上」。這是騰訊的典型思維。
在人才方面,騰訊很早便開始重金挖人。尤其是2010年在Google宣布退出中國後,Google圖片搜索創始人朱會燦、Google中國工程研究院副院長顏偉鵬、Google中日韓文搜索演算法的主要設計者,《浪潮之巔》及《數學之美》作者吳軍相繼加入騰訊。搜搜花了很多錢,但被認定為一款無法承載騰訊重託的產品,最後這些大牛都走了。大都回Google了。
騰訊在大數據領域也缺少技術帶頭人。其對公關也不重視。技術大牛很少出來做報告,更不會向網路、阿里那樣主動包裝宣傳技術大牛。其技術雖然低調,但執行力很強。據騰訊的程序員朋友說封閉開發、集體加班是常有的事情。但配套的重金激勵也能跟上。重金之下必有勇夫、騰訊用制度保障技術產出。另外騰訊在高校合作領先一步,在2010年便與清華大學合作成立了清華騰訊聯合實驗室。這么看騰訊的技術人才這塊似乎有短板。會不會到時候馬化騰按下啟動按鈕,發現沒數據挖掘能力呢?不會,騰訊搞不定數據挖掘,到時候依然可以挖到大牛,甚至讀論文來搞定這事兒。數據挖掘已較為成熟。數據挖掘實際是資料庫、統計學、機器學習三個領域的融合。在學術界已經發展多年。不過自然語言識別和深度學習等方面要趕上網路,就難了。除非將網路的數據和眾大牛一起倒騰過來。
總體來看,騰訊目前的大數據策略是先將產品補全,產品後台數據打通,形成穩定生態圈。本階段先利用大數據挖掘改進自己的產品。後期有成熟的模式合適的產品,則利用自家的社交及關系數據時,開展對大數據的進一步挖掘。
三、阿里巴巴:坐擁金數據,嘗試做面向未來的數據集市
阿里巴巴B2B出身,在外貿蓬勃的大環境下,依靠服務中小企業發家。淘寶、支付寶等toC的產品出生前,阿里並不依賴也不擅長技術。業界普遍認為阿里沒有技術基因。直到淘寶、支付寶以及天貓三個產品後,對海量用戶大並發量交易、海量貨架數據的管理、安全性等方面的嚴苛要求,阿里完成進化,在電商技術上取得不菲的成績。在一段時期阿里仍然浪費了手裡掌握的大量數據。這些數據還是「最值錢」的金數據。
數據挖掘無非是從原始數據提取價值。阿里現有的數據產品例如數據魔方、量詞統計、推薦系統、排行榜以及時光倒流相對來說是比較簡單的BI(商業智能),沒到大數據的階段。「大數據」浪潮襲來,阿里提出「數據、金融和平台」戰略。前所未有地重視起對數據的收集、挖掘和共享。馬雲在「退居」前動不動都對外提「數據」。有位阿里朋友甚至開玩笑說,馬雲英文名可以從Jack Ma改為Data Ma。阿里現CEO陸兆禧曾做過CDO,首席數據官。為了用數據來驅動阿里電商帝國,阿里還成立了橫跨各大事業部的「數據委員會」。
阿里的各項投資案也顯示其整合、利用和完善數據的野心:新浪微博的社交及媒體數據、高德的地圖數據和線下數據以及友盟的移動應用數據,都是其數據及平台戰略的一部分。數據戰略正在首席人工智慧官(CBO)車品覺領頭下逐步落地,王堅的雲為其提供基礎設施、基礎技術支撐。
就在馬雲退休之後,王堅對外透露其跟馬雲開玩笑說的一句話:阿里巴巴對數據的理解深度,不會超過蘇寧對電子商務的理解。估計馬雲不一定認同他這話。馬雲對大數據已經有著自己的理解和考量。馬雲曾經說過其對大數據的思考。大致意思是:現在從信息時代進入數據時代了。區別是信息時代更多的是精英玩的游戲。我比別人聰明,我能提取出信息出來;數據時代,別人比我聰明,將數據開放給更聰明的人處理,數據即資產,分析即服務。
計算機發展的過程是從象牙塔、到平民到草根。大數據也是這樣,一開始在象牙塔階段,少數精英公司才能玩;但到後面只要有數據就有價值。數據也有所有權,產生數據、流通數據、挖掘數據的都會獲得相應的價值。而阿里擅長的便是「建立市場」,建立一個數據交易市場。屆時任何個人和企業都可以將數據和挖掘服務拿上去,交易。初期阿里會將自己珍藏的電商和信用數據逐步放到上面。 有數據的人,拿上去賣,或者讓別人分析,分析即服務。沒有數據的人,即可以去買,也可以去幫別人挖掘,做礦工。
阿里並不是技術驅動,而是業務驅動的。因此在技術層面我們看到,基於前面提到的阿里大數據思路,其技術重心主要在系統層面。阿里擁有LVS(Linux Virtual Server,Linux虛擬伺服器)開源軟體創始人章文嵩,Linux Kernal、文件系統、大牛DBA等領域的大牛。從人才布局可以看到阿里擅長的技術領域,體現在對於並發訪問、電信級別的電商業務的支撐方面的得心應手。在去年雙十一期間,支撐了單日過億的訂單量。鐵道部奇葩網12306在日均40萬時已經不行了。
總體來看,阿里更多是在搭建數據的流通、收集和分享的底層架構。自己並不擅長似乎也不會著重來做數據挖掘的活兒。而是將自己擅長的「交易」生意擴展到數據。讓天下沒有難做的「數據生意」。
總結一下
移動互聯網浪潮下,現實世界正在加速數字化,每個人,每個物體、每件事情、每一個時間節點,都在向網上映射。空間和時間兩個維度的聯網,使得數字世界正在接近一步步模擬現實世界。歷史、現在和未來都會映射到網上。對大數據的挖掘正是對世界的二次發現和感知。BAT三巨頭已經出發。