㈠ 做數據分析不得不看的書有哪些
一、數據分析入門:
《Head First Data Analysis》鏈接:深入淺出數據分析、最優化方法、假設檢驗方法、貝葉斯統計方法、主觀概率法、啟發法、直方圖法、回歸法、誤差處理、相關資料庫、數據整理技巧一一講到。圖比較多,適合入門。
《Head First Statistics》
推薦理由同上,適合入門者的經典教材。
《R in Action-Data Analysis and Graphics with R》鏈接:
R是屬於GNU系統的一個自由、免費、源代碼開放的軟體,用於統計計算和統計制圖。這本書從實用的統計研究角度逐例分析R在數據處理、模型構建、以及圖形操作上的由淺入深的結合,堪稱經典。
《數據之魅-基於開源工具的數據分析》鏈接:數據之魅
作者是華盛頓大學理論物理學博士。這本書是數據分析的經典之一,包含大量的R語言模擬過程及結果展示,例舉了很多數據分析實例和代碼。
《數據挖掘-市場營銷、銷售與客戶關系管理領域應用》鏈接:數據挖掘技術
作者是Data Miners的創辦人,有二十多年的營銷和客戶關系管理結合數據挖掘的經驗。詳細介紹了作為一個數據挖掘團隊需要的知識體系,包括資料庫、SAS使用、統計學、機器學習、數據可視化、如何訪問用戶收集需求、如何寫論文與溝通等等。有條件的建議看英文原版。
《Data Analytics for Beginners: Basic Guide to Master Data Analytics》
入門五星推薦。裡面很多圖表實例,手把手教你如何EXCEL畫圖,對各種知識點(平均值,模式,中值,方差,標准偏差)的講解相當的到位,比起大學里的各種課本靠譜。
先把這些花時間啃啃,數據分析的理論部分就基本入門了,根據實際情況還需要結合你的業務需求來進行系統的學習。
二、數據分析進階:
《Doing Data Scienc》
作者Cathy O』Neil是哈佛大學的博士,MIT的數據博士後,曾今作為一名Quant在對沖基金D.E. Shaw 工作,目前是一家紐約初創公司的Data scientist 。這本書需要有一定的編程和理論基礎,作為入門教材來說有點難,雖然只有400來頁,但是涉及的知識點很全面。每一章節的核心內容都附有編程案例,R/Python/Shell三種語言任君挑選。
《Python for Data Analysis》
Python數據分析必看,適合入行不久的數據分析師。作者有多年的Python數據分析工作經驗,對各種Pyhon包iPython,NumPy,pandas,matpotlib等有著很深的理解。看完這本,敲完代碼,Python數據分析就算入行了。
《Data Science for Business》
很多牛人為之作序,數據科學如何與商業結合,相信這本書會給你一些啟發。
《Python Data Science Handbook》
2016年6月出版的,500頁保質保量,作者(Jake VanderPlas)是華盛頓大學電子科學研究所的高級數據科學研究員,研究領域包括天文統計學、機器學習和可擴展計算。書的前半部分介紹了用於數據分析和一般的科學計算的基本Python庫,後面從實際應用的角度使用Python庫scikit-learn開始機器學習實踐。適合有一定Python基礎人(或者R基礎),並且想學習如何使用Python進行數據分析的人。
《Storytelling with Data》
作者Cole NussbaumerKnaflic,私募分析師,前Google人力分析團隊總監。本書展示了如何高效率展示量化資訊,如何用豐富的資料講故事。Google內部的數據可視化課程講師,之前也在Maryland Institute College of Art兼職講師。如果你想知道如何以圖敘事,這邊好書不容錯過。
㈡ 書的英語單詞怎麼寫
book
英[bʊk];美[bʊk]
n.書;本子;v.預訂;記錄在案
1、book是可數名詞,基本意思是「書,書籍」,還可指「(大型著作的)卷,篇,部」,歌劇中的「歌詞,腳本」,當表示「賬冊」時,用thebooks。
2、abook泛指各種書中的一本;如果指許多相同書中的一本,則應說a ofbook。
book, pamphlet, volume這三個詞的共同意思是「書」,其區別是:
一、book是「書」的通稱;volume是一套書中的「卷」或「冊」,有時也指較大的書。例如:
1、A novel in four volumes:一部4卷本的小說;
2、a volume of his poetry:他的一本詩集;
二、pamphlet指「小書」「小冊子」,但並不見得不重要。例如:
scholarly monographs published as pamphlet:以小冊子形式出版的學術專著。
㈢ 手冊英文怎麼讀
手冊的英文:manual、handbook。
1、manual
英文發音:['mænjʊ(ə)l]
中文釋義:
adj. 手工的;體力的
n. 手冊,指南
例句:
There is a manual pump to get rid of the water.
有一台手動水泵用來排水。
2、handbook
英文發音:['hæn(d)bʊk]
中文釋義:
n. 手冊;指南
例句:
When you have finished this one, I suggest you read the College Handbook.
當你已經看完這本後,我建議你再讀大學寫作手冊。
(3)數據分析handbook怎麼寫擴展閱讀
manual和handbook的區別:
1、具體含義不同
manual一般指的是產品的使用說明書,handbook泛指一切手冊或指南,使用較為廣泛。
2、詞性不同
manual可以作為名詞,也可以作為形容詞表示手工的、體力的意思,handbook只能作為名詞表達手冊。
例句:
The device is manually operated, using a simple handle.
這個裝置利用一個簡單的手柄,可以用手操作。
The handbook covers the BSC equipment configurations.
此手冊也闡述了BSC的設備配置。
㈣ 數據科學 怎樣進行大數據的入門級學習
數據科學 怎樣進行大數據的入門級學習?
數據科學並沒有一個獨立的學科體系,統計學,機器學習,數據挖掘,資料庫,分布式計算,雲計算,信息可視化等技術或方法來對付數據。
但從狹義上來看,我認為數據科學就是解決三個問題:
1. data pre-processing;(數據預處理)
2. data interpretation;(數據解讀)
3.data modeling and analysis.(數據建模與分析)
這也就是我們做數據工作的三個大步驟:
1、原始數據要經過一連串收集、提取、清洗、整理等等的預處理過程,才能形成高質量的數據;
2、我們想看看數據「長什麼樣」,有什麼特點和規律;
3、按照自己的需要,比如要對數據貼標簽分類,或者預測,或者想要從大量復雜的數據中提取有價值的且不易發現的信息,都要對數據建模,得到output。
這三個步驟未必嚴謹,每個大步驟下面可能依問題的不同也會有不同的小步驟,但按我這幾年的經驗來看,按照這個大思路走,數據一般不會做跑偏。
這樣看來,數據科學其實就是門復合型的技術,既然是技術就從編程語言談起吧,為了簡練,只說說R和Python。但既然是薦數據科學方面的書,我這里就不提R/Python編程基礎之類的書了,直接上跟數據科學相關的。
R programming
如果只是想初步了解一下R語言已經R在數據分析方面的應用,那不妨就看看這兩本:
R in action:我的R語言大數據101。其實對於一個沒有任何編程基礎的人來說,一開始就學這本書,學習曲線可能會比較陡峭。但如果配合上一些輔助材料,如官方發布的R basics(http://cran.r-project.org/doc/contrib/usingR.pdf),stackoverflow上有tag-R的問題集(Newest 『r』 Questions),遇到復雜的問題可在上面搜索,總會找到解決方案的。這樣一來,用這本書拿來入門學習也問題不大。而且這本書作者寫得也比較輕松,緊貼實戰。
Data analysis and graphics using R:使用R語言做數據分析的入門書。這本書的特點也是緊貼實戰,沒有過多地講解統計學理論,所以喜歡通過情境應用來學習的人應該會喜歡這本入門書。而且這本書可讀性比較強,也就是說哪怕你手頭沒電腦寫不了代碼,有事沒事拿出這本書翻一翻,也能讀得進去。
但如果你先用R來從事實實在在的數據工作,那麼上面兩本恐怕不夠,還需要這些:
Modern applied statistics with S:這本書里統計學的理論就講得比較多了,好處就是你可以用一本書既復習了統計學,又學了R語言。(S/Splus和R的關系就類似於Unix和Linux,所以用S教程學習R,一點問題都沒有)
Data manipulation with R:這本書實務性很強,它教給你怎麼從不同格式的原始數據文件里讀取、清洗、轉換、整合成高質量的數據。當然和任何一本注重實戰的書一樣,本書也有豐富的真實數據或模擬數據供你練習。對於真正從事數據處理工作的人來說,這本書的內容非常重要,因為對於任何研究,一項熟練的數據預處理技能可以幫你節省大量的時間和精力。否則,你的研究總是要等待你的數據。
R Graphics Cookbook:想用R做可視化,就用這本書吧。150多個recipes,足以幫你應付絕大多數類型的數據。以我現在極業余的可視化操作水平來看,R是最容易做出最漂亮的圖表的工具了。
An introction to statistical learning with application in R:這本書算是著名的the element of statistical learning的姊妹篇,後者更注重統計(機器)學習的模型和演算法,而前者所涉及的模型和演算法原沒有後者全面或深入,但卻是用R來學習和應用機器學習的很好的入口。
A handbook of statistical analysis using R:這本書內容同樣非常扎實,很多統計學的學生就是用這本書來學慣用R來進行統計建模的。
Python
Think Python,Think Stats,Think Bayes:這是Allen B. Downey寫的著名的Think X series三大卷。其實是三本精緻的小冊子,如果想快速地掌握Python在統計方面的操作,好好閱讀這三本書,認真做習題,答案鏈接在書里有。這三本書學通了,就可以上手用Python進行基本的統計建模了。
Python For Data Analysis: 作者是pandas的主要開發者,也正是Pandas使Python能夠像R一樣擁有dataframe的功能,能夠處理結構比較復雜的數據。這本書其實analysis講得不多,說成數據處理應該更合適。掌握了這本書,處理各種糟心的數據就問題不大了。
Introction to Python for Econometrics, Statistics and Data Analysis:這本書第一章就告訴你要安裝Numpy, Scipy, Matplotlib, Pandas, IPython等等。然後接下來的十好幾章就是逐一介紹這幾個庫該怎麼用。很全面,但讀起來比較枯燥,可以用來當工具書。
Practical Data Analysis: 這本書挺奇葩,貌似很暢銷,但作者把內容安排得東一榔頭西一棒子,什麼都講一點,但一個都沒講透。這本書可以作為我們學習數據分析的一個索引,看到哪塊內容有意思,就順著它這個藤去摸更多的瓜。
Python Data Visualization Cookbook: 用Python做可視化的教材肯定不少,我看過的也就這一本,覺得還不錯。其實這類書差別都不會很大,咬住一本啃下來就是王道
Exploratory Data Analysis 和 Data Visualization
Exploratory Data Analysis:John Tukey寫於1977年的經典老教材,是這一領域的開山之作。如今EDA已經是統計學里的重要一支,但當時還是有很多人對他的工作不屑一顧。可他愛數據,堅信數據可以以一種出人意料的方式呈現出來。正是他的努力,讓數據可視化成為一門無比迷人的技術。但這本書不推薦閱讀了,內容略過時。要想完整地了解EDA,推薦下一本:
Exploratory Data Analysis with MATLAB:這本書雖然標題帶了個MATLAB,但實際上內容幾乎沒怎麼講MATLAB,只是每講一個方法的時候就列出對應的MATALB函數。這本書的重要之處在於,這是我讀過的講EDA最系統的一本書,除了對visualization有不輸於John Tucky的講解外,對於高維的數據集,通過怎樣的方法才能讓我們從中找到潛在的pattern,這本書也做了詳盡的講解。全書所以案例都有對應的MATALB代碼,而且還提供了GUI(圖形用戶界面)。所以這本書學起來還是相當輕松愉悅的。
Visualize This:中譯本叫「鮮活的數據」,作者是個「超級數據迷」,建立了一個叫http://flowingdata.com的網頁展示他的數據可視化作品,這本書告訴你該選擇什麼樣的可視化工具,然後告訴你怎樣visualize關系型數據、時間序列、空間數據等,最後你就可以用數據講故事了。如果你只想感受一下數據可視化是個什麼,可以直接點開下面這個鏈接感受下吧!A tour through the visualization zoo(A Tour Through the Visualization Zoo)
Machine Learning & Data Mining
這一塊就不多說了,不是因為它不重要,而是因為它太太太重要。所以這一部分就推兩本書,都是」世界名著「,都比較難讀,需要一點點地啃。這兩本書拿下,基本就算是登堂入室了。其實作為機器學習的延伸和深化,概率圖模型(PGM)和深度學習(deep learning)同樣值得研究,特別是後者現在簡直火得不得了。但PGM偏難,啃K.Daphne那本大作實在太燒腦,也沒必要,而且在數據領域的應用也不算很廣。deep learning目前工業界的步子邁得比學術界的大,各個domain的應用如火如荼,但要有公認的好教材問世則還需時日,所以PGM和deep learning這兩塊就不薦書了。
The Element of Statistical Learning:要學機器學習,如果讓我只推薦一本書,我就推薦這本巨著。Hastie、Tibshirani、Friedman這三位大牛寫書寫得太用心了,大廈建得夠高夠大,結構也非常嚴謹,而且很有前瞻性,納入了很多前沿的內容,而不僅僅是一部綜述性的教材。(圖表也做得非常漂亮,應該是用R語言的ggplot2做的。)這本書注重講解模型和演算法本身,所以需要具備比較扎實的數理基礎,啃起這本書來才不會太吃力。事實上掌握模型和演算法的原理非常重要。機器學習(統計學習)的庫現在已經非常豐富,即使你沒有完全搞懂某個模型或演算法的原理和過程,只要會用那幾個庫,機器學習也能做得下去。但你會發現你把數據代進去,效果永遠都不好。但是,當你透徹地理解了模型和演算法本身,你再調用那幾個庫的時候,心情是完全不一樣的,效果也不一樣。
Data Mining: Concepts and Techniques, by Jiawei Han and Micheline Kamber 數據挖掘的教材汗牛充棟,之所以推薦這本韓家煒爺爺的,是因為雖然他這本書的出發點是應用,但原理上的內容也一點沒有落下,內容非常完整。而且緊跟時代,更新的很快,我看過的是第二版,就已經加進去了social network analysis這種當時的前沿內容。現在已經有第三版了,我還沒看過,但應該也加入了不少新內容。其實這本書並不難讀,只是篇幅較長,啃起來比較耗時。
其實這兩本書里單拎出來一塊內容可能又是幾本書的節奏,比如bayesian方法,再拿出兩三本書來講也不為過,我個人用到的比較多,而且也確實有不少好書。但並非是所有data scientist都要用到,所以這一塊就不再細說。
還有一些印象比較深刻的書:
Big Data Glossary: 主要講解大數據處理技術及工具,內容涵蓋了NoSQL,MapRece,Storage,Servers,NLP庫與工具包,機器學習工具包,數據可視化工具包,數據清洗,序列化指南等等。總之,是一本辭典式的大數據入門指導。
Mining of Massive Datasets:這本書是斯坦福大學Web Mining的講義,裡面很多內容與韓家煒的Data Mining那本書重合,但這本書里詳細地講了MapRece的設計原理,PageRank(Google創業時期的核心排序演算法,現在也在不斷優化更新)講解得也比較詳細。
Developing Analytic Talent: 作者是個從事了十幾年數據工作的geek,技術博客寫得很有個人風格,寫的內容都比較偏門,通常只有具備相關數據處理經驗的人能體會出來,絲毫不照顧初學者的感受。比如他會談到當數據流更新太快時該怎麼辦,或者MapRece在什麼時候不好用的問題,才不管你懂不懂相關基礎原理。所以這本書不太適合初學者閱讀。這本書其實是作者的博客文章的集結,用how to become a data scientist的邏輯把他近幾年的博客文章串聯了起來。
Past, Present and Future of Statistical Science:這本書是由COPSS(統計學社主席委員會,由國際各大統計學會的帶頭人組成)在50周年出版的一本紀念冊,裡面有50位統計學家每人分別貢獻出的一兩篇文章,有的回憶了自己當年如何走上統計學這條路,有的探討了一些統計學的根本問題,有的談了談自己在從事的前沿研究,有的則給年輕一代寫下了寄語。非常有愛的一本書。
其它資料
Harvard Data Science:這是H大的Data science在線課,我沒有修過,但口碑很好。這門課需要費用8千刀左右,比起華盛頓大學的4千刀的Data science在線課雖貴一倍,但比斯坦福的14千刀要便宜將近一半(而且斯坦福的更偏計算機)。如果想自學,早有好心人分享了slides:(https://drive.google.com/folderview?id=0BxYkKyLxfsNVd0xicUVDS1dIS0k&usp=sharing)和homeworks and solutions:(https://github.com/cs109/content)
PyData:PyData是來自各個domain的用Python做數據的人每年舉行一次的聚會,期間會有各路牛人舉行一些規模不大的seminar或workshop,有好心人已經把video上傳到github,有興趣的去認領吧(DataTau/datascience-anthology-pydata · GitHub)
工具
R/Python/MATLAB(必備):如果是做數據分析和模型開發,以我的觀察來看,使用這三種工具的最多。R生來就是一個統計學家開發的軟體,所做的事也自然圍繞統計學展開。MATLAB雖然算不上是個專業的數據分析工具,但因為很多人不是專業做數據的,做數據還是為了自己的domain expertise(特別是科學計算、信號處理等),而MATLAB又是個強大無比的Domain expertise工具,所以很多人也就順帶讓MATLAB也承擔了數據處理的工作,雖然它有時候顯得效率不高。Python雖然不是做數據分析的專業軟體,但作為一個面向對象的高級動態語言,其開源的生態使Python擁有無比豐富的庫,Numpy, Scipy 實現了矩陣運算/科學計算,相當於實現了MATLAB的功能,Pandas又使Python能夠像R一樣處理dataframe,scikit-learn又實現了機器學習。
SQL(必備):雖然現在人們都說傳統的關系型資料庫如Oracle、MySQL越來越無法適應大數據的發展,但對於很多人來說,他們每天都有處理數據的需要,但可能一輩子都沒機會接觸TB級的數據。不管怎麼說,不論是用關系型還是非關系型資料庫,SQL語言是必須要掌握的技能,用什麼資料庫視具體情況而定。
MongoDB(可選):目前最受歡迎的非關系型資料庫NoSQL之一,不少人認為MongoDB完全可以取代mySQL。確實MongoDB方便易用,擴展性強,Web2.0時代的必需品。
Hadoop/Spark/Storm(可選): MapRece是當前最著名也是運用最廣泛的分布式計算框架,由Google建立。Hadoop/Spark/storm都是基於MapRece的框架建立起來的分布式計算系統,要說他們之間的區別就是,Hadoop用硬碟存儲數據,Spark用內存存儲數據,Storm只接受實時數據流而不存儲數據。一言以蔽之,如果數據是離線的,如果數據比較復雜且對處理速度要求一般,就Hadoop,如果要速度,就Spark,如果數據是在線的實時的流數據,就Storm。
OpenRefine(可選):Google開發的一個易於操作的數據清洗工具,可以實現一些基本的清洗功能。
Tableau(可選):一個可交互的數據可視化工具,操作簡單,開箱即用。而且圖表都設計得非常漂亮。專業版1999美刀,終身使用。媒體和公關方面用得比較多。
Gephi(可選):跟Tableau類似,都是那種可交互的可視化工具,不需要編程基礎,生成的圖表在美學和設計上也是花了心血的。更擅長復雜網路的可視化。
㈤ 你知道在數據分析有哪些好書值得推薦嗎
數據分析方面,我推薦《精益數據分析》,這本書里講解了創業公司該如何確定指標體系,如何用數據指導產品和運營。本書還針對電商、媒體、SaaS、雙邊市場、Ugc等,列舉了要關注的指標,並有豐富的案例。不足是整個書的內容比較散,系統性不強,但依舊是講互聯網產品數據分析方面我覺得最好的一本了。數據挖掘方面,我推薦韓家煒的《數據挖掘概念與技術》,我自己就是在工作之後,通過閱讀這本書,對數據挖掘有了系統性的認識,後來我研究用戶行為序列模式挖掘的時候,發現看的許多論文都出自他的實驗室。在兩三年前,他還去網路做過一次報告,有幸去聽了。當然,光靠看看書是遠遠不夠的,想深入數據分析,就在自己的工作中嘗試用數據指導決策,不管是項目效果的評估,運營活動的評估,都嘗試用數據來驗證。對於數據挖掘,還是找個應用場景,直接寫程序去嘗試一下個性化推薦,分類之類的演算法,這樣就不會覺得雲里霧里了。
㈥ 哪位大神能跟我說下剛買到frm的handbook和notes 可是不知道怎麼入手
同學你好,很高興為您解答!
handbook裡面,每章開頭第一頁的最下面有標注,會標明是該章節是1級還是2級的考試內容。Notes是直接按1,2級編寫的,1級是3本書,2級是4本書。
希望我的回答能幫助您解決問題,如您滿意,請採納為最佳答案喲。
再次感謝您的提問,更多財會問題歡迎提交給高頓企業知道。
高頓祝您生活愉快!
㈦ 論文的文獻梳理咋寫
一、引 言
不管是哪種學科的哪種研究,文獻綜述必不可少。文獻綜述具有承上啟下的作用,是學術研究和學術論文寫作的一個重要環節。通過文獻綜述,我們可以了解相關領域的研究現狀,在前人研究的基礎上確定自己要研究的問題,避免不必要的重復並能夠有所創新,為科學知識的積累做出自己的貢獻。雖然文獻綜述工作非常重要,但目前與方法論有關的、討論如何撰寫文獻綜述類文章的管理學著述並不多見。而且,大多數學校的方法論課程也很少談及這方面的內容。因此,我們不揣冒昧,把自己寫作管理學文獻綜述類文章的一些體會拿出來與大家探討。我們的所言大多為不成熟的淺見,難免掛一漏萬,請各位大家指正。
本文的主要讀者應該是高等院校和科研機構的管理學在讀研究生。事實上,本文的雛形就是我們為指導自己的研究生寫作文獻綜述類文章而擬定的要點和建議,其中的很多內容又來自於我們在研究生學習期間老師對我們的指導。我們希望我們的體會能夠對正在撰寫或將要撰寫文獻綜述類文章的研究生有所幫助。
本文的結構安排如下:第二節簡要描述文獻綜述的目的;第三節介紹六種查找文獻的方法;第四節是對閱讀文獻三個層次的說明;第五節探討了文獻綜述類文章的不同結構安排;第六節針對研究生提出了寫作文獻綜述類文章的五點建議。
二、文獻綜述的目的
任何研究都不是憑空產生的,而是在前人研究的基礎上從某個方面進行深化,都具有一定的傳承性。因此,文獻綜述是研究的第一步,其目的在於了解前人說過些什麼,而這實際上也決定了我們能夠說些什麼。具體地,對於要研究的問題,我們必須弄清:
1.前人是否說過。
要知道前人是否說過,關鍵是要進行充分的文獻檢索。互聯網的出現以及在線資料庫的廣泛應用為文獻檢索提供了前所未有的方便。目前,各大專院校和科研機構的圖書館都購買了非常齊全的中、英文資料庫。只要資料庫覆蓋面合理並使用得當,我們足不出戶就能查到幾乎所有所需的文獻,省卻了上世紀做研究非跑大圖書館不可的麻煩。目前,國內高校圖書館中的Jstor、Science Direct、CN KI等都是極佳的在線資料庫。如果文獻搜索結果表明自己擬做的研究別人已經做過,那麼就沒有必要做無為的重復,而應該及時調整自己的思路,改換研究角度、重點或方法。
2.前人說過什麼
。要想知道前人說過什麼,就必須解答以下幾個問題。首先是前人研究的對象或問題是什麼(what)、前人是如何(how)闡述研究問題的以及為什麼(why)這樣闡述;然後是前人觀點的異同點是什麼,這些觀點是否可以分類、如何分類,觀點之間的前後時間關系和邏輯關系是什麼。搞清楚別人是否說過、說了什麼,是我們進行學術創新的重要基礎。
3.前人是怎麼說的。
在文獻綜述時不僅要綜述觀點,還要綜述研究方法(即別人是怎麼說的)。方法的發展和進步會在很多方面改變已有的觀點。例如,產業組織理論中博弈論研究分析方法的引入就改變了SCP框架下產生的很多觀點。隨著數據獲取途徑的增多和獲取技術的改進,總的來說,針對某一研究對象所使用的研究方法會越來越多。因此,當我們發現某類文獻主要以使用某一種或某幾種研究方法為主,而對其他研究方法應用較少時,就應該考慮能否採用其他方法特別是比較新的研究方法,以便通過方法創新來實現觀點創新。
4.何人、何時、何地說過。
這組問題主要反映相關觀點演化過程的影響因素,包括觀點在不同地域、不同時間上的變化。例如,總體上看,受社會經濟發展階段性以及文化差異性的影響,不同國家、不同時期的消費者對服務質量的要求會出現較大的差異,並且在很大程度上影響消費者對服務質量的感知及滿意度。另外,了解「是誰說的」,對於我們認識相關觀點的產生和發展過程也有幫助。例如,戰略管理研究定位學派的「五力模型」是波特於1979年提出的,當我們知道波特是哈佛商學院和哈佛經濟系聯合培養的博士之後,就能更好地理解這一模型與哈佛老一代經濟學家提出的SCP框架之間的傳承關系。
實際上,如果我們能夠在文獻綜述的過程中回答好以上四個方面的問題,那麼就可以基本確定我們要做的研究或要寫的論文的創新點、主要思路和擬採用的方法。可以說,做好文獻綜述,研究工作就完成了一大半,剩下的問卷設計、實地調查、數據分析、論文寫作等工作便水到渠成。
三、如何尋找代表性文獻
文獻綜述的第一步是查找文獻,也就是搜集要綜述的素材。一種常用的方法是直接進入各種資料庫(如CNKI、Science Direct、Ebsco、Emerald),在「文章標題、關鍵詞和摘要」這一搜索項中填入搜索信息(如在中文資料庫中填入「服務質量和滿意度」或在英文資料庫中填入「service quality and satisfaction」),再執行搜索命令。然而,在國、內外各種刊物層出不窮、文章不勝其數的情況下,我們很可能搜索到多達數百篇有時甚至上千篇的相關文獻,以至於無從著手閱讀、分析。我們建議首先應該重點搜集和閱讀有代表性的文獻,特別是對相關研究產生重大影響的種子論文(seminal paper),然後再搜集和閱讀次要一些的文獻。那麼,如何查找代表性文獻呢?請教導師當然是最簡單、有效的途徑。但也有一些時候,我們擬綜述的主題並非導師擅長的研究領域,導師可能無法提供主要文獻閱讀清單。如果遇到這種情況,我們建議採用下面一些方法。
1.首先查找並閱讀發表在一流刊物上的文章。
每個學科都有自己的刊物分級和排名,要重點查閱排名靠前的刊物所刊載的文獻。例如,管理學排名靠前的英文期刊(根據不同的評價標准,具體排名可能有所不同)有Administrative Science Quarterly、Academy of Management Journal、Journal of Applied Psychology、Organizational Behavior and Human Decision Process、Strategic Management Journal、Academy of Management Review;而國內排名比較靠前的管理學期刊則包括《管理世界》、《中國軟科學》、《外國經濟與管理》、《南開管理評論》和《管理科學學報》等。
2.查找權威教科書及其提到的某領域的經典文獻。
一般來說,我們所研究的問題大多可以在教科書中找到相應的章節。若能找到權威的教科書,就可以從相應的章節中找到這些教科書作者所引用的文獻,這些文獻往往也是對於相關學科發展較為重要的文獻。若能找到最新版本的教科書,那麼效果就更好。
3.查找學術權威發表的研究成果。
與其他學科一樣,國內、外管理學各領域都有若乾重要的學術權威,如服務質量管理領域中的「PZB」(即服務質量研究領域的三位著名學者Parasuraman、Zeithaml和Berry,他們三人各自或合作發表了大量重要的原創論文)。這些重要學者的文章往往也是我們在前面提到的種子論文,開創了某一研究領域並長期影響相關領域的發展。因此,根據時間順序閱讀這些學術權威的文獻會對我們了解和分析相關領域學術研究的演化發展過程大有幫助。若能找到並認真閱讀這些學術權威親自撰寫的關於相關研究領域發展歷史的述評文章,那麼,我們就能更加清晰地了解相關領域不同學術觀點的產生和發展過程。
4.尋找名校、名師研究型課程的教學大綱(syllabus)。
國內、外著名大學的研究型課程(主要指碩士和博士研究生課程,很多以「seminar」的形式出現)中會列出每個研究領域的重要文獻,供學生閱讀和討論。當然,不同教師的取捨有所不同,文獻清單也會出現一定的差異。我們可以多參考幾個同名課程的大綱,以避免偏頗。
5.到圖書館或從資料庫中查看以「handbook」為名的論文集。
國外出版社(如在出版學術期刊和著作方面比較有名的Blackwell、John Wiley and Sons和Elsevier)經常召集業內專家編著一些綜合體現學科發展狀況的工具書性質的論文集,如《Handbook of Econometrics》、《The Blackwell Handbook of Strategic Management》、《Handbook of Instrial Organization》等。這些論文集中的論文大多以綜述本學科某個研究領域的學術進展為主要目的,作者都是相關研究領域的權威。閱讀此類手冊收入的論文可以迅速掌握相關領域最重要的學術進展狀況。
6.利用「Google Scholar」。
目前,互聯網在學術研究中發揮著越來越大的作用,為我們提供了很多方便。除了正式資料庫之外,谷歌搜索引擎中的「Google Scholar」也是一個搜索某一研究領域代表性學者及經典文獻的好幫手。在「Google Scholar」中輸入相關研究對象的關鍵詞,執行搜索命令後所列出的文獻是按被引用次數來排名的,因此,各相關文獻的重要性一目瞭然。更重要的是,我們還可以通過搜索結果的鏈接找到引用了相關文獻的所有論文,從而為我們提供一種以時間順序考察學術發展及文獻間相互關系的好辦法。
在綜合採用以上方法以後,我們基本上能找到所有的代表性文獻。接下來,我們還應該查找較多的次要文獻。盡管這些文獻的引用率並不太高、學術貢獻也不會太大,但它們仍能從某一方面深化相關理論體系,因此有必要在我們的文獻綜述中交代它們的貢獻。
最後必須指出的是,在我們搜集文獻的過程中,肯定會發現一些現成的、與我們要寫的文章相似的綜述文章。我們可以借鑒這些文章的內容(最重要的是這些文章的參考文獻清單)來縮短我們搜集、理解和閱讀原始文獻的過程,但切不可如獲至寶,投機取巧地照抄這些現成的綜述文章,而根本不看原始文獻,這是目前錯訛屢屢出現的根源,也違背了學術研究求真務實的精神。
㈧ 如何在線學習數據分析
數據科學並沒有一個獨立的學科體系,統計學,機器學習,數據挖掘,資料庫,分布式計算,雲計算,信息可視化等技術或方法來對付數據。但從狹義上來看,孫大聖威客認為數據科學就是解決三個問題:
1. data pre-processing;
2. data interpretation;
3.data modeling and analysis.
這也就是我們做數據工作的三個大步驟:
1、原始數據要經過一連串收集、提取、清洗、整理等等的預處理過程,才能形成高質量的數據;
2、我們想看看數據「長什麼樣」,有什麼特點和規律;
3、按照自己的需要,比如要對數據貼標簽分類,或者預測,或者想要從大量復雜的數據中提取有價值的且不易發現的信息,都要對數據建模,得到output。
這三個步驟未必嚴謹,每個大步驟下面可能依問題的不同也會有不同的小步驟,但按我這幾年的經驗來看,按照這個大思路走,數據一般不會做跑偏。
這樣看來,數據科學其實就是門復合型的技術,既然是技術就從編程語言談起吧,為了簡練,只說說R和Python。但既然是薦數據科學方面的書,我這里就不提R/Python編程基礎之類的書了,直接上跟數據科學相關的。
R programming
如果只是想初步了解一下R語言已經R在數據分析方面的應用,那不妨就看看這兩本:
R in action:我的R語言大數據101。其實對於一個沒有任何編程基礎的人來說,一開始就學這本書,學習曲線可能會比較陡峭。但如果配合上一些輔助材料,如官方發布的R basics,stackoverflow上有tag-R的問題集(Newest 'r' Questions),遇到復雜的問題可在上面搜索,總會找到解決方案的。這樣一來,用這本書拿來入門學習也問題不大。而且這本書作者寫得也比較輕松,緊貼實戰。
Data analysis and graphics using R:使用R語言做數據分析的入門書。這本書的特點也是緊貼實戰,沒有過多地講解統計學理論,所以喜歡通過情境應用來學習的人應該會喜歡這本入門書。而且這本書可讀性比較強,也就是說哪怕你手頭沒電腦寫不了代碼,有事沒事拿出這本書翻一翻,也能讀得進去。
但如果你先用R來從事實實在在的數據工作,那麼上面兩本恐怕不夠,還需要這些:
Modern applied statistics with S:這本書里統計學的理論就講得比較多了,好處就是你可以用一本書既復習了統計學,又學了R語言。(S/Splus和R的關系就類似於Unix和Linux,所以用S教程學習R,一點問題都沒有)
Data manipulation with R:這本書實務性很強,它教給你怎麼從不同格式的原始數據文件里讀取、清洗、轉換、整合成高質量的數據。當然和任何一本注重實戰的書一樣,本書也有豐富的真實數據或模擬數據供你練習。對於真正從事數據處理工作的人來說,這本書的內容非常重要,因為對於任何研究,一項熟練的數據預處理技能可以幫你節省大量的時間和精力。否則,你的研究總是要等待你的數據。
R Graphics Cookbook:想用R做可視化,就用這本書吧。150多個recipes,足以幫你應付絕大多數類型的數據。以我現在極業余的可視化操作水平來看,R是最容易做出最漂亮的圖表的工具了。
An introction to statistical learning with application in R:這本書算是著名的the element of statistical learning的姊妹篇,後者更注重統計(機器)學習的模型和演算法,而前者所涉及的模型和演算法原沒有後者全面或深入,但卻是用R來學習和應用機器學習的很好的入口。
A handbook of statistical analysis using R:這本書內容同樣非常扎實,很多統計學的學生就是用這本書來學慣用R來進行統計建模的。
㈨ 輔導手冊怎麼寫
輔導手冊
Tutorship Handbook
重點詞彙
輔導coach; tutor; tutorship; give guidance in study or training
例句:
1
因此,就有各種各樣的指南,秘訣和輔導手冊出現,且有泛濫成災之患。
Because of that, many kinds of study guides, secret tricks, and class notes appear on the market and have the tendency of overwhelming the buyers.
2
如何做好大學一年級學生的心理輔導大學一年級英語語音練習手冊
A Handbook of English Pronunciation Exercises for First Year College Students
㈩ 留學生論文的寫作步驟
留學生論文的寫作步驟
1、 仔細閱讀導師給出的論文相關要求
一般導師給的資料會有要求、handbook和評分標準的。有些時候這些資料都在一個word裡面,大家可以先仔細看清楚這些要求,不要先急著開始,審題是非常重要的,這決定了你文章的方向,審題正確是至關重要,如果偏題了寫得再好也會導致Fail。
2、抓住論文的要求寫大綱
把要求都理解了,這個時候大腦裡面要有一個大致的框架,然後根據這些內容自己寫一下大綱,這樣可能很好的幫助你明確題目要求,然後可以根據框架展開分析,這樣寫作會更清晰具有邏輯的。然後根據大綱尋找相關資料,對大綱進行擴充,使文章更加充實。
3、分析導師的意願、愛好
這個上課會經常提到一些內容或者重點,大家可以根據導師說過的合適內容寫到文章里。還有很多導師自己有不少發表文章的,大家可以去看看他們的文章,然後作為參考文獻。這個需要大家對導師的了解,內容必須要符合文章要求,不能隨便導師的什麼內容都寫到文章裡面。
4、資料查閱
資料查閱,可以去學校圖書館,學校圖書館具有豐富的資源,可以給你提供非常多的資料的。谷歌也具有非常多的資料,大家也可以下載參考的'。
5、文章注意分段和小標題
適當的對文章分段,然後列出小標題可以使文章更清晰,整篇文章的結構也會好很多。同時列出小標題可以很好的讓自己搞清楚邏輯,搞清楚內容是否偏題,很好的讓自己再次檢閱文章的。
6、文章整合、排版
最後文章寫好了,需要再一步的校稿,把文章整篇讀一篇,把基本的語法錯誤和句子表達問題修改一篇。然後在細致的看下每部分的表達是否存在問題,這個時候可以把大綱拿出來,然後去對照審核的。最後確保內容都沒有問題後,把整篇文章按照要求把格式字體調整好。然後再根據學校的要求排版好就行了。