㈠ 做数据分析不得不看的书有哪些
一、数据分析入门:
《Head First Data Analysis》链接:深入浅出数据分析、最优化方法、假设检验方法、贝叶斯统计方法、主观概率法、启发法、直方图法、回归法、误差处理、相关数据库、数据整理技巧一一讲到。图比较多,适合入门。
《Head First Statistics》
推荐理由同上,适合入门者的经典教材。
《R in Action-Data Analysis and Graphics with R》链接:
R是属于GNU系统的一个自由、免费、源代码开放的软件,用于统计计算和统计制图。这本书从实用的统计研究角度逐例分析R在数据处理、模型构建、以及图形操作上的由浅入深的结合,堪称经典。
《数据之魅-基于开源工具的数据分析》链接:数据之魅
作者是华盛顿大学理论物理学博士。这本书是数据分析的经典之一,包含大量的R语言模拟过程及结果展示,例举了很多数据分析实例和代码。
《数据挖掘-市场营销、销售与客户关系管理领域应用》链接:数据挖掘技术
作者是Data Miners的创办人,有二十多年的营销和客户关系管理结合数据挖掘的经验。详细介绍了作为一个数据挖掘团队需要的知识体系,包括数据库、SAS使用、统计学、机器学习、数据可视化、如何访问用户收集需求、如何写论文与沟通等等。有条件的建议看英文原版。
《Data Analytics for Beginners: Basic Guide to Master Data Analytics》
入门五星推荐。里面很多图表实例,手把手教你如何EXCEL画图,对各种知识点(平均值,模式,中值,方差,标准偏差)的讲解相当的到位,比起大学里的各种课本靠谱。
先把这些花时间啃啃,数据分析的理论部分就基本入门了,根据实际情况还需要结合你的业务需求来进行系统的学习。
二、数据分析进阶:
《Doing Data Scienc》
作者Cathy O’Neil是哈佛大学的博士,MIT的数据博士后,曾今作为一名Quant在对冲基金D.E. Shaw 工作,目前是一家纽约初创公司的Data scientist 。这本书需要有一定的编程和理论基础,作为入门教材来说有点难,虽然只有400来页,但是涉及的知识点很全面。每一章节的核心内容都附有编程案例,R/Python/Shell三种语言任君挑选。
《Python for Data Analysis》
Python数据分析必看,适合入行不久的数据分析师。作者有多年的Python数据分析工作经验,对各种Pyhon包iPython,NumPy,pandas,matpotlib等有着很深的理解。看完这本,敲完代码,Python数据分析就算入行了。
《Data Science for Business》
很多牛人为之作序,数据科学如何与商业结合,相信这本书会给你一些启发。
《Python Data Science Handbook》
2016年6月出版的,500页保质保量,作者(Jake VanderPlas)是华盛顿大学电子科学研究所的高级数据科学研究员,研究领域包括天文统计学、机器学习和可扩展计算。书的前半部分介绍了用于数据分析和一般的科学计算的基本Python库,后面从实际应用的角度使用Python库scikit-learn开始机器学习实践。适合有一定Python基础人(或者R基础),并且想学习如何使用Python进行数据分析的人。
《Storytelling with Data》
作者Cole NussbaumerKnaflic,私募分析师,前Google人力分析团队总监。本书展示了如何高效率展示量化资讯,如何用丰富的资料讲故事。Google内部的数据可视化课程讲师,之前也在Maryland Institute College of Art兼职讲师。如果你想知道如何以图叙事,这边好书不容错过。
㈡ 书的英语单词怎么写
book
英[bʊk];美[bʊk]
n.书;本子;v.预订;记录在案
1、book是可数名词,基本意思是“书,书籍”,还可指“(大型着作的)卷,篇,部”,歌剧中的“歌词,脚本”,当表示“账册”时,用thebooks。
2、abook泛指各种书中的一本;如果指许多相同书中的一本,则应说a ofbook。
book, pamphlet, volume这三个词的共同意思是“书”,其区别是:
一、book是“书”的通称;volume是一套书中的“卷”或“册”,有时也指较大的书。例如:
1、A novel in four volumes:一部4卷本的小说;
2、a volume of his poetry:他的一本诗集;
二、pamphlet指“小书”“小册子”,但并不见得不重要。例如:
scholarly monographs published as pamphlet:以小册子形式出版的学术专着。
㈢ 手册英文怎么读
手册的英文:manual、handbook。
1、manual
英文发音:['mænjʊ(ə)l]
中文释义:
adj. 手工的;体力的
n. 手册,指南
例句:
There is a manual pump to get rid of the water.
有一台手动水泵用来排水。
2、handbook
英文发音:['hæn(d)bʊk]
中文释义:
n. 手册;指南
例句:
When you have finished this one, I suggest you read the College Handbook.
当你已经看完这本后,我建议你再读大学写作手册。
(3)数据分析handbook怎么写扩展阅读
manual和handbook的区别:
1、具体含义不同
manual一般指的是产品的使用说明书,handbook泛指一切手册或指南,使用较为广泛。
2、词性不同
manual可以作为名词,也可以作为形容词表示手工的、体力的意思,handbook只能作为名词表达手册。
例句:
The device is manually operated, using a simple handle.
这个装置利用一个简单的手柄,可以用手操作。
The handbook covers the BSC equipment configurations.
此手册也阐述了BSC的设备配置。
㈣ 数据科学 怎样进行大数据的入门级学习
数据科学 怎样进行大数据的入门级学习?
数据科学并没有一个独立的学科体系,统计学,机器学习,数据挖掘,数据库,分布式计算,云计算,信息可视化等技术或方法来对付数据。
但从狭义上来看,我认为数据科学就是解决三个问题:
1. data pre-processing;(数据预处理)
2. data interpretation;(数据解读)
3.data modeling and analysis.(数据建模与分析)
这也就是我们做数据工作的三个大步骤:
1、原始数据要经过一连串收集、提取、清洗、整理等等的预处理过程,才能形成高质量的数据;
2、我们想看看数据“长什么样”,有什么特点和规律;
3、按照自己的需要,比如要对数据贴标签分类,或者预测,或者想要从大量复杂的数据中提取有价值的且不易发现的信息,都要对数据建模,得到output。
这三个步骤未必严谨,每个大步骤下面可能依问题的不同也会有不同的小步骤,但按我这几年的经验来看,按照这个大思路走,数据一般不会做跑偏。
这样看来,数据科学其实就是门复合型的技术,既然是技术就从编程语言谈起吧,为了简练,只说说R和Python。但既然是荐数据科学方面的书,我这里就不提R/Python编程基础之类的书了,直接上跟数据科学相关的。
R programming
如果只是想初步了解一下R语言已经R在数据分析方面的应用,那不妨就看看这两本:
R in action:我的R语言大数据101。其实对于一个没有任何编程基础的人来说,一开始就学这本书,学习曲线可能会比较陡峭。但如果配合上一些辅助材料,如官方发布的R basics(http://cran.r-project.org/doc/contrib/usingR.pdf),stackoverflow上有tag-R的问题集(Newest ‘r’ Questions),遇到复杂的问题可在上面搜索,总会找到解决方案的。这样一来,用这本书拿来入门学习也问题不大。而且这本书作者写得也比较轻松,紧贴实战。
Data analysis and graphics using R:使用R语言做数据分析的入门书。这本书的特点也是紧贴实战,没有过多地讲解统计学理论,所以喜欢通过情境应用来学习的人应该会喜欢这本入门书。而且这本书可读性比较强,也就是说哪怕你手头没电脑写不了代码,有事没事拿出这本书翻一翻,也能读得进去。
但如果你先用R来从事实实在在的数据工作,那么上面两本恐怕不够,还需要这些:
Modern applied statistics with S:这本书里统计学的理论就讲得比较多了,好处就是你可以用一本书既复习了统计学,又学了R语言。(S/Splus和R的关系就类似于Unix和Linux,所以用S教程学习R,一点问题都没有)
Data manipulation with R:这本书实务性很强,它教给你怎么从不同格式的原始数据文件里读取、清洗、转换、整合成高质量的数据。当然和任何一本注重实战的书一样,本书也有丰富的真实数据或模拟数据供你练习。对于真正从事数据处理工作的人来说,这本书的内容非常重要,因为对于任何研究,一项熟练的数据预处理技能可以帮你节省大量的时间和精力。否则,你的研究总是要等待你的数据。
R Graphics Cookbook:想用R做可视化,就用这本书吧。150多个recipes,足以帮你应付绝大多数类型的数据。以我现在极业余的可视化操作水平来看,R是最容易做出最漂亮的图表的工具了。
An introction to statistical learning with application in R:这本书算是着名的the element of statistical learning的姊妹篇,后者更注重统计(机器)学习的模型和算法,而前者所涉及的模型和算法原没有后者全面或深入,但却是用R来学习和应用机器学习的很好的入口。
A handbook of statistical analysis using R:这本书内容同样非常扎实,很多统计学的学生就是用这本书来学习用R来进行统计建模的。
Python
Think Python,Think Stats,Think Bayes:这是Allen B. Downey写的着名的Think X series三大卷。其实是三本精致的小册子,如果想快速地掌握Python在统计方面的操作,好好阅读这三本书,认真做习题,答案链接在书里有。这三本书学通了,就可以上手用Python进行基本的统计建模了。
Python For Data Analysis: 作者是pandas的主要开发者,也正是Pandas使Python能够像R一样拥有dataframe的功能,能够处理结构比较复杂的数据。这本书其实analysis讲得不多,说成数据处理应该更合适。掌握了这本书,处理各种糟心的数据就问题不大了。
Introction to Python for Econometrics, Statistics and Data Analysis:这本书第一章就告诉你要安装Numpy, Scipy, Matplotlib, Pandas, IPython等等。然后接下来的十好几章就是逐一介绍这几个库该怎么用。很全面,但读起来比较枯燥,可以用来当工具书。
Practical Data Analysis: 这本书挺奇葩,貌似很畅销,但作者把内容安排得东一榔头西一棒子,什么都讲一点,但一个都没讲透。这本书可以作为我们学习数据分析的一个索引,看到哪块内容有意思,就顺着它这个藤去摸更多的瓜。
Python Data Visualization Cookbook: 用Python做可视化的教材肯定不少,我看过的也就这一本,觉得还不错。其实这类书差别都不会很大,咬住一本啃下来就是王道
Exploratory Data Analysis 和 Data Visualization
Exploratory Data Analysis:John Tukey写于1977年的经典老教材,是这一领域的开山之作。如今EDA已经是统计学里的重要一支,但当时还是有很多人对他的工作不屑一顾。可他爱数据,坚信数据可以以一种出人意料的方式呈现出来。正是他的努力,让数据可视化成为一门无比迷人的技术。但这本书不推荐阅读了,内容略过时。要想完整地了解EDA,推荐下一本:
Exploratory Data Analysis with MATLAB:这本书虽然标题带了个MATLAB,但实际上内容几乎没怎么讲MATLAB,只是每讲一个方法的时候就列出对应的MATALB函数。这本书的重要之处在于,这是我读过的讲EDA最系统的一本书,除了对visualization有不输于John Tucky的讲解外,对于高维的数据集,通过怎样的方法才能让我们从中找到潜在的pattern,这本书也做了详尽的讲解。全书所以案例都有对应的MATALB代码,而且还提供了GUI(图形用户界面)。所以这本书学起来还是相当轻松愉悦的。
Visualize This:中译本叫“鲜活的数据”,作者是个“超级数据迷”,建立了一个叫http://flowingdata.com的网页展示他的数据可视化作品,这本书告诉你该选择什么样的可视化工具,然后告诉你怎样visualize关系型数据、时间序列、空间数据等,最后你就可以用数据讲故事了。如果你只想感受一下数据可视化是个什么,可以直接点开下面这个链接感受下吧!A tour through the visualization zoo(A Tour Through the Visualization Zoo)
Machine Learning & Data Mining
这一块就不多说了,不是因为它不重要,而是因为它太太太重要。所以这一部分就推两本书,都是”世界名着“,都比较难读,需要一点点地啃。这两本书拿下,基本就算是登堂入室了。其实作为机器学习的延伸和深化,概率图模型(PGM)和深度学习(deep learning)同样值得研究,特别是后者现在简直火得不得了。但PGM偏难,啃K.Daphne那本大作实在太烧脑,也没必要,而且在数据领域的应用也不算很广。deep learning目前工业界的步子迈得比学术界的大,各个domain的应用如火如荼,但要有公认的好教材问世则还需时日,所以PGM和deep learning这两块就不荐书了。
The Element of Statistical Learning:要学机器学习,如果让我只推荐一本书,我就推荐这本巨着。Hastie、Tibshirani、Friedman这三位大牛写书写得太用心了,大厦建得够高够大,结构也非常严谨,而且很有前瞻性,纳入了很多前沿的内容,而不仅仅是一部综述性的教材。(图表也做得非常漂亮,应该是用R语言的ggplot2做的。)这本书注重讲解模型和算法本身,所以需要具备比较扎实的数理基础,啃起这本书来才不会太吃力。事实上掌握模型和算法的原理非常重要。机器学习(统计学习)的库现在已经非常丰富,即使你没有完全搞懂某个模型或算法的原理和过程,只要会用那几个库,机器学习也能做得下去。但你会发现你把数据代进去,效果永远都不好。但是,当你透彻地理解了模型和算法本身,你再调用那几个库的时候,心情是完全不一样的,效果也不一样。
Data Mining: Concepts and Techniques, by Jiawei Han and Micheline Kamber 数据挖掘的教材汗牛充栋,之所以推荐这本韩家炜爷爷的,是因为虽然他这本书的出发点是应用,但原理上的内容也一点没有落下,内容非常完整。而且紧跟时代,更新的很快,我看过的是第二版,就已经加进去了social network analysis这种当时的前沿内容。现在已经有第三版了,我还没看过,但应该也加入了不少新内容。其实这本书并不难读,只是篇幅较长,啃起来比较耗时。
其实这两本书里单拎出来一块内容可能又是几本书的节奏,比如bayesian方法,再拿出两三本书来讲也不为过,我个人用到的比较多,而且也确实有不少好书。但并非是所有data scientist都要用到,所以这一块就不再细说。
还有一些印象比较深刻的书:
Big Data Glossary: 主要讲解大数据处理技术及工具,内容涵盖了NoSQL,MapRece,Storage,Servers,NLP库与工具包,机器学习工具包,数据可视化工具包,数据清洗,序列化指南等等。总之,是一本辞典式的大数据入门指导。
Mining of Massive Datasets:这本书是斯坦福大学Web Mining的讲义,里面很多内容与韩家炜的Data Mining那本书重合,但这本书里详细地讲了MapRece的设计原理,PageRank(Google创业时期的核心排序算法,现在也在不断优化更新)讲解得也比较详细。
Developing Analytic Talent: 作者是个从事了十几年数据工作的geek,技术博客写得很有个人风格,写的内容都比较偏门,通常只有具备相关数据处理经验的人能体会出来,丝毫不照顾初学者的感受。比如他会谈到当数据流更新太快时该怎么办,或者MapRece在什么时候不好用的问题,才不管你懂不懂相关基础原理。所以这本书不太适合初学者阅读。这本书其实是作者的博客文章的集结,用how to become a data scientist的逻辑把他近几年的博客文章串联了起来。
Past, Present and Future of Statistical Science:这本书是由COPSS(统计学社主席委员会,由国际各大统计学会的带头人组成)在50周年出版的一本纪念册,里面有50位统计学家每人分别贡献出的一两篇文章,有的回忆了自己当年如何走上统计学这条路,有的探讨了一些统计学的根本问题,有的谈了谈自己在从事的前沿研究,有的则给年轻一代写下了寄语。非常有爱的一本书。
其它资料
Harvard Data Science:这是H大的Data science在线课,我没有修过,但口碑很好。这门课需要费用8千刀左右,比起华盛顿大学的4千刀的Data science在线课虽贵一倍,但比斯坦福的14千刀要便宜将近一半(而且斯坦福的更偏计算机)。如果想自学,早有好心人分享了slides:(https://drive.google.com/folderview?id=0BxYkKyLxfsNVd0xicUVDS1dIS0k&usp=sharing)和homeworks and solutions:(https://github.com/cs109/content)
PyData:PyData是来自各个domain的用Python做数据的人每年举行一次的聚会,期间会有各路牛人举行一些规模不大的seminar或workshop,有好心人已经把video上传到github,有兴趣的去认领吧(DataTau/datascience-anthology-pydata · GitHub)
工具
R/Python/MATLAB(必备):如果是做数据分析和模型开发,以我的观察来看,使用这三种工具的最多。R生来就是一个统计学家开发的软件,所做的事也自然围绕统计学展开。MATLAB虽然算不上是个专业的数据分析工具,但因为很多人不是专业做数据的,做数据还是为了自己的domain expertise(特别是科学计算、信号处理等),而MATLAB又是个强大无比的Domain expertise工具,所以很多人也就顺带让MATLAB也承担了数据处理的工作,虽然它有时候显得效率不高。Python虽然不是做数据分析的专业软件,但作为一个面向对象的高级动态语言,其开源的生态使Python拥有无比丰富的库,Numpy, Scipy 实现了矩阵运算/科学计算,相当于实现了MATLAB的功能,Pandas又使Python能够像R一样处理dataframe,scikit-learn又实现了机器学习。
SQL(必备):虽然现在人们都说传统的关系型数据库如Oracle、MySQL越来越无法适应大数据的发展,但对于很多人来说,他们每天都有处理数据的需要,但可能一辈子都没机会接触TB级的数据。不管怎么说,不论是用关系型还是非关系型数据库,SQL语言是必须要掌握的技能,用什么数据库视具体情况而定。
MongoDB(可选):目前最受欢迎的非关系型数据库NoSQL之一,不少人认为MongoDB完全可以取代mySQL。确实MongoDB方便易用,扩展性强,Web2.0时代的必需品。
Hadoop/Spark/Storm(可选): MapRece是当前最着名也是运用最广泛的分布式计算框架,由Google建立。Hadoop/Spark/storm都是基于MapRece的框架建立起来的分布式计算系统,要说他们之间的区别就是,Hadoop用硬盘存储数据,Spark用内存存储数据,Storm只接受实时数据流而不存储数据。一言以蔽之,如果数据是离线的,如果数据比较复杂且对处理速度要求一般,就Hadoop,如果要速度,就Spark,如果数据是在线的实时的流数据,就Storm。
OpenRefine(可选):Google开发的一个易于操作的数据清洗工具,可以实现一些基本的清洗功能。
Tableau(可选):一个可交互的数据可视化工具,操作简单,开箱即用。而且图表都设计得非常漂亮。专业版1999美刀,终身使用。媒体和公关方面用得比较多。
Gephi(可选):跟Tableau类似,都是那种可交互的可视化工具,不需要编程基础,生成的图表在美学和设计上也是花了心血的。更擅长复杂网络的可视化。
㈤ 你知道在数据分析有哪些好书值得推荐吗
数据分析方面,我推荐《精益数据分析》,这本书里讲解了创业公司该如何确定指标体系,如何用数据指导产品和运营。本书还针对电商、媒体、SaaS、双边市场、Ugc等,列举了要关注的指标,并有丰富的案例。不足是整个书的内容比较散,系统性不强,但依旧是讲互联网产品数据分析方面我觉得最好的一本了。数据挖掘方面,我推荐韩家炜的《数据挖掘概念与技术》,我自己就是在工作之后,通过阅读这本书,对数据挖掘有了系统性的认识,后来我研究用户行为序列模式挖掘的时候,发现看的许多论文都出自他的实验室。在两三年前,他还去网络做过一次报告,有幸去听了。当然,光靠看看书是远远不够的,想深入数据分析,就在自己的工作中尝试用数据指导决策,不管是项目效果的评估,运营活动的评估,都尝试用数据来验证。对于数据挖掘,还是找个应用场景,直接写程序去尝试一下个性化推荐,分类之类的算法,这样就不会觉得云里雾里了。
㈥ 哪位大神能跟我说下刚买到frm的handbook和notes 可是不知道怎么入手
同学你好,很高兴为您解答!
handbook里面,每章开头第一页的最下面有标注,会标明是该章节是1级还是2级的考试内容。Notes是直接按1,2级编写的,1级是3本书,2级是4本书。
希望我的回答能帮助您解决问题,如您满意,请采纳为最佳答案哟。
再次感谢您的提问,更多财会问题欢迎提交给高顿企业知道。
高顿祝您生活愉快!
㈦ 论文的文献梳理咋写
一、引 言
不管是哪种学科的哪种研究,文献综述必不可少。文献综述具有承上启下的作用,是学术研究和学术论文写作的一个重要环节。通过文献综述,我们可以了解相关领域的研究现状,在前人研究的基础上确定自己要研究的问题,避免不必要的重复并能够有所创新,为科学知识的积累做出自己的贡献。虽然文献综述工作非常重要,但目前与方法论有关的、讨论如何撰写文献综述类文章的管理学着述并不多见。而且,大多数学校的方法论课程也很少谈及这方面的内容。因此,我们不揣冒昧,把自己写作管理学文献综述类文章的一些体会拿出来与大家探讨。我们的所言大多为不成熟的浅见,难免挂一漏万,请各位大家指正。
本文的主要读者应该是高等院校和科研机构的管理学在读研究生。事实上,本文的雏形就是我们为指导自己的研究生写作文献综述类文章而拟定的要点和建议,其中的很多内容又来自于我们在研究生学习期间老师对我们的指导。我们希望我们的体会能够对正在撰写或将要撰写文献综述类文章的研究生有所帮助。
本文的结构安排如下:第二节简要描述文献综述的目的;第三节介绍六种查找文献的方法;第四节是对阅读文献三个层次的说明;第五节探讨了文献综述类文章的不同结构安排;第六节针对研究生提出了写作文献综述类文章的五点建议。
二、文献综述的目的
任何研究都不是凭空产生的,而是在前人研究的基础上从某个方面进行深化,都具有一定的传承性。因此,文献综述是研究的第一步,其目的在于了解前人说过些什么,而这实际上也决定了我们能够说些什么。具体地,对于要研究的问题,我们必须弄清:
1.前人是否说过。
要知道前人是否说过,关键是要进行充分的文献检索。互联网的出现以及在线数据库的广泛应用为文献检索提供了前所未有的方便。目前,各大专院校和科研机构的图书馆都购买了非常齐全的中、英文数据库。只要数据库覆盖面合理并使用得当,我们足不出户就能查到几乎所有所需的文献,省却了上世纪做研究非跑大图书馆不可的麻烦。目前,国内高校图书馆中的Jstor、Science Direct、CN KI等都是极佳的在线数据库。如果文献搜索结果表明自己拟做的研究别人已经做过,那么就没有必要做无为的重复,而应该及时调整自己的思路,改换研究角度、重点或方法。
2.前人说过什么
。要想知道前人说过什么,就必须解答以下几个问题。首先是前人研究的对象或问题是什么(what)、前人是如何(how)阐述研究问题的以及为什么(why)这样阐述;然后是前人观点的异同点是什么,这些观点是否可以分类、如何分类,观点之间的前后时间关系和逻辑关系是什么。搞清楚别人是否说过、说了什么,是我们进行学术创新的重要基础。
3.前人是怎么说的。
在文献综述时不仅要综述观点,还要综述研究方法(即别人是怎么说的)。方法的发展和进步会在很多方面改变已有的观点。例如,产业组织理论中博弈论研究分析方法的引入就改变了SCP框架下产生的很多观点。随着数据获取途径的增多和获取技术的改进,总的来说,针对某一研究对象所使用的研究方法会越来越多。因此,当我们发现某类文献主要以使用某一种或某几种研究方法为主,而对其他研究方法应用较少时,就应该考虑能否采用其他方法特别是比较新的研究方法,以便通过方法创新来实现观点创新。
4.何人、何时、何地说过。
这组问题主要反映相关观点演化过程的影响因素,包括观点在不同地域、不同时间上的变化。例如,总体上看,受社会经济发展阶段性以及文化差异性的影响,不同国家、不同时期的消费者对服务质量的要求会出现较大的差异,并且在很大程度上影响消费者对服务质量的感知及满意度。另外,了解“是谁说的”,对于我们认识相关观点的产生和发展过程也有帮助。例如,战略管理研究定位学派的“五力模型”是波特于1979年提出的,当我们知道波特是哈佛商学院和哈佛经济系联合培养的博士之后,就能更好地理解这一模型与哈佛老一代经济学家提出的SCP框架之间的传承关系。
实际上,如果我们能够在文献综述的过程中回答好以上四个方面的问题,那么就可以基本确定我们要做的研究或要写的论文的创新点、主要思路和拟采用的方法。可以说,做好文献综述,研究工作就完成了一大半,剩下的问卷设计、实地调查、数据分析、论文写作等工作便水到渠成。
三、如何寻找代表性文献
文献综述的第一步是查找文献,也就是搜集要综述的素材。一种常用的方法是直接进入各种数据库(如CNKI、Science Direct、Ebsco、Emerald),在“文章标题、关键词和摘要”这一搜索项中填入搜索信息(如在中文数据库中填入“服务质量和满意度”或在英文数据库中填入“service quality and satisfaction”),再执行搜索命令。然而,在国、内外各种刊物层出不穷、文章不胜其数的情况下,我们很可能搜索到多达数百篇有时甚至上千篇的相关文献,以至于无从着手阅读、分析。我们建议首先应该重点搜集和阅读有代表性的文献,特别是对相关研究产生重大影响的种子论文(seminal paper),然后再搜集和阅读次要一些的文献。那么,如何查找代表性文献呢?请教导师当然是最简单、有效的途径。但也有一些时候,我们拟综述的主题并非导师擅长的研究领域,导师可能无法提供主要文献阅读清单。如果遇到这种情况,我们建议采用下面一些方法。
1.首先查找并阅读发表在一流刊物上的文章。
每个学科都有自己的刊物分级和排名,要重点查阅排名靠前的刊物所刊载的文献。例如,管理学排名靠前的英文期刊(根据不同的评价标准,具体排名可能有所不同)有Administrative Science Quarterly、Academy of Management Journal、Journal of Applied Psychology、Organizational Behavior and Human Decision Process、Strategic Management Journal、Academy of Management Review;而国内排名比较靠前的管理学期刊则包括《管理世界》、《中国软科学》、《外国经济与管理》、《南开管理评论》和《管理科学学报》等。
2.查找权威教科书及其提到的某领域的经典文献。
一般来说,我们所研究的问题大多可以在教科书中找到相应的章节。若能找到权威的教科书,就可以从相应的章节中找到这些教科书作者所引用的文献,这些文献往往也是对于相关学科发展较为重要的文献。若能找到最新版本的教科书,那么效果就更好。
3.查找学术权威发表的研究成果。
与其他学科一样,国内、外管理学各领域都有若干重要的学术权威,如服务质量管理领域中的“PZB”(即服务质量研究领域的三位着名学者Parasuraman、Zeithaml和Berry,他们三人各自或合作发表了大量重要的原创论文)。这些重要学者的文章往往也是我们在前面提到的种子论文,开创了某一研究领域并长期影响相关领域的发展。因此,根据时间顺序阅读这些学术权威的文献会对我们了解和分析相关领域学术研究的演化发展过程大有帮助。若能找到并认真阅读这些学术权威亲自撰写的关于相关研究领域发展历史的述评文章,那么,我们就能更加清晰地了解相关领域不同学术观点的产生和发展过程。
4.寻找名校、名师研究型课程的教学大纲(syllabus)。
国内、外着名大学的研究型课程(主要指硕士和博士研究生课程,很多以“seminar”的形式出现)中会列出每个研究领域的重要文献,供学生阅读和讨论。当然,不同教师的取舍有所不同,文献清单也会出现一定的差异。我们可以多参考几个同名课程的大纲,以避免偏颇。
5.到图书馆或从数据库中查看以“handbook”为名的论文集。
国外出版社(如在出版学术期刊和着作方面比较有名的Blackwell、John Wiley and Sons和Elsevier)经常召集业内专家编着一些综合体现学科发展状况的工具书性质的论文集,如《Handbook of Econometrics》、《The Blackwell Handbook of Strategic Management》、《Handbook of Instrial Organization》等。这些论文集中的论文大多以综述本学科某个研究领域的学术进展为主要目的,作者都是相关研究领域的权威。阅读此类手册收入的论文可以迅速掌握相关领域最重要的学术进展状况。
6.利用“Google Scholar”。
目前,互联网在学术研究中发挥着越来越大的作用,为我们提供了很多方便。除了正式数据库之外,谷歌搜索引擎中的“Google Scholar”也是一个搜索某一研究领域代表性学者及经典文献的好帮手。在“Google Scholar”中输入相关研究对象的关键词,执行搜索命令后所列出的文献是按被引用次数来排名的,因此,各相关文献的重要性一目了然。更重要的是,我们还可以通过搜索结果的链接找到引用了相关文献的所有论文,从而为我们提供一种以时间顺序考察学术发展及文献间相互关系的好办法。
在综合采用以上方法以后,我们基本上能找到所有的代表性文献。接下来,我们还应该查找较多的次要文献。尽管这些文献的引用率并不太高、学术贡献也不会太大,但它们仍能从某一方面深化相关理论体系,因此有必要在我们的文献综述中交代它们的贡献。
最后必须指出的是,在我们搜集文献的过程中,肯定会发现一些现成的、与我们要写的文章相似的综述文章。我们可以借鉴这些文章的内容(最重要的是这些文章的参考文献清单)来缩短我们搜集、理解和阅读原始文献的过程,但切不可如获至宝,投机取巧地照抄这些现成的综述文章,而根本不看原始文献,这是目前错讹屡屡出现的根源,也违背了学术研究求真务实的精神。
㈧ 如何在线学习数据分析
数据科学并没有一个独立的学科体系,统计学,机器学习,数据挖掘,数据库,分布式计算,云计算,信息可视化等技术或方法来对付数据。但从狭义上来看,孙大圣威客认为数据科学就是解决三个问题:
1. data pre-processing;
2. data interpretation;
3.data modeling and analysis.
这也就是我们做数据工作的三个大步骤:
1、原始数据要经过一连串收集、提取、清洗、整理等等的预处理过程,才能形成高质量的数据;
2、我们想看看数据“长什么样”,有什么特点和规律;
3、按照自己的需要,比如要对数据贴标签分类,或者预测,或者想要从大量复杂的数据中提取有价值的且不易发现的信息,都要对数据建模,得到output。
这三个步骤未必严谨,每个大步骤下面可能依问题的不同也会有不同的小步骤,但按我这几年的经验来看,按照这个大思路走,数据一般不会做跑偏。
这样看来,数据科学其实就是门复合型的技术,既然是技术就从编程语言谈起吧,为了简练,只说说R和Python。但既然是荐数据科学方面的书,我这里就不提R/Python编程基础之类的书了,直接上跟数据科学相关的。
R programming
如果只是想初步了解一下R语言已经R在数据分析方面的应用,那不妨就看看这两本:
R in action:我的R语言大数据101。其实对于一个没有任何编程基础的人来说,一开始就学这本书,学习曲线可能会比较陡峭。但如果配合上一些辅助材料,如官方发布的R basics,stackoverflow上有tag-R的问题集(Newest 'r' Questions),遇到复杂的问题可在上面搜索,总会找到解决方案的。这样一来,用这本书拿来入门学习也问题不大。而且这本书作者写得也比较轻松,紧贴实战。
Data analysis and graphics using R:使用R语言做数据分析的入门书。这本书的特点也是紧贴实战,没有过多地讲解统计学理论,所以喜欢通过情境应用来学习的人应该会喜欢这本入门书。而且这本书可读性比较强,也就是说哪怕你手头没电脑写不了代码,有事没事拿出这本书翻一翻,也能读得进去。
但如果你先用R来从事实实在在的数据工作,那么上面两本恐怕不够,还需要这些:
Modern applied statistics with S:这本书里统计学的理论就讲得比较多了,好处就是你可以用一本书既复习了统计学,又学了R语言。(S/Splus和R的关系就类似于Unix和Linux,所以用S教程学习R,一点问题都没有)
Data manipulation with R:这本书实务性很强,它教给你怎么从不同格式的原始数据文件里读取、清洗、转换、整合成高质量的数据。当然和任何一本注重实战的书一样,本书也有丰富的真实数据或模拟数据供你练习。对于真正从事数据处理工作的人来说,这本书的内容非常重要,因为对于任何研究,一项熟练的数据预处理技能可以帮你节省大量的时间和精力。否则,你的研究总是要等待你的数据。
R Graphics Cookbook:想用R做可视化,就用这本书吧。150多个recipes,足以帮你应付绝大多数类型的数据。以我现在极业余的可视化操作水平来看,R是最容易做出最漂亮的图表的工具了。
An introction to statistical learning with application in R:这本书算是着名的the element of statistical learning的姊妹篇,后者更注重统计(机器)学习的模型和算法,而前者所涉及的模型和算法原没有后者全面或深入,但却是用R来学习和应用机器学习的很好的入口。
A handbook of statistical analysis using R:这本书内容同样非常扎实,很多统计学的学生就是用这本书来学习用R来进行统计建模的。
㈨ 辅导手册怎么写
辅导手册
Tutorship Handbook
重点词汇
辅导coach; tutor; tutorship; give guidance in study or training
例句:
1
因此,就有各种各样的指南,秘诀和辅导手册出现,且有泛滥成灾之患。
Because of that, many kinds of study guides, secret tricks, and class notes appear on the market and have the tendency of overwhelming the buyers.
2
如何做好大学一年级学生的心理辅导大学一年级英语语音练习手册
A Handbook of English Pronunciation Exercises for First Year College Students
㈩ 留学生论文的写作步骤
留学生论文的写作步骤
1、 仔细阅读导师给出的论文相关要求
一般导师给的资料会有要求、handbook和评分标准的。有些时候这些资料都在一个word里面,大家可以先仔细看清楚这些要求,不要先急着开始,审题是非常重要的,这决定了你文章的方向,审题正确是至关重要,如果偏题了写得再好也会导致Fail。
2、抓住论文的要求写大纲
把要求都理解了,这个时候大脑里面要有一个大致的框架,然后根据这些内容自己写一下大纲,这样可能很好的帮助你明确题目要求,然后可以根据框架展开分析,这样写作会更清晰具有逻辑的。然后根据大纲寻找相关资料,对大纲进行扩充,使文章更加充实。
3、分析导师的意愿、爱好
这个上课会经常提到一些内容或者重点,大家可以根据导师说过的合适内容写到文章里。还有很多导师自己有不少发表文章的,大家可以去看看他们的文章,然后作为参考文献。这个需要大家对导师的了解,内容必须要符合文章要求,不能随便导师的什么内容都写到文章里面。
4、资料查阅
资料查阅,可以去学校图书馆,学校图书馆具有丰富的资源,可以给你提供非常多的资料的。谷歌也具有非常多的资料,大家也可以下载参考的'。
5、文章注意分段和小标题
适当的对文章分段,然后列出小标题可以使文章更清晰,整篇文章的结构也会好很多。同时列出小标题可以很好的让自己搞清楚逻辑,搞清楚内容是否偏题,很好的让自己再次检阅文章的。
6、文章整合、排版
最后文章写好了,需要再一步的校稿,把文章整篇读一篇,把基本的语法错误和句子表达问题修改一篇。然后在细致的看下每部分的表达是否存在问题,这个时候可以把大纲拿出来,然后去对照审核的。最后确保内容都没有问题后,把整篇文章按照要求把格式字体调整好。然后再根据学校的要求排版好就行了。