A. 統計學中數據分析的依據和方法有哪些
統計學:通過利用概率論建立數學模型,收集所觀察系統的數據,進行量化的分析、總結,並進而進行推斷和預測,為相關決策提供依據和參考統計學基本理論研究有:概率極限理論及其在統計中應用、樹形概率、Banach空間概率、隨機PDE』S、泊松逼近、隨機網路、馬爾科夫過程及場論、馬爾科夫收斂率、布朗運動與偏微分方程、空間分支總體的極限、大的偏差與隨機中數、序貫分析和時序分析中的交叉界限問題、馬爾科夫過程與狄利克雷表的一一對應關系、函數估計中的中心極限定理、極限定理的穩定性問題、因果關系與統計推斷、預測推斷、網路推斷、似然、M——估計量與最大似然估計、參數模型中的精確逼近、非參數估計中的自適應方法、多元分析中的新內容、時間序列理論與應用、非線性時間序列、時間序列中確定模型與隨機模型比較、極值統計、貝葉斯計算、變點分析、對隨機PDE』S的估計、測度值的處理、函數數據統計分析
B. 統計建模是什麼具體流程是什麼難不難給點案例。
一、什麼是統計建模
統計建模是以計算機統計分析軟體為工具,利用各種統計分析方法對批量數據建立統計模型和探索處理的過程,用於揭示數據背後的因素,詮釋社會經濟現象,或對經濟和社會發展作出預測或判斷。隨著計算機和網路技術的快速普及和廣泛發展,我們面對著數據和信息爆炸的挑戰,如何迅速有效地將數據提升為信息、知識和智能,是統計工作者面臨的重要課題。而統計建模將統計方法、計算機技術完美結合,帶動以數據分析為導向的統計思維,發現和挖掘數據背後的規律,為經濟社會的發展提供更好更多的統計信息。
大賽題目一般來源於社會、經濟和管理科學等方面經過適當簡化加工的實際問題,不要求參賽者預先掌握深入的專門知識,只需要學過統計專業的基本內容,較為熟練地掌握統計分析方法,並且具備一定的統計工作經驗。題目有較大的靈活性供參賽者發揮其創造能力。參賽者應根據題目要求,完成一篇包括模型的假設、建立和求解、計算方法的設計及計算機實現、結果的分析和檢驗、模型的改進等方面的論文(即答卷)。大賽評獎以假設的合理性、建模的創造性、結果的正確性和文字表述的清晰程度為主要標准。
我們從下面一個例子,看一看什麼是統計建模。
案例:從交通事故數據能夠得到什麼結論?
基本數據:各省市自治區改革開放以來的交通事故數據。數據應該包括機動車(貨運,大客車、小轎車、農用車、拖拉機、各種摩托車和工程車等)、非機動車(自行車、三輪車)、其他(如電動、加力自行車和機動三輪車,雖然可能非法)、殘疾人車、獸力車、行人等等;數據也應該包括事故等級,事故個數、死亡人數、財產損失、受傷人數等;肇事者的職業、年齡、駕齡、教育程度、是否酒後駕車(很重要!)、是否疲勞駕車、是否打手機、車速、路況(街道、普通公路、等級公路、高速公路)、事故時間段等等(這些都是交管部門的標准記錄)。數據應該覆蓋至少10年(最好有月度數據)。
附加數據:各省市自治區相應年份的經濟資料,包括各種道路的里程、各種機動車的保有數等。
問題:
1.找出各種車輛的各種事故的概率(及影響因素)、這些事故數量的影響變數(比如年齡因素、是否喝酒、山區或鬧市區、時間段、何種道路、車輛種類,等等)。
2.找出在什麼因素(變數)下最容易出事、什麼因素(變數)下最容易造成重大人身傷害、什麼因素(變數)造成財產損失最大。
3.找出各省市自治區事故的各自特點,並且按照事故模式把各省市自治區分類,同時按照經濟分類進行比較。說明交通事故與經濟發展之間的關系。
4.找出各地和全國事故的趨勢,以及這些趨勢與經濟(包括道路里程、機動車數量等)之間的關系。並且對未來事故進行預測。
5.對各省市自治區,根據各種與交通事故相關的變數進行排序。
要求:一切根據數據。任何所採用的統計方法要說明條件和假定。任何輸出的結果要有說明和解釋。
根據上述案例,不難形成這樣一個判斷:在一定意義上,統計建模是一種命題作文,它有以下幾個特點:
一是統計建模從經濟社會發展的實際情況出發,找出事物發展的趨勢和規律,如果脫離了這一點,統計建模也就失去了意義。
二是統計建模從數據出發,找出數據之間的聯系,用數據說話,數據是統計建模最大的特質。
三是統計建模將統計分析方法和計算機技術有效結合,包括收集數據、利用統計分析軟體對數據進行分析等。
四是統計建模涉及數據收集、整理、分析等方面,對建模者的能力要求較為全面。
二、統計建模的流程
(一)明確問題。統計建模強調問題導向,因此,首先要明確需要求解的問題。
(二)收集信息:在明確問題的基礎上,根據題目的要求,從可用的資料庫中收集和整理出各種必要的信息。
(三)模型假設:利用統計分析方法,對問題做出必要的、合理的假設,使問題的主要特徵凸現出來,忽略問題的次要方面。
(四)模型構建:根據所做的假設以及事物之間的聯系,構造各種量之間的關系,把問題轉化為統計分析問題,注意要盡量採用適當的統計分析模型及方法。
(五)模型求解:利用構建的模型進行計算,並得到與問題有關的一些信息。如果必要,可對問題作出進一步的簡化或提出進一步的假設。
(六)模型分析:對所得到的信息進行分析,形成判斷,特別要注意當數據變化時所得結果是否穩定。
(七)結果檢驗:分析所得結果的實際意義,與實際情況進行比較,看是否符合實際,如果不夠理想,應該修改、補充假設,或重新建模。
(八)撰寫論文:在上述基礎上形成論文,論文應包括問題的闡述、假設的敘述、模型構建的過程、模型求解結果、主要結論以及對結論的評價。
三、統計建模論文的基本內容
提交的論文應包括三個部分:
(一)標題、摘要部分
題目——寫出較確切的題目
摘要——200-300字,包括模型的主要特點、建模方法和主要結果。
(二)主體部分
1.問題提出,問題分析。
2.模型建立:
(1)提出假設條件,明確概念,引進參數;
(2)模型構建;
(3)模型求解。
3.計算方法設計和計算機實現。
4.主要的結論或發現。
5.結果分析與檢驗。
6.討論——模型的優缺點,結果的意義。
7.參考文獻。
(三)附錄部分
計算程序,框圖。
各種求解演算過程,計算中間結果。
各種圖形、表格。
所謂難者不易,易者不難,每個確切的標准,不好評判一二。不過,可以肯定的是,學之則易,不學則難。望勉之。
C. 數學建模中量化分析模型怎麼建立
用以下幾種方法的一種或幾種結合使用:濕法分析直讀光譜(OES),電感耦合等離子體放射光譜(ICP-AES),電感耦合等離子體質譜儀(ICP-MS),原子吸收光譜(AAS)。
量化模型,是把數理統計學應用於科學數據,以使數理統計學構造出來的模型得到經驗上的支持,並獲得數值結果。這種分析是基於理論與觀察的並行發展,而理論與觀測又通過適當的推斷方法而得以聯系。
如果把證券市場看作一個病人的話,每個投資者就是醫生。但中醫與西醫的診療方法不同,中醫是望、聞、問、切,最後判斷出的結果,很大程度上基於中醫的經驗,定性程度上大一些;西醫就不同了,先要病人去拍片子、化驗等,這些都要依託於醫學儀器,最後得出結論,對症下葯。
量化投資更像是西醫,依靠模型判斷,模型對於定量投資者的作用就像CT機對於醫生的作用。在每一天的投資運作之前,投資者會先用模型對整個市場進行一次全面的檢查和掃描,然後根據檢查和掃描結果做出投資決策。
被尊為「股神」的沃倫.巴菲特,他在過去的40年間,平均每年的收益率21%左右,而期間標准普爾500指數年均增長率是10%左右,他的收益只是指數的二倍。
因為他注重的是長線操作的定性投資,只靠個人的經驗和智慧來判斷買賣股票。而美國對沖基金經理、哈佛大學數學教授詹姆斯.西蒙斯,他所管理的大獎章基金是從1989年到2006年的17年間,平均每年的收益率到了38.5%,是股神巴菲特的近2倍。