A. 請問如何幫excel的數據劃分所處的百分位區間,並為其打分
C2公式:
=ROUNDUP(RANK(B2,$B$2:$B$21,1)/COUNT($B$2:$B$21)/0.2,0)
下拉
F2公式:
=ROUNDUP(RANK(E2,$E$2:$E$21)/COUNT($E$2:$E$21)/0.2,0)
下拉
效果見圖:
B. 如何在excel中進行數據分段統計
1、電腦打開Excel。
C. 如何分析數據之間的分布類型
分析數據之間的分布類型的方法:
首先根據樣本點特徵判斷是離散型還是連續型。
離散型分布常用的有二項分布,泊松分布,離散均勻分布,幾何分布,超幾何分布等等。可以根據直方圖判斷大概的分布類型,然後估計相應的分布參數,最後用goodness of fit檢驗。
連續型分布常用的有正態分布,t-分布,F-分布,卡方分布,指數分布,Gamma-分布,Beta-分布等等。同樣根據直方圖判斷大概的分布類型,然後估計相應的分布參數。檢驗部分可用KS檢驗(Kolmogorov-Smirnov檢驗)。
(3)統計學如何對數據分區間擴展閱讀:
統計學常用方法:
一、描述統計
描述統計是通過圖表或數學方法,對數據資料進行整理、分析,並對數據的分布狀態、數字特徵和隨機變數之間關系進行估計和描述的方法。描述統計分為集中趨勢分析和離中趨勢分析和相關分析三大部分。
集中趨勢分析:集中趨勢分析主要靠平均數、中數、眾數等統計指標來表示數據的集中趨勢。例如被試的平均成績多少?是正偏分布還是負偏分布?
離中趨勢分析:離中趨勢分析主要靠全距、四分差、平均差、方差(協方差:用來度量兩個隨機變數關系的統計量)、標准差等統計指標來研究數據的離中趨勢。
相關分析:相關分析探討數據之間是否具有統計學上的關聯性。
推論統計:
推論統計是統計學乃至於心理統計學中較為年輕的一部分內容。它以統計結果為依據,來證明或推翻某個命題。
正態性檢驗:很多統計方法都要求數值服從或近似服從正態分布,所以之前需要進行正態性檢驗。常用方法:非參數檢驗的K-量檢驗、P-P圖、Q-Q圖、W檢驗、動差法。
二、假設檢驗
1、參數檢驗
參數檢驗是在已知總體分布的條件下(一股要求總體服從正態分布)對一些主要的參數(如均值、百分數、方差、相關系數等)進行的檢驗。
1)U驗 :使用條件:當樣本含量n較大時,樣本值符合正態分布。
2)T檢驗 使用條件:當樣本含量n較小時,樣本值符合正態分布。
2、非參數檢驗
非參數檢驗則不考慮總體分布是否已知,常常也不是針對總體參數,而是針對總體的某些一股性假設(如總體分布的位罝是否相同,總體分布是否正態)進行檢驗。
適用情況:順序類型的數據資料,這類數據的分布形態一般是未知的。
A、雖然是連續數據,但總體分布形態未知或者非正態;
B、體分布雖然正態,數據也是連續類型,但樣本容量極小,如10以下;
主要方法包括:卡方檢驗、秩和檢驗、二項檢驗、遊程檢驗、K-量檢驗等。
三、信度分析
介紹:信度(Reliability)即可靠性,它是指採用同樣的方法對同一對象重復測量時所得結果的一致性程度。信度指標多以相關系數表示,大致可分為三類:穩定系數(跨時間的一致性),等值系數(跨形式的一致性)和內在一致性系數(跨項目的一致性)。信度分析的方法主要有以下四種:重測信度法、復本信度法、折半信度法、α信度系數法。
四、相關分析
研究現象之間是否存在某種依存關系,對具體有依存關系的現象探討相關方向及相關程度。
1、單相關: 兩個因素之間的相關關系叫單相關,即研究時只涉及一個自變數和一個因變數;
2、復相關 :三個或三個以上因素的相關關系叫復相關,即研究時涉及兩個或兩個以上的自變數和因變數相關;
3、偏相關:在某一現象與多種現象相關的場合,當假定其他變數不變時,其中兩個變數之間的相關關系稱為偏相關。
五、方差分析
使用條件:各樣本須是相互獨立的隨機樣本;各樣本來自正態分布總體;各總體方差相等。
六、回歸分析
1、一元線性回歸分析:只有一個自變數X與因變數Y有關,X與Y都必須是連續型變數,因變數y或其殘差必須服從正態分布。
2、多元線性回歸分析
使用條件:分析多個自變數與因變數Y的關系,X與Y都必須是連續型變數,因變數y或其殘差必須服從正態分布 。
D. 如何從一組數據確定其分布范圍
將未知量Z對應的列上的數 與 行所對應的數字 結合 查表定位
例如 要查Z=1.96的標准正態分布表
首先 在Z下面對應的數找到1.9
然後 在Z右邊的行中找到6
這兩個數所對應的值為 0.9750 即為所查的值
(4)統計學如何對數據分區間擴展閱讀:
標准正態分布一個在數學、物理及工程等領域都非常重要的概率分布,在統計學的許多方面有著重大的影響力。期望值μ=0,即曲線圖象對稱軸為Y軸,標准差σ=1條件下的正態分布,記為N(0,1)。
標准正態分布又稱為u分布,是以0為均數、以1為標准差的正態分布,記為N(0,1)。
標准正態分布曲線下面積分布規律是:在-1.96~+1.96范圍內曲線下的面積等於0.9500,在-2.58~+2.58范圍內曲線下面積為0.9900。統計學家還制定了一張統計用表(自由度為∞時),藉助該表就可以估計出某些特殊u1和u2值范圍內的曲線下面積。
密度函數關於平均值對稱
平均值與它的眾數(statistical mode)以及中位數(median)同一數值。
函數曲線下68.268949%的面積在平均數左右的一個標准差范圍內。
95.449974%的面積在平均數左右兩個標准差的范圍內。
99.730020%的面積在平均數左右三個標准差的范圍內。
99.993666%的面積在平均數左右四個標准差的范圍內。
函數曲線的反曲點(inflection point)為離平均數一個標准差距離的位置。