㈠ 16種常用的數據分析方法-列聯分析
列聯分析通常用來分析兩個分類變數之間或者一個分類變數與順序變數之間是否存在關聯,關聯的緊密程度如何。
對關聯性問題的處理稱為獨立性檢驗(Test of Independence),通過交叉列聯表和 c2 檢驗進行列聯分析。
交叉列聯表分為二維表與三維表兩種,二維表交叉表可進行卡方檢驗,三維交叉表,可作Mentel-Hanszel分層分析。
列聯表結構
2*2 列聯表
r *c 列聯表
案例
公司在4個不同的地區設有分公司,公司准備進行工資級別調整。採用抽樣調查方式,從4個分公司共抽取420個樣本 (人),了解職工對此調整的看法,交叉統計結果如下:
觀察頻數分布表&百分比分布表的分布
列聯交叉表中的統計值有兩種類型:頻數與百分比,對於兩種類型的分布表,觀察其分布時,要注意:
一、頻數分布表
1、觀察邊緣分布
行邊緣分布:行觀察值的合計數的分布
列邊緣分布:列觀察值的合計數的分布
2、觀察條件分布與條件頻數
變數 X 條件下變數 Y 的分布,或在變數 Y 條件下變數 X 的分布
每個具體的觀察值稱為條件頻數
二、百分比分布
為在相同的基數上進行比較,可以計算相應的百分比,稱為 百分比分布
1、觀察行百分比:行的每一個觀察頻數除以相應的行合計數( fij / ri )
2、觀察列百分比:列的每一個觀察頻數除以相應的列合計數( fij / cj )
3、觀察總百分比:每一個觀察值除以觀察值的總個數( fij / n )
交叉列聯表分析步驟
1.【分析】—【描述統計】—【交叉表】
【精確】
一般情況下,"精確檢驗"(Exact Tests)對話框的選項都默認為系統默認值,不作調整。
【統計量】
【單元格】
【格式】
2.結果分析:
卡方檢驗
a. 16 單元格(100.0%) 的期望計數少於 5。最小期望計數為 .56。
原假設:H0:職稱、學歷兩者相互獨立。
皮爾遜(Pearson)的Chi-Square 值為18.553,自由度為9,
p=.029<0.05,拒絕原假設,即在5%的顯著性水平下不同文化程度對職稱的影響存在著顯著差異。
結論:文化程度越高,職稱越高。