卡方檢驗(Chi-Squared Test)
卡方檢驗屬於非引數檢驗,由於非參檢驗不存在具體引數和總體正態分佈的假設,所以有時被稱為
自由分佈檢驗
。
引數和非引數檢驗
最明顯的區別
是它們使用
資料的型別
。
非參檢驗通常將被試分類,如民主黨和共和黨,這些分類涉及名義量表或順序量表,無法計算平均數和方差。
卡方檢驗分為
擬合度的卡方檢驗
和
卡方獨立性檢驗
。
我們用幾個例子來區分這兩種卡方檢驗:
對於可口可樂公司的兩個領導品牌,大多數美國人喜歡哪一種?
公司採用了新的網頁頁面B,相較於舊版頁面A,網民更喜歡哪一種頁面?
以上兩個例子屬於擬合度的卡方檢驗,原因在於它們都是有關總體比例的問題。我們只是將個體分類,並想知道每個類別中的總體比例。它檢驗的內容僅涉及
一個因素多項分類
的
計數資料
,檢驗的是單一變數在多項分類中實際觀察次數分佈與某理論次數是否有顯著差異。
擬合度的卡方檢驗
定義
:
主要使用樣本資料檢驗總體分佈形態或比例的假說。測驗決定所獲得的的樣本比例與虛無假設中的總體比例的擬合程度如何。
擬合度的卡方檢驗又叫最佳擬合度的卡方檢驗,
為何取名“最佳擬合”?
這是因為最佳擬合度的卡方檢驗的目的是比較資料(實際頻數)與虛無假設。確定資料如何擬合虛無假設指定的分佈,因此取名“最佳擬合”。
關於擬合度的卡方檢驗有一些翻譯上的區別,其實表達的是一個意思:
擬合度的卡方檢驗
=
卡方擬合優度檢驗
=
最佳擬合度卡方檢驗
以下統稱:卡方擬合優度檢驗
卡方統計的公式:
公式中O代表observation,即實際頻數;E代表Expectation,即期望頻數。
為什麼要在求和之前除以 #FormatImgID_2# ?
原因:
與
的差距是相對較大還是較小,取決於期望頻數的大小
舉例:我們準備在週末舉辦一個派對,並預期有1000個客人。實際來參加派對的人數為1040人。當我們計劃接待1000人時,比預期多40個人並不是什麼大問題,大家可能仍然有足夠的啤酒和薯片。另一種情況,假設我們預期派對有10人出席,而實際上來了50人。在這種情況下,多出來的40個客人將會導致大麻煩,因為實際人數是預期人數的5倍,我們可能並沒有足夠的食物提供。
因此,差異如何顯著取決於你原先的預期。
擬合優度檢驗中
自由度
為:
k-1
,k代表分類變數數
當期望次數並不假定是均勻分佈時,也可以採用擬合優度檢驗。
卡方擬合優度檢驗在R中的實現
我們用上面的一個例子來實踐,假設有一個數據集包含60名被試對新舊版網頁的喜好選擇。是否網民更喜歡新網頁的佈局?
:在一般總體中,網民對新舊網頁沒有特定的偏愛。
:在一般總體中,網民更偏愛新網頁的佈局。
head(prefsAB)
Subject Pref
1 1 B
2 2 B
3 3 B
4 4 B
5 5 B
6 6 B
summary(prefsAB)
Subject Pref
1 : 1 A:14
2 : 1 B:46
3 : 1
4 : 1
5 : 1
6 : 1
(Other):54
資料包含兩列,第一列為被試,第二列為喜好(A為舊版頁面,B為新版頁面)
選擇A的共有14人,選擇B的共有46人。
用條形圖檢視,可以看出更多的被試偏愛新網頁(B)的佈局
plot(prefsAB$Pref)
採用xtabs生成頻數表
prfs = xtabs( ~ Pref, data=prefsAB)
prfs
Pref
A B
14 46
進行卡方擬合優度檢驗
chisq。test(prfs)
Chi-squared test for given probabilities
data: prfs
X-squared = 17。067, df = 1, p-value = 3。609e-05
p值小於0。05,拒絕原假設H0,被試對新網頁有著顯著的偏愛。
如何報告卡方值
APA為在科學雜誌上報告卡方統計指定了具體的格式。
被試對新舊網頁佈局的喜好有著顯著的不同,新網頁更受到偏愛,
卡方符號後的括號中包含自由度以及樣本大小n
卡方獨立性檢驗
卡方獨立性檢驗是用於
兩個或兩個以上因素多項分類
的
計數資料
分析,即研究兩類變數之間(以
列聯表形式
呈現)的關聯性和
依存性
,或相關性、
獨立性
、互動作用性。
卡方獨立性檢驗的虛無假設指所測量的兩個變數之間是獨立的,即對於每個個體,所得到的一個變數值與另一個變數的值是不相關的。
同樣,我們透過例子來區分卡方獨立性檢驗和卡方擬合優度檢驗
Example:研究人員正在研究學習成績和自尊之間的關係。樣本為n=150名10歲的兒童,每名被試均根據學習成績和自尊水平分類。下表顯示了該例中的頻率分佈和實際頻數。
可以看出兩種不同的卡方檢驗中,一種用於不同水平的單一分類變數,另一種用於不同水平的多類別變數。
在上例中,存在兩個分類變數(學習成績、自尊),每個變數含有不同水平(學習成績有高低兩個水平、自尊有高中低三個水平)。而在卡方擬合優度的例子中,我們只有一個分類變數(網頁),該變數含有新舊兩個水平。
卡方獨立性檢驗的公式和卡方擬合優度相同,自由度為:
其中,R為行數row,C為列數column
卡方獨立性檢驗在R中的實現
我們使用
vcd
包中的
Arthritis
資料集。該資料來自
Kock & Edward (1988)
,是一項風溼關節炎新療法的雙盲臨床實驗結果。
library(vcd)
head(Arthritis)
ID Treatment Sex Age Improved
1 57 Treated Male 27 Some
2 46 Treated Male 29 None
3 77 Treated Male 30 None
4 17 Treated Male 32 Marked
5 36 Treated Male 46 Marked
6 23 Treated Male 58 Marked
資料中的變數包含:
被試號(ID)
治療情況(Treatment):安慰劑治療(Placebo)、用藥治療(Treated)
性別:男性(Male)、女性(Female)
年齡(Age)
改善情況:無改善(None)、一定程度的改善(Some)、顯著改善(Marked)
2-4均為計數資料,在R語言中稱為類別型因子(factor)
我們想知道治療情況和改善情況是否相關或獨立
生成列聯表
mytable <- xtabs(~Treatment+Improved, data = Arthritis)
mytable
Improved
Treatment None Some Marked
Placebo 29 7 7
Treated 13 7 21
進行卡方獨立性檢驗
chisq。test(mytable)
Pearson‘s Chi-squared test
data: mytable
X-squared = 13。055, df = 2, p-value = 0。001463
患者接受的治療和改善水平看上去存在某種關係(
)
這裡的
p值表示從總體中抽取的樣本行變數與列變數時相互獨立的機率
,由於p的機率值很小,所以我們拒絕了治療型別和治療結果相互獨立的原假設。
卡方檢驗與曼-惠特尼檢驗、威爾克松檢驗、克-瓦氏檢驗的關係
很多人會把這些檢驗名稱搞混淆,它們的
聯絡
是:
都屬於非引數檢驗。
區別
是:
卡方檢驗適用於名義量表,而曼-惠特尼、威爾克松、克-瓦氏適用於順序量表;
曼-惠特尼用於比較兩個獨立樣本,對應引數檢驗中的獨立樣本t檢驗;
威爾克松用於比較兩個相關樣本,對應引數檢驗中的相關樣本t檢驗;
克-瓦氏用於比較兩個或兩個以上獨立樣本,對應引數檢驗中的F檢驗。
卡方擬合優度檢驗與單樣本t檢驗的關係
這兩項檢驗都是試圖利用一個單一樣本的資料檢驗一個單一總體的假設。
決定使用卡方擬合優度還是單樣本t的主要因素在於:測量每名被試獲得的資料型別。如果是等距或等比資料,則適合採用單樣本t檢驗。
Example1:研究人員測量一個登記選民樣本中每個個體的IQ,然後t檢驗可以用來評估整個登記選民總體的IQ均值。
Example2:研究人員把已登記的選民樣本按性別歸類,然後計算男性和女性的人數。這時候,卡方檢驗適合評估有關總體比例的假設。
E1和E2採用不同方法的原因在於IQ是連續變數,而性別是計數變數。
結果的視覺化
一維頻數
(卡方擬合優度)的視覺化採用
條形圖、餅圖
餅圖可直接使用
pie
函式繪製
條形圖
餅圖
多維變數
的視覺化採用
馬賽克圖、關聯圖
在馬賽克圖(mosaic plot)中,巢狀矩形面積正比於單元格頻率,其中該頻率即多維列聯表中的頻率。
1912年4月14日23時40分左右,泰坦尼克號與一座冰山相撞,造成右舷船艏至船中部破裂,五間水密艙進水。次日凌晨2時20分左右,泰坦尼克船體斷裂成兩截後沉入大西洋底。
我們以
泰坦尼克號資料集(Titanic)
為例,它包含:
存活或死亡的乘客數Survived-No/Yes
乘客的船艙等級Class(一等1st、二等2nd、三等3rd和船員Crew)
性別(男性Male、女性Female)
年齡層(兒童Child、成人Adult)
生成列聯表
ftable(Titanic)
Survived No Yes
Class Sex Age
1st Male Child 0 5
Adult 118 57
Female Child 0 1
Adult 4 140
2nd Male Child 0 11
Adult 154 14
Female Child 0 13
Adult 13 80
3rd Male Child 35 13
Adult 387 75
Female Child 17 14
Adult 89 76
Crew Male Child 0 0
Adult 670 192
Female Child 0 0
Adult 3 20
使用
vcd
包中的
mosaic
函式繪製馬賽克圖
mosaic(Titanic, shade = TRUE, legend = TRUE)
# shade=TRUE 將根據擬合模型的皮爾遜殘差值對圖形上色
# legend=TRUE 將顯示殘差圖例
按船艙等級、乘客性別和年齡層繪製的泰坦尼克號倖存者的馬賽克圖
該圖可以展示三個變數之間的關係
可以將整個圖分為4大塊,分別是一等艙、二等艙、三等艙與船員;
每一大塊又分為8小塊,上方4小塊與下方4小塊,上下之分根據年齡層劃分,上方為兒童,下方為成人;
上下方4小塊的前2塊為男性,後2塊為女性;
上下方4小塊的第1、3塊為死亡,2、4塊為倖存。
圖中包含大量資訊:
從船員到頭等艙,存活率陡然提高;
大部分兒童處於三等艙和二等艙;
頭等艙中的大部分女性都存活了下來(如Rose活了下來),而三等艙只有一半女性存活;
船員中女性很少;
一等艙中沒有兒童;
從三等艙到一等艙,總人數依次遞減,而船員人數最多;
從一等艙到三等艙,女性比例依次遞減。
參考文獻:
Gravetter, F。 J。, & Wallnau, L。 B。 (2010)。 Essentials of Statistics for the Behavioral Sciences (PSY 200 (300) Quantitative Methods in Psychology)。 Boston: Cengage Learning。
Kabacoff, R。 (2015)。 R in Action: Data Analysis and Graphics with R: Manning Publications Co。
Koch, G。 & S。 Edwards。 1988。 “Clinical Efficiency Trials with Categorical Data。” In Statistical Analysis with Missing Data, 2nd ed。, by R。J。A。 Little & D。 Rubin。 Hoboken, NJ:John Wiley & Sons, 2002