SPSS教程:分層卡方檢驗(各層的OR值如何計算?咋報告結果?)
提到卡方檢驗,相信很多小夥伴一定會覺得這還不簡單,不就是率的比較嘛,只要是看到分類變數,就直接用卡方檢驗,拿SPSS兩三下算出結果,得出
P
<0。05,然後心裡還美美的,順便玩一把王者農藥犒勞一下自己。
不過,當你努力打著排位賽,試著提升自己段位時,倒不如花一點時間,跟著小咖一起學習一點有趣的統計知識,讓自己在
統計學
的大坑裡,也能夠不斷掌握經驗,提升等級,相信也會是一個還不錯的選擇。
好了,今天的話題我們還是繼續討論一下最簡單的卡方檢驗,我們在前期推送過一篇文章《觀察性研究控制混雜因素第一彈:分層分析》,在文中講到分層分析是一種常用的控制混雜因素的方法,它將資料資料根據混雜因素進行分層,然後計算各層內的OR值:
如果層間OR值不一致,則說明分層因素可能存在混雜作用,需要分開報告OR值;如果層間OR值同質,則可以將OR值進行合併,從而計算調整後的OR值。
針對這個問題,有小夥伴在留言中問到,
如何判斷層間OR值是否一致呢?
是否有相關的統計學方法來進行檢驗呢?如果層間OR值同質,又該
如何計算合併的OR值呢
?這個時候,卡方檢驗家族就要派“分層卡方檢驗”上場了,本期內容就來向大家進行詳細介紹。
分層卡方檢驗
分層卡方檢驗,也稱為Cochran-Mantel-Haenszel檢驗(CMH檢驗),它主要用於上述的分層分析中,也就是在研究暴露/處理因素和結局事件關聯性的基礎上,考慮了分層因素的混雜作用。
CMH檢驗透過對分層因素進行控制,從而考察調整之後暴露/處理因素與結局事件之間的關聯性。實際上CMH檢驗,已經不再是單純的單因素分析,而是已經開始融入了多因素分析的思維模式,應該算作為一種最為簡單的多因素分析方法。
研究例項
舉一個例子吧,小咖同學擬探討吸菸對某疾病發生風險的影響,共納入了350名研究物件,並記錄了他們的疾病狀態、吸菸、性別等資訊。
小咖首先對吸菸因素和疾病之間的關聯性進行了卡方檢驗,其結果顯示Pearson χ2=3。607,
P
=0。058,OR=1。701,95% CI為0。980-2。953,無統計學顯著性,可認為吸菸對於該疾病的發生風險並無影響。
(想知道如何計算OR值?請檢視:
SPSS詳細教程:OR值的計算
)
沒有得出陽性結果的小咖很不開心,但小咖發現卡方檢驗的
P
值已經很接近0。05了,而且OR>1,傾向於認為吸菸是一個危險因素。於是小咖又重新對資料進行了一番審查,結果發現在男性和女性中,吸菸人群所佔的比例存在著較大的差異,其中男性吸菸者為49。6%,女性吸菸者為18。4%,兩組相比差異具有統計學顯著性(
P
<0。001)。
小咖判斷,性別可能為一個混雜因素,影響了初步分析時吸菸對該疾病的整體效應,因此小咖決定
把性別作為一個分層因素,採用分層卡方檢驗
,來分析不同性別分層下,吸菸因素對於該疾病發生風險的影響。
SPSS操作
點選Descriptive Statistics → Crosstabs
在Crosstabs對話方塊中,將Disease選入行變數Row(s)框中,將Smoke選入列變數Column(s)框中,
將分層因素Gender選入Layer框中作為分層依據
。
如果需要同時控制多個分層因素時,可以點選Next,將下一個分層因素選入框中,SPSS允許最多設定8層。
點選Statistics,勾選Chi-square、Risk和Cochran’s and Mantel-Haenszel statistics,點選Continue返回,點選OK完成操作。
結果解讀
1.
在
Chi-square Tests
卡方檢驗的表中,分別給出了男性(Male)、女性(Female)和總體人群卡方檢驗的結果。
對於男性,Pearson χ2=8。433,
P
=0。004,OR=2。769,95% CI為1。368 - 5。607,有統計學顯著性,提示在男性中,吸菸是該疾病的一個危險因素。
對於女性,Pearson χ2=0。966,
P
=0。326,OR=0。463,95% CI為0。097-2。214,無統計學顯著性,提示在女性中,吸菸對該疾病的發生沒有影響。
2. Test of Homogeneity of Odds Ratio
,即對不同分層下OR值是否一致進行檢驗,也稱為OR值同質性檢驗。表格中輸出了兩種同質性檢驗方法的統計量及其檢驗結果,Breslow-Day方法 χ2=4。624,
P
=0。032,Tarone‘s 方法 χ2=4。617,
P
=0。032。兩種方法都顯示
P
<0。05,提示按照性別分層後,層間的OR值存在著一定的異質性。
3. Tests of Conditional Independence
,即分層卡方檢驗的結果,其行變數和列變數分別為疾病和
暴露因素
,其假設檢驗為“病例組和
對照組
的暴露因素的比例是否有差異”。
表格中輸出了兩種方法的統計量,Cochran’s 方法 χ2=4。599,
P
=0。032,Mantel-Haenszel 方法 χ2=3。960,
P
=0。047,前者是後者的改進,兩種方法都顯示
P
<0。05,提示在考慮了性別的分層因素影響後,吸菸因素與該疾病的發生風險有關。注意,此時卡方值的大小隻能推斷有無關聯,但並不能表示關聯的程度。
4. Mantel-Haenszel Common Odds Ratio Estimate
,即估計的合併OR值,是在上述Test of Homogeneity of Odds Ratio結果認為各層OR值同質的前提下,進一步去估算其合併的關聯強度,SPSS使用Woolf法去檢驗OR值有無統計學顯著性,其假設檢驗應該為“OR值是否等於1”。
本例結果顯示,在控制了
性別分層因素
的影響後,吸菸因素對於該疾病的發生風險是一個危險因素,其合併OR=1。935,95% CI為1。065-3。519,Woolf法計算的
P
值為0。030。
但是,
需要注意的是
,在本例中,Test of Homogeneity of Odds Ratio的結果顯示層間OR值存在一定異質性,因此此時不宜合併OR值,建議分層報告;若層間OR值一致,則可以報告最後合併的OR值。
撰寫結論
1. 若層間OR值不同質,則分層報告結果,結果描述如下:
Test of Homogeneity of Odds Ratio結果顯示
P
<0。05,提示層間的OR值具有異質性,此時不宜合併OR值。因此在按照性別進行分層後,在男性中,吸菸是該疾病發生的一個危險因素,OR=2。769,95% CI為1。368-5。607,
P
=0。004,即吸菸者該疾病的發生風險為非吸菸者的2。769倍;而在女性中,吸菸對該疾病的發生沒有影響,OR=0。463,95% CI為0。097-2。214,
P
=0。326。
2. 若層間OR值同質,則結果描述如下
:(本例研究不適用於此種情況,此處僅為舉例說明)
Test of Homogeneity of Odds Ratio結果提示層間的OR值具有同質性(
P
>0。05),因此在控制了性別分層因素的影響後,吸菸因素對於該疾病的發生是一個危險因素,其合併OR=1。935,95% CI為1。065-3。519,
P
=0。047。
注意
:對於前述“3。 分層卡方檢驗結果”和“4。 基於Mantel-Haenszel方法估算的OR值的檢驗結果”,兩者的
P
值在結論上應該是保持一致的。
根據《醫學統計學》(
孫振球
主編)教科書上的介紹,分層分析OR值可採用Mantel-Haenszel方法進行估計,並用Mantel-Haenszel卡方檢驗的χ2統計量直接對OR值進行假設檢驗,同時採用Miettinen法計算OR值的95%可信區間,因此此處可報告Mantel-Haenszel卡方檢驗的
P
值0。047。
而SPSS採用的是Woolf法計算OR值的95%可信區間,並對其進行檢驗,此時
P
=0。030。由於兩者計算方法不同,因此P值的大小稍有差異,但其結論是一致的。
需要原資料進行練習的小夥伴點選下方網址,進入醫咖會官網下載