在前幾期的文章中,我們分別介紹了 t 檢定 、變異數分析 (ANOVA) 等用於組間均值比較的方法。今天的文章,本文主要來介紹何謂卡方檢定以及卡方檢定如何用於組間比較。
什麼是卡方檢定?
據維基百科解釋,卡方檢定(Chi-Squared Test) 常用於組間率或比例比較,是一種統計量的分布在虛無假說成立時近似服從卡方分布的假說檢定 。在沒有其他的限定條件或說明時,卡方檢定一般代指的是皮爾森卡方檢定。
在使用卡方檢定前,有兩點需要注意:
1. 卡方檢定僅適用於結局為二分類或無序多分類的變數;如果結局是等級資料,通常不會使用卡方檢定,而是用秩和檢定,詳細使用方式我們將會在接下來的系列文章再介紹。
2. 卡方檢定除了能用於率或比例的比較,還經常用於擬合優度檢定,比較實際值與理論值(或預測值)的差異,所以常用於檢定某一樣本是否滿足特定分佈、某一模型的預測效果好不好等。
常用於卡方檢定的五大場景
何時會需要用到卡方檢定,以下列出實際常見的六種情形:
- 兩組或多組率的比較,即結局是二分類變數(如死亡和存活、陰性和陽性等),這種情況下,直接用卡方檢定即可。
- 兩組或多組比例的比較,通常結局是無序多分類變數(如疾病的亞型等),這種情況下,也可以直接用卡方檢定。不過,如果樣本數太少(一般認為小於40就算太少),通常組間率或比例的比較不直接用卡方檢定,而是建議用 Fisher 確切檢定。
- 多組率或比例的比較。如果有統計學差異,還想進一步作兩兩比較的話,常用Bonferroni法校正檢定水準。如A、B、C三組進行兩兩比較,共需比較3次,則可分別對A和B、A和C、B和C執行卡方檢定,但是檢定水準不是0.05,而是0.05/3=0.0167,即三次比較以P<0.0167認為有統計學差異。
- 多組率的比較,如果分組變數有等級順序,還可以考慮進行趨勢卡方檢定,觀察率是否隨著分組等級的增加而增加。
- 如果是配對設計,需要考慮配對卡方檢定,這時的結果結論與普通的卡方檢定不同。
卡方檢定:兩組率的比較
我們將使用圖1所示的OSAS資料進行講解。圖1資料中,擬比較肥胖人群和正常人群的OSAS發生率是否有差異。分組指標和結局指標均為分類變數,因此採用卡方檢定。
圖1 OSAS數據
選擇JMP功能表「分析→以X擬合Y」(圖2),進入組間比較的介面。本例中肥胖為分組,OSAS為結果,所以在對話方塊中將「肥胖」放入「X,因數」,「OSAS」放入「Y,回應」(圖3)。
圖2 卡方檢定操作——功能表選擇
圖3 卡方檢定操作——變數選擇
JMP軟體自動輸出的結果包括三部分結果:馬賽克圖、列聯表和卡方檢定結果。
我們來一一解讀這些結果。
1. 馬賽克圖
第一部分是馬賽克圖(圖4),通過圖形直觀呈現各組人群的占比,橫縱坐標總長度均代表100%。圖4中橫軸代表是否肥胖,縱軸代表是否發生OSAS,右側圖例可知紅色代表發生OSAS,藍色代表不發生OSAS(正常)。
從該圖的橫坐標可以看出:體重正常組的人數更多,約為肥胖組的二倍。
從縱坐標可以看出:肥胖者發生OSAS的比例更高(肥胖組比正常組的紅色區域高),但該差異是否有統計學意義,還需參考卡方檢定的結果進行判斷。
圖4 卡方檢定結果——馬賽克圖
2. 列聯表
第二部分是列聯表,列聯表中每個格子有4行資料,表格左上方的表頭給出了這4行資料的含義,它們分別為計數、合計百分比、列百分比和行百分比。
圖5 卡方檢定結果——列聯表
3. 卡方檢定統計分析結果
第三部分為卡方檢定統計分析結果,結果包括似然比卡方、Pearson卡方和Fisher確切檢定三個部分(圖6)。實際中通常用Pearson卡方檢定結果,但如果例數小於40或有理論頻數小於5甚至小於1,一般建議選擇Fisher確切檢定結果。
圖6 卡方檢定結果——卡方檢定統計分析結果
本例樣本數較多,一般選擇Pearson卡方即可。當然為了嚴謹起見,我們仍看一下理論頻數情況。點擊列聯表旁邊的紅色三角形按鈕,在下拉式功能表中選擇期望值(圖7),即可得到每個格子的理論頻數,即圖8中箭頭所示位置。
圖7 卡方檢定操作——輸出理論頻數
圖8 卡方檢定結果——理論頻數結果
可以看出,所有格子的理論頻數均大於5,因此選擇Pearson卡方結果即可,結果表明肥胖與正常人群的OSAS發生率有統計學差異(Pearson=5.970,P=0.0146)(圖6)。
圖9 卡方檢定結果——卡方檢定統計分析結果
卡方檢定:多組率的比較
我們將繼續基於圖1所示的OSAS資料進行講解,在圖1資料中,擬比較扁桃體大小不同的患者的OSAS發生率是否有差異。
本例中結局指標為OSAS,屬於二分類變數;分組指標為扁桃體大小,分為<2,=2和>2三類,屬於多分類變數。首先進行卡方檢定,操作同上,結果見下圖10。
圖10 卡方檢定結果
圖10中的列聯表顯示,研究例數>40且所有格子的理論頻數(期望值)均大於5,因此選擇Pearson結果,扁桃體大小不同的患者OSAS發生率的差異有統計學意義(Pearson=6.305,P=0.0428)。
上述結果只是表明三組之間的OSAS發生率有統計學差異,但具體是哪兩組之間存在差異,還需進一步進行組間兩兩比較。
對於分類資料,JMP程式無法直接給出兩兩比較結果,需要採用Bonferroni法對檢定水準進行校正。然後對其中的任意兩組進行卡方檢定,與校正後的檢定水準進行比較。本例總計進行3次兩兩比較,則校正後的檢定水準為:
也就是說,兩兩比較時,P值小於0.0167才算差異有統計學意義。兩兩比較比較的結果如圖11所示。結果表明,小於2 vs 大於2的P值小於0.0167,具有統計學意義,其餘組無統計學意義。
圖11 兩兩比較結果
綜上,統計分析顯示肥胖人群和正常人群的OSAS發生率有統計學差異,扁桃體大小小於2和大於2的人群的OSAS發生率有統計學差異,其餘組間差異無統計學意義。
卡方檢定:兩組或多組比例的比較
兩組/多組比例的比較,其思路和JMP軟體實現過程,完全與兩組/多組率的比較一致。只是解釋不同,組間的比例如果有統計學差異,說明組間的分佈不同。同樣,如果多組間比例的比較有統計學差異,也可以執行兩兩比較,思路與多組率的兩兩比較相同。
以上就是今天的分享。在此系列的下篇文章中,我們將介紹卡方檢定的延伸—等級資料秩和檢定、趨勢卡方和配對卡方檢定。若想知道更多JMP深入應用,歡迎加入JMP LINE官方帳號,定期獲得實用的JMP操作技巧與線上課程資訊!
原文:干货 | 卡方检验——分类资料组间比较的神器
統計方法分析文章推薦:
秩和檢定與兩兩比較的思考脈絡與分析方法
一文學會3種常用的t檢定 - 獨立樣本t檢定、單樣本t檢定和配對t檢定
在JMP中進行常態檢定與變異數同質性檢定
變異數分析 (ANOVA) 與兩兩比較的思考脈絡與分析方法
You must be a registered user to add a comment. If you've already registered, sign in. Otherwise, register and sign in.