cancel
Showing results for 
Show  only  | Search instead for 
Did you mean: 
認識卡方檢定:分類資料組間比較的分析神器

在前幾期的文章中,我們分別介紹了 t 檢定 、變異數分析 (ANOVA) 等用於組間均值比較的方法。今天的文章,本文主要來介紹何謂卡方檢定以及卡方檢定如何用於組間比較。 

什麼是卡方檢定?

據維基百科解釋,卡方檢定(Chi-Squared Test) 常用於組間率或比例比較,是一種統計量的分布在虛無假說成立時近似服從卡方分布假說檢定 在沒有其他的限定條件或說明時,卡方檢定一般代指的是皮爾森卡方檢定

 

在使用卡方檢定前,有兩點需要注意:

1. 卡方檢定僅適用於結局為二分類或無序多分類的變數;如果結局是等級資料,通常不會使用卡方檢定,而是用秩和檢定,詳細使用方式我們將會在接下來的系列文章再介紹。

2. 卡方檢定除了能用於率或比例的比較,還經常用於擬合優度檢定,比較實際值與理論值(或預測值)的差異,所以常用於檢定某一樣本是否滿足特定分佈、某一模型的預測效果好不好等。

 

常用於卡方檢定的五大場景

何時會需要用到卡方檢定,以下列出實際常見的六種情形:

  • 兩組或多組率的比較,即結局是二分類變數(如死亡和存活、陰性和陽性等),這種情況下,直接用卡方檢定即可。
  • 兩組或多組比例的比較通常結局是無序多分類變數(如疾病的亞型等),這種情況下,也可以直接用卡方檢定。不過,如果樣本數太少(一般認為小於40就算太少),通常組間率或比例的比較不直接用卡方檢定,而是建議用 Fisher 確切檢定
  • 多組率或比例的比較。如果有統計學差異,還想進一步作兩兩比較的話,常用Bonferroni法校正檢定水準。如A、B、C三組進行兩兩比較,共需比較3次,則可分別對A和B、A和C、B和C執行卡方檢定,但是檢定水準不是0.05,而是0.05/3=0.0167,即三次比較以P<0.0167認為有統計學差異。
  • 多組率的比較,如果分組變數有等級順序,還可以考慮進行趨勢卡方檢定,觀察率是否隨著分組等級的增加而增加。
  • 如果是配對設計,需要考慮配對卡方檢定,這時的結果結論與普通的卡方檢定不同。

卡方檢定:兩組率的比較

我們將使用圖1所示的OSAS資料進行講解。圖1資料中,擬比較肥胖人群和正常人群的OSAS發生率是否有差異。分組指標和結局指標均為分類變數,因此採用卡方檢定。

 

Michelle_Wu_0-1639113066506.jpeg

圖1 OSAS數據

 

選擇JMP功能表「分析→以X擬合Y」(圖2),進入組間比較的介面。本例中肥胖為分組,OSAS為結果,所以在對話方塊中將「肥胖」放入「X,因數」,「OSAS」放入「Y,回應」(圖3)。

 

Michelle_Wu_1-1639113066508.jpeg

圖2 卡方檢定操作——功能表選擇

 

Michelle_Wu_2-1639113066512.jpeg

圖3 卡方檢定操作——變數選擇

 

JMP軟體自動輸出的結果包括三部分結果:馬賽克圖、列聯表和卡方檢定結果。

我們來一一解讀這些結果。

 

1. 馬賽克圖

第一部分是馬賽克圖(圖4),通過圖形直觀呈現各組人群的占比,橫縱坐標總長度均代表100%。圖4中橫軸代表是否肥胖,縱軸代表是否發生OSAS,右側圖例可知紅色代表發生OSAS,藍色代表不發生OSAS(正常)。

 

從該圖的橫坐標可以看出:體重正常組的人數更多,約為肥胖組的二倍。

 

從縱坐標可以看出:肥胖者發生OSAS的比例更高(肥胖組比正常組的紅色區域高),但該差異是否有統計學意義,還需參考卡方檢定的結果進行判斷。

 

Michelle_Wu_3-1639113066513.png

圖4  卡方檢定結果——馬賽克圖

 

2. 列聯表

第二部分是列聯表,列聯表中每個格子有4行資料,表格左上方的表頭給出了這4行資料的含義,它們分別為計數、合計百分比、列百分比和行百分比。

 

Michelle_Wu_4-1639113066514.jpeg

圖5  卡方檢定結果——列聯表

 

3. 卡方檢定統計分析結果

第三部分為卡方檢定統計分析結果,結果包括似然比卡方、Pearson卡方和Fisher確切檢定三個部分(圖6)。實際中通常用Pearson卡方檢定結果,但如果例數小於40或有理論頻數小於5甚至小於1,一般建議選擇Fisher確切檢定結果。

 

Michelle_Wu_5-1639113066516.jpeg

圖6  卡方檢定結果——卡方檢定統計分析結果

 

本例樣本數較多,一般選擇Pearson卡方即可。當然為了嚴謹起見,我們仍看一下理論頻數情況。點擊列聯表旁邊的紅色三角形按鈕,在下拉式功能表中選擇期望值(圖7),即可得到每個格子的理論頻數,即圖8中箭頭所示位置。

 

Michelle_Wu_6-1639113066521.jpeg

圖7  卡方檢定操作——輸出理論頻數

 

Michelle_Wu_7-1639113066523.jpeg

圖8   卡方檢定結果——理論頻數結果

 

可以看出,所有格子的理論頻數均大於5,因此選擇Pearson卡方結果即可,結果表明肥胖與正常人群的OSAS發生率有統計學差異(Pearson=5.970,P=0.0146)(圖6)。

 

Michelle_Wu_8-1639113066525.jpeg

圖9 卡方檢定結果——卡方檢定統計分析結果

卡方檢定:多組率的比較

我們將繼續基於圖1所示的OSAS資料進行講解,在圖1資料中,擬比較扁桃體大小不同的患者的OSAS發生率是否有差異。

 

本例中結局指標為OSAS,屬於二分類變數;分組指標為扁桃體大小,分為<2,=2和>2三類,屬於多分類變數。首先進行卡方檢定,操作同上,結果見下圖10。

 

Michelle_Wu_9-1639113066528.jpeg

圖10 卡方檢定結果

 

圖10中的列聯表顯示,研究例數>40且所有格子的理論頻數(期望值)均大於5,因此選擇Pearson結果,扁桃體大小不同的患者OSAS發生率的差異有統計學意義(Pearson=6.305,P=0.0428)。

 

上述結果只是表明三組之間的OSAS發生率有統計學差異,但具體是哪兩組之間存在差異,還需進一步進行組間兩兩比較。

 

對於分類資料,JMP程式無法直接給出兩兩比較結果,需要採用Bonferroni法對檢定水準進行校正。然後對其中的任意兩組進行卡方檢定,與校正後的檢定水準進行比較。本例總計進行3次兩兩比較,則校正後的檢定水準為:

 

Michelle_Wu_10-1639113066528.jpeg

 

 

也就是說,兩兩比較時,P值小於0.0167才算差異有統計學意義。兩兩比較比較的結果如圖11所示。結果表明,小於2 vs 大於2的P值小於0.0167,具有統計學意義,其餘組無統計學意義。

 

Michelle_Wu_11-1639113066530.jpeg

圖11 兩兩比較結果

 

綜上,統計分析顯示肥胖人群和正常人群的OSAS發生率有統計學差異,扁桃體大小小於2和大於2的人群的OSAS發生率有統計學差異,其餘組間差異無統計學意義。

 

卡方檢定:兩組或多組比例的比較

兩組/多組比例的比較,其思路和JMP軟體實現過程,完全與兩組/多組率的比較一致。只是解釋不同,組間的比例如果有統計學差異,說明組間的分佈不同。同樣,如果多組間比例的比較有統計學差異,也可以執行兩兩比較,思路與多組率的兩兩比較相同。

 

以上就是今天的分享。在此系列的下篇文章中,我們將介紹卡方檢定的延伸—等級資料秩和檢定、趨勢卡方和配對卡方檢定。若想知道更多JMP深入應用,歡迎加入JMP LINE官方帳號,定期獲得實用的JMP操作技巧與線上課程資訊!

 

Michelle_Wu_0-1639120076429.png

 

 

原文:干货 | 卡方检验——分类资料组间比较的神器

 

統計方法分析文章推薦:

秩和檢定與兩兩比較的思考脈絡與分析方法

一文學會3種常用的t檢定 - 獨立樣本t檢定、單樣本t檢定和配對t檢定

在JMP中進行常態檢定與變異數同質性檢定

變異數分析 (ANOVA) 與兩兩比較的思考脈絡與分析方法

 

Last Modified: Dec 19, 2023 3:36 PM