卡方檢定的延伸：等級資料秩和檢定、趨勢卡方和配對卡方

JMP_Taiwan · Dec 10, 2021 08:40 AM

在上篇文章中，我們認識了基本的卡方檢定。至於今天要介紹的文章，則是 Pearson 卡方以外的延伸內容。本篇文章主要介紹三種場景：

用於等級資料組間比較的秩和檢定
用於觀察趨勢變化的趨勢卡方檢定
用於配對資料的配對卡方檢定

用於「兩組或多組等級資料比較」的秩和檢定

上一篇文章已經提到過，如果結局是有序分類資料（等級資料），為了比較兩組或多組等級資料是否有統計學差異，這時一般不用卡方檢定，因為卡方檢定無法表現出等級順序，而是用秩和檢定。

關於秩和檢定，主要是組或多組偏態分佈資料的比較，而不是等級資料。儘管都是秩和檢定，但由於連續資料和等級資料格式不同，在JMP上的操作也有所不同，因此本文重在介紹等級資料的秩和檢定操作。

例1：圖1資料中，想要比較肥胖和不肥胖患者的扁桃體大小是否有差異。資料的分組指標是二分類變數，結局指標則為等級資料。

此時若使用卡方檢定，只能說明組間的構成比是否有統計學差異，若想體現出各組間是否存在程度或等級上的差異，則需採用秩和檢定進行分析。

圖1 OSAS數據

需要注意的是在設置資料格式時，結局指標扁桃體大小需定義為連續型，如圖2所示。

圖2 結局指標的資料類型

在JMP中選擇功能表「分析」→「以X擬合Y」。在彈出的對話方塊中將「肥胖」放入「X，因數」，將「扁桃體大小」放入「Y，回應」。

在結果中，點擊「肥胖-扁桃體大小」單因數分析旁邊的紅色三角形按鈕，在下拉式功能表中選擇「非參數→ Wilcoxon檢定」（圖3）。

圖3 秩和檢定操作——功能表選擇

結果如圖4所示，肥胖患者和不肥胖患者的扁桃體大小的差異無統計學意義（Z= -0.0478，P=0.9619）。

圖4 秩和檢定結果

請注意：如果輸入軟體中的不是圖1這種原始資料形式，而是列聯表形式，這種情況下，通常第1列是分組變數，第2列是結局變數，第3列是頻數，即前兩列組合的例數，資料格式如本文後面的圖8所示。這種情況下，差異性檢定的統計分析操作如圖9所示，在「以X擬合Y」介面中，需要將頻數列拖到「頻數」。

趨勢卡方檢定

趨勢卡方檢定，主要用於分組為有一定順序的多分類變數（如多個年齡組、疾病嚴重程度），結局變數為二分類的率變數，其目的是觀察結局變數的陽性率是否有隨著分組順序增加或減少的趨勢。

例2：在上一篇文章中，我們基於圖1資料比較扁桃體大小不同的患者OSAS發生率是否有差異。結果如圖5所示，扁桃體大小不同的患者OSAS發生率的差異有統計學意義（Pearson=6.305，P=0.0428）。

圖5 比較扁桃體大小不同的患者OSAS發生率——統計結果

本例中分組指標為扁桃體大小，分為<2，=2和>2三類，屬於多分類資料，而且是等級資料。

請注意：這種情況下，如果發現組間有統計學差異，後續至少可以繼續考慮做兩件事情：

考慮是否需要做兩兩比較，以觀察具體哪兩組之間有差異，此內容已在上一篇文章中進行了詳細講解；
考慮陽性率是否有隨著組別順序（如扁桃體逐漸增大）而變化的趨勢，也就是進行趨勢卡方檢定，因為分組是有序多分類，結局是率指標。

點擊「扁桃體大小-OSAS」列聯分析旁邊的紅色三角形按鈕，在下拉式功能表中選擇「Cochran-Armitage趨勢檢定」（圖6），結果見圖7。

圖6 趨勢檢定操作——功能表選擇

Cochran-Armitage 趨勢檢定結果中：

統計量（Z）≤0時，單側P值（概率> Z）給出的是列聯表（圖5）第一列的P值，P值小於0.05則說明第一列結局指標的發生率呈下降趨勢；

當統計量（Z）>0時，單側P值給出的是列聯表（圖5）第二列的P值，P值小於0.05則說明第二列結局指標的發生率呈下降趨勢，也就是說第一列呈上升趨勢。

本例中Z值大於0，提示第一列（OSAS的發生率）呈上升趨勢（每組OSAS發生率參見列聯表中的行百分比），即OSAS發生率隨著扁桃體大小的增加而增加，這種趨勢有統計學意義（Z= 2.4871，P=0.0064）（圖7）。

圖7 趨勢檢定結果

請注意：本例與例1的不同之處在於，例1的結局指標為等級資料，因此進行秩和檢定，比較不同分組間等級的差異；

而本例的分組指標為等級資料，結局為二分類變數，因此組間比較用卡方檢定即可，如果想進一步分析，可以進行趨勢檢定，探索結局指標的發生率隨著分組等級的變化而變化的趨勢。

配對卡方檢定

配對卡方檢定是用於配對資料的卡方檢定，常見的配對設計如同一人群的兩種檢測方法比較、同一人群治療前後比較等等。這種設計的資料不能用普通的Pearson卡方檢定，而是要用配對卡方檢定。

例3：某腫瘤醫院分別用核磁和CT診斷同一患者是否發生肝癌。一共納入119名患者，CT診斷發現49例肝癌，核磁診斷發現43例肝癌，資料如圖8所示。欲比較兩種診斷方法的診斷陽性率是否有差異。

圖8 肝癌診斷資料

該研究的目的是比較兩種方法的診斷結果是否有差異，屬於差異性檢定的範疇。但與前述案例不同，該案例並無分組指標，而是同一人群的兩種結果比較，這是醫學診斷試驗中常見的設計類型，即自身配對設計，同一研究人群接受兩種不同處理。兩個結果指標均為二分類變數，對於分類變數的配對設計，一般採用配對卡方檢定進行統計分析。

JMP進行配對卡方檢定時，需要將資料整理成特定的格式，需注意資料準備格式應如 (圖8) 所示，否則無法完成配對檢定的分析。

在JMP中選擇功能表「分析」→「以X擬合Y」進入差異性分析的對話方塊，本例中CT診斷結果和核磁診斷結果是同一人群的兩種結果，所以可將任意一個變數放入「Y，響應」，另一個放入「X，因數」，將「樣本數」放入「頻數」（圖9）。

圖9 配對資料的一致性檢定——變數選擇

JMP軟體輸出結果見圖10，通過列聯表可以看出，CT診斷的陽性率為41.18%，核磁診斷的陽性率為36.13%，結果還給出了Pearson卡方檢定結果。但是一定要注意，此時結果中給出卡方檢定結果不是我們所要的結果，Pearson卡方檢定是針對獨立樣本的，配對卡方的結果還需要進行一步操作。

圖10 JMP 輸出結果

在結果介面中，點擊「核磁診斷結果-CT診斷結果」列聯分析旁邊的紅色三角形按鈕，在下拉式功能表中選擇「一致性統計量」（圖11）:

圖11 配對資料的一致性檢定——功能表選擇

輸出結果見下圖12：

圖12 配對資料的一致性檢定——結果輸出

如圖12所示，共輸出兩部分結果：Kappa一致性核對總和差異性檢定。

Kappa係數給出了一致性檢定結果，表明兩種診斷方法是否具有相關性或一致性。
Bowker/McNemar檢定結果是配對資料的差異性檢定結果，表明兩種診斷方法針對同一組人群檢出陽性率是否有統計學差異。

本例的目的是比較兩種方法的差異，因此結果選擇第二部分McNemar檢定的結果，結果表明兩種方法的診斷陽性率並無統計學差異（卡方=1.50，P=0.2207）。在沒有金標準的情況下，結果只能表明兩種方法的陽性率有無統計學差異，不能說明診斷方法的優劣。

小結：根據研究目的選擇結果

最後需要強調的是：配對設計中，如果結局是分類變數，要根據你的研究目的確定選擇哪一結果。如果研究目的是比較差異，如本例，那就需要選擇Bowker / McNemar檢定（2*2的四格表給出McNemar檢定，3*3及以上的對稱列聯表給出Bowker檢定），而不是Pearson卡方檢定；如果研究目的是檢定是否有關聯，可以用Pearson卡方檢定，同時輸出相應的關聯指標；如果研究目的是觀察一致性，可以選擇Kappa一致性檢定。

對比圖12中McNemar檢定結果與圖10中Pearson卡方檢定結果，可以發現兩者完全不同，因此，在進行配對卡方檢定時，一定要注意統計結果的選擇，選錯統計方法會導致錯誤結論。

若想知道更多JMP深入應用，歡迎加入JMP LINE官方帳號，定期獲得實用的JMP操作技巧與線上課程資訊！

原文：卡方检验的延伸——等级资料秩和检验、趋势卡方和配对卡方