JMP Blog

JMP_Taiwan · Oct 15, 2021 09:19 AM

在之前的文章中，我們介紹了兩組和多組常態分佈資料的組間比較方法。在本文中，我們將要講解的則是用於檢定非常態分佈資料差異的統計方法，也就是「秩和檢定」。本文將重點介紹以下：獨立樣本秩和檢定、單樣本秩和檢定和配對樣本秩和檢定。

秩和檢定的基本概念

秩和檢定，屬於非參數檢定，非參數檢定不考慮總體的參數和總體的分佈類型，而是對樣本所代表的總體的分佈和分佈位置進行假設檢定。

秩和檢定的基本概念，首先進行編秩，然後用秩次代替原始資料來進行檢定。基於秩次檢定各組的平均秩是否相等，如果經檢定得各組的平均秩不相等，則可以推論資料的分佈不同。

本文主要用到兩個資料進行講解，一個是BMI的資料（圖1），另一個是IgA的資料（圖2）。

圖1 BMI數據

圖2 IgA數據

獨立樣本秩和檢定

獨立樣本的秩和檢定主要有兩種方法：

用於兩組比較的Wilcoxon秩和檢定
用於多組比較的Kruskal-Wallis秩和檢定

詳見 <一個神奇的JMP功能表，實現資料的所有組間比較>。二者的關係有點類似於t檢定和變異數分析的關係。

這裡要注意的是，兩組比較可以用Wilcoxon秩和檢定，也可以用Kruskal-Wallis秩和檢定；多組比較只能用Kruskal-Wallis秩和檢定。兩組和多組獨立樣本秩和檢定的操作一致，為了避免重複介紹，本文僅以多組樣本的秩和檢定為例進行介紹。

在 (圖1) 資料中，假設我們要比較不同心功能分級患者的BMI是否存在差異，因此江心功能分級分成四級，分別用1-4表示，BMI為非常態分佈，因此考慮Kruskal-Wallis秩和檢定，分析過程如下：

首先通過點選JMP「分析」→「以X擬合Y」（如下圖3），進入組間差異比較的介面。

圖3 獨立樣本秩和檢定操作 -- 功能表選擇

本例中BMI為結果，心功能分級為分組，因此在對話方塊中將BMI放入「Y，回應」，將「心功能分級」放入「X，因數」（圖4）。

圖4 獨立樣本秩和檢定操作——變數選擇

進入分析結果的介面後，點擊「心功能分級-BMI」單因數分析上方的紅色三角形按鈕，在下拉式功能表中選擇「非參數→Wilcoxon檢定」（圖5）。

圖5 獨立樣本秩和檢定操作 -- 方法選擇

輸出結果見圖6. 結果主要有兩部分：

第一部分是資料描述，給出每組的例數、秩和、平均秩等信息。從得分均值的結果可知，心功能分級為4的患者BMI最高。
第二部分為統計檢定結果，給出了Kruskal-Wallis秩和檢定的結果。表明不同心功能分級患者的BMI差異有統計學意義（卡方=10.4306，P=0.0152）。

貼心提醒：這裡給出的統計量是卡方，是因為Kruskal-Wallis秩和檢定的結果服從卡方分佈，並非做了卡方檢定，大家不要搞混了。

圖6 獨立樣本秩和檢定操作——檢定結果

注意事項：如果進行兩組樣本的秩和檢定，會同時給出Wilcoxon秩和核對總和Kruskal-Wallis秩和檢定兩個結果，兩種檢定的結果一致。Kruskal-Wallis秩和檢定結果顯示有統計學差異，通常我們還對具體哪兩組有差異感興趣，這就需要進行組間兩兩比較。

接著，我們點擊「心功能分級-BMI」單因數分析旁邊的紅色三角形按鈕，在下拉式功能表中選擇「非參數」→「非參數多重比較」→「對所有對執行Steel-Dwass檢定」，操作見圖7。

圖7 獨立樣本秩和檢定操作——兩兩比較操作

輸出結果見圖8，兩兩比較結果表明，心功能分級中的水準2和4（Z=3.089，P=0.0108）；水準3和4（Z=3.057，P=0.0120）的差異有統計學意義。

圖8 獨立樣本秩和檢定操作——兩兩比較檢定結果

本例分析結果表明，不同心功能分級患者的BMI的差異有統計學意義。兩兩比較結果顯示，心功能分級水準2和4；3和4的差異有統計學意義。

單樣本秩和檢定

基於圖1資料，探索患者的BMI與健康人群的正常值是否存在差異。假定BMI的正常值為19，BMI為非常態分佈，則進行單樣本秩和檢定。

在過往文章中，我們已經為大家講解了常態分佈資料如何進行單樣本t檢定，不過，在現實情況下資料不一定皆呈現常態分佈，當我們拿到非常態分佈的資料，應如何進行分析呢？

單樣本秩和檢定操作的前四步與單樣本t檢定相同：

①選擇JMP功能表「分析」→「分佈」；

②在彈出的對話方塊中，將BMI放入「Y，列」；

③在結果介面中點擊BMI左側的紅色三角形按鈕，在下拉式功能表中選擇「檢定均值」；

④在彈出的對話方塊中的指定假設均值中填寫19。

上述步驟詳見《一文學會t檢定的3種常用方法》。

完成以上步驟後，點擊確定則輸出單樣本t檢定結果。

若想輸出單樣本秩和檢定結果，則繼續在對話方塊中勾選「Wilcoxon符號秩」（圖9）。

圖9 單樣本秩和檢定操作——方法選擇

結果如圖10所示，結果不僅包含t檢定的結果，還包含秩和檢定的結果（「符號秩」部分的結果）。結果顯示差異有統計學意義（檢定統計量=3114.500，P<0.0001）。

圖10 單樣本秩和檢定操作——檢定結果

配對樣本的秩和檢定

本例採用圖2資料，分析患者化療前後IgA是否有差異。在既往的文章中我們已經為大家講解了配對t檢定的操作步驟。

配對秩和檢定的前兩步操作與配對t檢定相同，操作流程為：

①選擇JMP功能表「分析」→「專業建模」→「配對」；

②在彈出的對話方塊中的「Y，配對回應」中先放化療前IgA，再放化療後IgA。

上述步驟詳見《一文學會t檢定的3種常用方法》。

完成上述步驟後，在結果介面中點擊「配對」旁邊的紅色三角形按鈕，在下拉式功能表中選擇「Wilcoxon符號秩」，即可獲得配對秩和檢定的結果（圖11）。

圖11 配對秩和檢定操作——方法選擇

結果如圖12所示，患者化療前後IgA差異有統計學意義（S=-2523.0，p<0.0001）。

圖12 配對秩和檢定操作——檢定結果

結論

通常情況下，組間比較的資料呈明顯偏態，我們會考慮採用秩和檢定，而不是t檢定或變異數分析(ANOVA)。很多人可能對秩和檢定存在一定誤解，總覺得秩和檢定像是「備胎」，實際上秩和檢定的效率並不低。

如果資料為常態分佈，秩和檢定的檢定效率比t檢定、方差分析等差不了多少；如果資料呈現偏態分佈，秩和檢定的效率則遠高於t核對總和方差分析。所以建議大家在實際中一定要考慮資料的分佈情況，進而選擇合理有效的分析方法。

原文：干货 | 秩和检验及其两两比较的思路与解析