在之前的文章中,我們介紹了兩組和多組常態分佈資料的組間比較方法。在本文中,我們將要講解的則是用於檢定非常態分佈資料差異的統計方法,也就是「秩和檢定」。本文將重點介紹以下:獨立樣本秩和檢定、單樣本秩和檢定和配對樣本秩和檢定。
秩和檢定的基本概念
秩和檢定,屬於非參數檢定,非參數檢定不考慮總體的參數和總體的分佈類型,而是對樣本所代表的總體的分佈和分佈位置進行假設檢定。
秩和檢定的基本概念,首先進行編秩,然後用秩次代替原始資料來進行檢定。基於秩次檢定各組的平均秩是否相等,如果經檢定得各組的平均秩不相等,則可以推論資料的分佈不同。
本文主要用到兩個資料進行講解,一個是BMI的資料(圖1),另一個是IgA的資料(圖2)。
圖1 BMI數據
圖2 IgA數據
獨立樣本秩和檢定
獨立樣本的秩和檢定主要有兩種方法:
- 用於兩組比較的Wilcoxon秩和檢定
- 用於多組比較的Kruskal-Wallis秩和檢定
詳見 <一個神奇的JMP功能表,實現資料的所有組間比較>。二者的關係有點類似於t檢定和變異數分析的關係。
這裡要注意的是,兩組比較可以用Wilcoxon秩和檢定,也可以用Kruskal-Wallis秩和檢定;多組比較只能用Kruskal-Wallis秩和檢定。兩組和多組獨立樣本秩和檢定的操作一致,為了避免重複介紹,本文僅以多組樣本的秩和檢定為例進行介紹。
在 (圖1) 資料中,假設我們要比較不同心功能分級患者的BMI是否存在差異,因此江心功能分級分成四級,分別用1-4表示,BMI為非常態分佈,因此考慮Kruskal-Wallis秩和檢定,分析過程如下:
首先通過點選JMP「分析」→「以X擬合Y」(如下圖3),進入組間差異比較的介面。
圖3 獨立樣本秩和檢定操作 -- 功能表選擇
本例中BMI為結果,心功能分級為分組,因此在對話方塊中將BMI放入「Y,回應」,將「心功能分級」放入「X,因數」(圖4)。
圖4 獨立樣本秩和檢定操作——變數選擇
進入分析結果的介面後,點擊「心功能分級-BMI」單因數分析上方的紅色三角形按鈕,在下拉式功能表中選擇「非參數→Wilcoxon檢定」(圖5)。
圖5 獨立樣本秩和檢定操作 -- 方法選擇
輸出結果見圖6. 結果主要有兩部分:
- 第一部分是資料描述,給出每組的例數、秩和、平均秩等信息。從得分均值的結果可知,心功能分級為4的患者BMI最高。
- 第二部分為統計檢定結果,給出了Kruskal-Wallis秩和檢定的結果。表明不同心功能分級患者的BMI差異有統計學意義(卡方=10.4306,P=0.0152)。
貼心提醒:這裡給出的統計量是卡方,是因為Kruskal-Wallis秩和檢定的結果服從卡方分佈,並非做了卡方檢定,大家不要搞混了。
圖6 獨立樣本秩和檢定操作——檢定結果
注意事項:如果進行兩組樣本的秩和檢定,會同時給出Wilcoxon秩和核對總和Kruskal-Wallis秩和檢定兩個結果,兩種檢定的結果一致。Kruskal-Wallis秩和檢定結果顯示有統計學差異,通常我們還對具體哪兩組有差異感興趣,這就需要進行組間兩兩比較。
接著,我們點擊「心功能分級-BMI」單因數分析旁邊的紅色三角形按鈕,在下拉式功能表中選擇「非參數」→「非參數多重比較」→「對所有對執行Steel-Dwass檢定」,操作見圖7。
圖7 獨立樣本秩和檢定操作——兩兩比較操作
輸出結果見圖8,兩兩比較結果表明,心功能分級中的水準2和4(Z=3.089,P=0.0108);水準3和4(Z=3.057,P=0.0120)的差異有統計學意義。
圖8 獨立樣本秩和檢定操作——兩兩比較檢定結果
本例分析結果表明,不同心功能分級患者的BMI的差異有統計學意義。兩兩比較結果顯示,心功能分級水準2和4;3和4的差異有統計學意義。
單樣本秩和檢定
基於圖1資料,探索患者的BMI與健康人群的正常值是否存在差異。假定BMI的正常值為19,BMI為非常態分佈,則進行單樣本秩和檢定。
在過往文章中,我們已經為大家講解了常態分佈資料如何進行單樣本t檢定,不過,在現實情況下資料不一定皆呈現常態分佈,當我們拿到非常態分佈的資料,應如何進行分析呢?
單樣本秩和檢定操作的前四步與單樣本t檢定相同:
①選擇JMP功能表「分析」→「分佈」;
②在彈出的對話方塊中,將BMI放入「Y,列」;
③在結果介面中點擊BMI左側的紅色三角形按鈕,在下拉式功能表中選擇「檢定均值」;
④在彈出的對話方塊中的指定假設均值中填寫19。
上述步驟詳見《一文學會t檢定的3種常用方法》。
完成以上步驟後,點擊確定則輸出單樣本t檢定結果。
若想輸出單樣本秩和檢定結果,則繼續在對話方塊中勾選「Wilcoxon符號秩」(圖9)。
圖9 單樣本秩和檢定操作——方法選擇
結果如圖10所示,結果不僅包含t檢定的結果,還包含秩和檢定的結果(「符號秩」部分的結果)。結果顯示差異有統計學意義(檢定統計量=3114.500,P<0.0001)。
圖10 單樣本秩和檢定操作——檢定結果
配對樣本的秩和檢定
本例採用圖2資料,分析患者化療前後IgA是否有差異。在既往的文章中我們已經為大家講解了配對t檢定的操作步驟。
配對秩和檢定的前兩步操作與配對t檢定相同,操作流程為:
①選擇JMP功能表「分析」→「專業建模」→「配對」;
②在彈出的對話方塊中的「Y,配對回應」中先放化療前IgA,再放化療後IgA。
上述步驟詳見《一文學會t檢定的3種常用方法》。
完成上述步驟後,在結果介面中點擊「配對」旁邊的紅色三角形按鈕,在下拉式功能表中選擇「Wilcoxon符號秩」,即可獲得配對秩和檢定的結果(圖11)。
圖11 配對秩和檢定操作——方法選擇
結果如圖12所示,患者化療前後IgA差異有統計學意義(S=-2523.0,p<0.0001)。
圖12 配對秩和檢定操作——檢定結果
結論
通常情況下,組間比較的資料呈明顯偏態,我們會考慮採用秩和檢定,而不是t檢定或變異數分析(ANOVA)。很多人可能對秩和檢定存在一定誤解,總覺得秩和檢定像是「備胎」,實際上秩和檢定的效率並不低。
如果資料為常態分佈,秩和檢定的檢定效率比t檢定、方差分析等差不了多少;如果資料呈現偏態分佈,秩和檢定的效率則遠高於t核對總和方差分析。所以建議大家在實際中一定要考慮資料的分佈情況,進而選擇合理有效的分析方法。
原文:干货 | 秩和检验及其两两比较的思路与解析
推薦閱讀:
變異數分析 (ANOVA) 與兩兩比較的思考脈絡與分析方法
在JMP中進行常態檢定與變異數同質性檢定
實驗設計 (DOE)入門:經典篩選設計與全因子設計
You must be a registered user to add a comment. If you've already registered, sign in. Otherwise, register and sign in.