組間比較,是統計分析中比較基礎的內容,簡單來說就是對兩組或多組之間的指標進行比較,這個指標可以是連續變數,也可以是分類變數。凡是進行統計分析,幾乎都離不開組間比較。如隨機對照試驗中,主要目的就是比較兩組的療效有無差異;多因素分析中,組間比較通常也做為基線結果需要展示給大家。
今天就要來介紹 JMP 有一個神奇的功能表,幾乎可以實現所有的組間比較,這個功能表就是 --以 X 擬合Y。
簡單來說就是,把組別因素看作 x,把要分析的變數作為因變數 y。根據 x 和 y 的變數類型,JMP 軟體會自動判斷合適的方法。
為什麼這樣功能會如此神奇?本文就從幾個方面分別說明:
至於具體的組間比較方法,我們會在後面的系列文章中陸續介紹。
組間比較的方法很多,取決於組別數、分析變數類型等。
連續變數組間比較的統計方法主要有 t 檢定、方差分析、秩和檢驗等。大家在選擇連續變數組間比較統計方法時可以參考圖 1,如果你在進行資料分析時認真參考這張圖,就不會出現用 t 檢定分析非正態資料,或忘記做方差齊性檢驗這樣的錯誤。
圖1 連續變數組間比較方法選擇思路
在選擇統計方法時,主要考慮的因素包括:
分類變數組間比較的統計方法主要是卡方檢定和秩和檢驗。方法選擇見圖 2。
在選擇分類變數組間比較統計方法時,主要考慮的因素包括:
方法的選擇主要與結局指標(注意不是分組變數)的性質有關:
圖2 分類變數組間比較方法選擇思路
在 JMP 中,大部分組間比較均可在以 X 擬合 Y 功能表中實現 (圖3),也就是說不管是 t 檢驗、秩和檢驗、方差分析還是卡方檢定,都通過該模組實現。
圖3 以 X 擬合 Y 菜單
以X擬合Y功能表的介面如圖4所示,大家可以先有一個直觀印象。
圖4 以 X 擬合 Y 功能表介面
這一功能表對習慣了具體某一種方法(如 t 檢定、方差分析)的人可能有點疑惑。
大家可以注意到,在圖 4 左下方,根據 x 是分類還是連續、y 是分類還是連續,組合成四類方法:
① X 是分類變數,Y 是連續變數,可輸出單因數分析結果,包括 t 檢定、方差分析和秩和檢驗等;
② X 是分類變數,Y 是分類變數,輸出列聯,即卡方檢定的結果;
③ X 是連續變數,Y 是連續變數,輸出單因素線性回歸;
④ X 是連續變數,Y 是分類變數,輸出 Logistic 回歸。
所以,這就是 JMP 功能表的特色,它把統計方法從目的上歸類了,因為不管是 t 檢定、卡方檢定、方差分析等,其結構都是一樣的,就是一個分組變數,一個分析指標,也就是對應上面提到的①②這兩種情形。也就是說,組間比較是包含在以 X 擬合 Y 這一功能表中的,但以 X 擬合 Y 這一功能表的功能並不僅限於組間比較,後面文章中我們還會繼續介紹。
接下來,我們通過一個案例來看下如何使用「以 X 擬合 Y」實現組間比較。
假定我們有如下資料 (圖 5)。我們的目的是想探索不同呼吸困難程度人群的軀體健康評分是否有差異。換句話說,呼吸困難程度是分組變數 X (也叫引數、解釋變數),軀體健康評分是分析變數 Y (也叫結局變數、因變數)。
圖5 本文所用數據
點擊「分析」→「以X擬合Y」進入操作介面,如圖 6 所示。呼吸困難為分組變數,因此將其放入「X,因數」,軀體健康評分為結局指標,將其放入「Y,回應」,點擊確定,則可進入結果介面。
圖6 組間比較操作示意圖
結果如圖 7 所示。一看這個結果,你可能很納悶,因為結果中只有圖 7 顯示的一幅圖。
這也是 JMP 的一大特色,即:在結果介面中可以根據你的目的顯示所需的結果,而不是在功能表中選擇。在結果中選擇有個好處,你不用來回切換到功能表操作介面。
圖7 輸出結果圖
如果你點擊圖 7 左上角的紅色小三角形功能表,就可以看到可選的結果是如此豐富 (圖8),這裡包含了連續變數組間比較中各種可能用到的方法,如 t 檢驗、方差分析、各種非參數檢驗、等效性檢驗、方差齊性檢驗等。你可以根據實際情況進行勾選,以顯示相應部分結果。
圖8 連續變數組間比較結果介面
如本例中,分組變數呼吸困難分為兩組,我們可以回頭對照圖 1 的思路,對於兩組的連續資料比較,可以考慮的方法有 t 檢驗、校正的 t 檢驗 (t’ 檢驗) 和非參數檢驗。
至於最終到底需要選擇哪種方法,這就不是統計軟體的問題,而是分析者本人的分內工作,你必須先明確兩組軀體健康評分是否滿足正態分佈,是否方差齊,如果這兩個條件都滿足,你可以勾選 t 檢驗的結果,否則可能需要從選擇非參數檢驗方法。
比如,我們想瞭解兩組是否方差齊,可以通過勾選圖 8 中的「不等方差」,勾選後,結果介面會多出關於方差齊性檢驗的一部分結果 (圖9)。結果顯示,P 值遠遠小於 0.05,不能認為方差齊,也就是說,不能直接採用 t 檢驗。
結果還同時給出了方差不齊的條件下的兩組比較結果,即圖中最後一部分的 Welch 檢驗結果,結果中已經很明確地說明了,該方法可以用於兩組方差不相等的情形。從該結果可以看出,兩組軀體健康評分是有統計學差異的。
圖9 方差齊性檢驗結果
通過以上的初步介紹,相信大家對 JMP 實現組間比較操作已經有了一定瞭解,從中可以發現 JMP 統計分析的 4 大特色:
JMP 的操作功能表很簡單,只需要選擇 x 和 y 就行了,也就是說,只要你能分清楚,哪個是分組變數,哪個是結局變數就可以了。這一點對研究人員來說不是什麼難題。
JMP 的結果介面賦予分析人員很大的主動性,你可以根據自己的需要,勾選出或勾選掉某些結果。
這其實是一個好事,因為這要求你必須先明確你要採用什麼方法,而不是每逢連續變數,必用 t 檢驗。你需要先弄清楚連續變數的正態性和方差齊性,然後根據結果,勾選你想要的結果。
作為一款以互動式視覺化為特色的軟體,JMP 分析結果中能夠以圖形展示的部分,都會以圖形呈現結果,這可以方便分析人員更直觀地發現組間差異大小。可以說,互動式視覺化分析在 JMP 中無處不在。
JMP 結果介面中,除了提供各種方法,還提供了各種可供修改的選項,你可以隨時在結果中對圖形、結果進行修改,靈活地開展探索性分析,十分方便。
透過一個簡單的案例對 JMP 組間比較的強大功能進行了介紹,在後續的文章中,我們將會帶領你針對具體的組間比較方法及其如何在 JMP 中進行操作詳細說明,下載 JMP,開啟你的資料分析旅程。
【推薦閱讀】#資料分析必學10技巧:
You must be a registered user to add a comment. If you've already registered, sign in. Otherwise, register and sign in.