在上一篇文章《一個神奇的 JMP 功能表,實現資料的所有組間比較》,我們介紹了組間比較常用的方法以及 JMP 操作的基本特色,本篇文章開始,我們將分別對幾種常見的組間比較方法及其操作過程一一介紹。今天的文章將從連續變數的組間比較說起。
對於連續變數的組間比較,如果要選擇合理的分析方法,有幾個前提條件必須先考慮,即常態性和變異數同質性 (Homogeneity of variance)。
什麼是常態性和變異數同質性?
一般常見的資料分佈形態,有常態分佈、泊松分佈、指數分佈等,常態檢定指的是判斷總體是否符合常態分佈的檢定。變異數同質性檢定,則是對各組樣本間的變異數是否相同進行的檢定。
在連續變數組間比較的實際應用中,很多人常犯的錯誤就是不考慮資料是否符合常態或是變異數,而是直接使用 t 檢定或變異數分析 (ANOVA) 對資料進行統計分析,而正確的分析流程是,在選擇方法前,先看一下你的資料分佈到底是什麼樣子。
本文的內容就是介紹在選擇統計方法之前需要考慮的兩個重要條件:如何判斷資料是否滿足常態分佈、如何判斷組間的變異數是否相等。只有確定了這兩個條件,才能選擇合理的分析方法。
在JMP中進行常態檢定
接下來,我們來看一下如何在 JMP 中使用「分佈」平臺實現常態檢定,以 (圖1) 的資料為例,探索吸煙與不吸煙人群的 BMI 值是否存在差異,首先需對 BMI 值進行常態檢定,然後根據資料分佈情況判斷應該使用 t 檢定還是秩和檢定。
圖1- 本文所用的數據
需要注意的是,在進行組間比較時,需分組進行常態檢定,即分別檢定吸煙與不吸煙兩組人群BMI的分佈,而不是檢定所有人 BMI 數值的分佈情況。接下來為大家講解如何進行具體操作,首先選擇「分析」→「分佈」(如圖2)。
圖2 - 常態檢定操作示意圖第一步
因為我們要探索吸煙和不吸煙的兩組人群的 BMI 分佈情況,因此 BMI 為結果,吸煙為分組。所以在對話方塊中將 BMI 放入「Y,列」;將吸煙放入「依據」(圖3)。輸出結果見圖 4。
圖3 - 常態檢定操作示意圖第二步
圖4 - 輸出結果
JMP中經常會看到「依據」,它表示「分別」或「分層」的意思,例如將吸煙拖入依據,表示分別對吸煙人群和不吸煙人群執行操作。這與「分組」意思不同,分組表示組間比較,如比較吸煙人群和不吸煙人群的差異。在後續的文章中,我們還會對這一概念進行解釋。
如果對這種豎向放置的長條圖不習慣,想將長條圖橫過來,可在結果介面點擊左上角的三角形按鈕,在下拉式功能表中選擇「堆疊」(圖5)。
圖5 - 堆疊操作示意圖
輸出結果如圖 6 所示。這裡分別給出吸煙與不吸煙兩組人群的 BMI 的各類統計量,包括平均值、標準差、中位數、第一&第三四分位數等。
圖 6 - 輸出結果
點擊「BMI」左側的紅色三角形按鈕,在下拉式功能表中點擊「連續擬合」→「擬合常態」(圖7)。
圖 7 - 常態檢定操作示意圖第三步
常態擬合的結果見圖 8。
圖8 輸出結果
點擊左側的紅色三角形按鈕,在下拉式功能表中點擊「擬合優度」(圖 9),便會顯示常態檢定結果。
圖 9 - 常態檢定操作示意圖第四步
常態檢定結果如(圖10) 所示,p 值等於0.9128,大於 0.05,不能認為不滿足常態分佈,即無法得出「資料不服從常態分佈」這一結論,因此可將資料視為常態分佈進行分析。
圖10 - 常態檢定結果
不吸煙人群 BMI 的常態檢定操作方式同上,結果見 (圖11),為非常態分佈。
圖11 - 常態檢定結果
根據上面的常態檢定結果,我們應使用秩和檢定進行組間比較,因為在兩組資料,中只要有任意一組資料為非常態分佈,就必須使用「秩和檢定」進行組間比較。
在JMP中實現變異數同質性檢定
如果在進行組間比較時,發現兩組資料均為常態分佈,並不意味著就可以直接進行 t 檢定,還需要進行變異數同質性檢定,來確定接下來應該使用 t 檢定還是校正的 t 檢定(t’ 檢定)。
什麼是變異數同質性檢定?
變異數同質性檢定,是對組間方差是否相同進行的檢定。為什麼要做變異數同質性檢定?因為在進行組間比較時,如果組間方差差別太大,將會掩蓋掉均值的差異,導致錯誤的結論。
變異數同質性檢定常用的方法有:
F 雙邊檢定、Brown-Forsythe 檢定、Levene 檢定、Bartlett 核對總和 O’Brien 檢定。其中 F 雙邊檢定用於兩組資料的變異數同質性檢定;其它用於多組資料的變異數同質性檢定,實際中以 Levene 法和 Bartlett 法較為常用,但 Bartlett 法只能用於常態資料,Levene 法還可用於非常態資料,應用範圍更廣一些。
以 (圖1) 資料為例,若分析不同呼吸困難程度的人軀體健康評分是否有差異,則首先進行常態檢定,若檢定結果發現兩組資料均為常態分佈,接下來則進行變異數同質性檢定。
變異數同質性檢定作為組間比較的重要步驟,其操作在 JMP 功能表「以 X 擬合 Y」模組中實現。在前一篇文章中我們已經對組間比較的操作進行了簡單介紹。
選擇「分析」→「以 X 擬合 Y」。本例中軀體健康評分為結果,呼吸困難程度為分組。所以在對話方塊中將軀體健康評分放入「Y,回應」,將呼吸困難程度放入「X,因數」,操作見 (圖12)。
圖12 - 差異性檢定操作
點擊「呼吸困難-軀體健康評分」單因數分析旁邊的紅色三角形按鈕,在下拉式功能表中選擇「不等方差」(圖13)。
圖13 變異數同質性檢定操作
輸出結果見圖 14,若變異數同質性檢定的 p 值大於 0.05,可以認為變異數具有同質性。
圖14 - 變異數同質性檢定結果
本案例為兩組變異數同質性的檢定,可選擇任一檢定結果(因為兩組是多組的特例),各檢定結果均顯示 P<0.05,則後續應採用校正的 t 檢定 (t’ 檢定)。
注意:如果是多組資料的變異數同質性檢定,則結果中不會出現 F 雙邊檢定的結果。
以上就是今天分享的基於 JMP 的常態性核對總和變異數同質性檢定的一些方法與注意事項。在下期文章中,我們將介紹如何在 JMP 中進行 t 檢定。敬請期待!下載 JMP,開啟你的資料分析旅程。
原文:如何在JMP中实现正态性检验和方差齐性检验?
【推薦閱讀】#資料分析必學10技巧
You must be a registered user to add a comment. If you've already registered, sign in. Otherwise, register and sign in.