cancel
Showing results for 
Show  only  | Search instead for 
Did you mean: 
Choose Language Hide Translation Bar
一文學會3種常用的t檢定 - 獨立樣本t檢定、單樣本t檢定和配對t檢定

在過去幾篇的文章中,我們已經介紹了組間比較的基本操作、常態檢定和變異數同質性檢定。今天這篇文章將介紹最常用的 t 檢定:獨立樣本 t 檢定、單樣本 t 檢定和配對樣本檢定,並舉例說明如何使用 JMP 完成分析。

 

常見的三種t檢定

t 檢定主要用於檢定某一樣本統計量是否與總體參數相等,在實際應用中,最常見的有三種場景:獨立樣本 t 檢定、配對樣本 t 檢定和單樣本 t 檢定。

  • 獨立樣本 t 檢定:用於檢定兩組獨立樣本的平均值是否有統計差異
  • 單樣本 t 檢定:用於比較樣本資料與一個特定值之間是否有統計學差異
  • 配對 t 檢定:用於檢定配對樣本的平均值是否有統計學差異。

 

本文主要用到兩個資料,一個是軀體健康評分的資料 (圖1),另一個是皮膚含水量的資料 (圖2)。

 

MWU_0-1631600138133.png

圖1 軀體健康評分資料

 

MWU_1-1631600138137.png

圖2 皮膚含水量數據

 

1. 獨立樣本t檢定

所謂獨立樣本,是指樣本所來源的總體之間是相互獨立的,如兩組軀體健康評分的比較,張三的評分與李四的評分並無關係,是相互獨立的。

例1:在軀體健康評分資料中,我們想比較吸煙人群與不吸煙人群間的軀體健康評分是否存在差異。

 

首先通過點選 JMP 功能表「分析」→「以 X 擬合 Y」,調出組間差異比較的介面(圖3)。

 

MWU_2-1631600138141.png

圖3  獨立樣本t檢定操作——功能表選擇

 

本例中軀體健康評分為結果,吸煙為分組,所以在對話方塊中將軀體健康評分放入「Y,回應」,將吸煙放入「X,因數」(圖4)。

 

MWU_3-1631600138156.png

圖4  獨立樣本t檢定操作——變數選擇

 

結果如圖 5 所示。

如果大家看過上一期的文章,應該知道,雖然圖 5 並無任何統計學結果,但我們可以通過點擊左上方的紅色三角形按鈕,顯示我們所需的統計分析結果,這些結果的選擇,需要結合資料的常態性和變異數同質性來判斷。

 

檢定結果顯示該資料呈常態分佈且變異數具有同質性,因此可以考慮採用獨立樣本 t 檢定。

 

MWU_4-1631600138169.png

圖5 輸出結果圖

 

點擊「吸煙-軀體健康評分」單因數分析旁邊的紅色三角形按鈕,在下拉式功能表中選擇「平均值/變異數分析/合併的 t (圖6)」。

 

MWU_5-1631600138185.png

圖6  獨立樣本 t 檢定操作——方法選擇

 

結果如圖 7 所示, t 值(即結果中的t比)為 0.696,同時結果給出了 3 個 P 值,分別為:概率>|t|、概率>t和概率 <t。其中概率 >|t| 表示雙側 P 值,這也是我們最常報導的,概率 >t 和概率 <t 為單側 P 值。除非你在設計時刻意設計為單側檢定,否則一般都選擇雙側 P 值,本例為 0.4878。

 

結果提示,吸煙人群與不吸煙人群間的軀體健康評分差異無統計學意義。

 

MWU_6-1631600138204.png

圖7 獨立樣本 t 檢定結果

 

如果本例資料滿足常態性但兩組變異數沒有同質性,則可使用校正 t 檢定 (Satterthwaite t檢定)。點擊「吸煙-軀體健康評分「單因數分析左側的紅色三角形按鈕 (圖8),在下拉式功能表中選擇「t 檢定」,即可獲得校正 t 檢定的結果。

 

其結果顯示形式和解讀同圖 7 的 t 檢定。

 

MWU_7-1631600138231.png

圖8 校正 t 檢定的選擇

 

**這裡需要注意:

在 JMP 的選項中,「t 檢定」輸出的是校正 t 檢定的結果,而「平均值/變異數分析/合併的 t」選擇輸出的才是 t 檢定的結果。大家在做分析時避免勾選錯誤。

 

2. 單樣本t檢定

單樣本 t 檢定,通常用於檢定一組資料的均值與指定的目標值之間是否存在統計學差異。如想瞭解某特定職業運動員的紅細胞均值與標準的紅細胞值是否有統計學差異。

例 2:在軀體健康評分資料中,假定軀體健康評分的正常值為 60,擬瞭解患者的軀體健康評分值與健康人群的正常值是否存在差異。

 

本研究資料為常態分佈,可以考慮採用單樣本 t 檢定。

由於單樣本 t 檢定並沒有組別因素,因此不在「以 X 擬合 Y」功能表中完成,而是在「分佈」功能表中進行實現。

 

MWU_8-1631600138243.png

圖9 單樣本 t 檢定——功能表選擇

 

選擇「分析→分佈」(圖9)。在圖 10 的介面中,將軀體健康評分放入「Y,列」。點擊確定後進入到結果介面(圖11)。

 

MWU_9-1631600138255.png

圖10 單樣本 t 檢定——變數選擇

 

點擊軀體健康評分左側的紅色三角形按鈕,在下拉式功能表中選擇「檢定均值」(圖11),這裡的「均值」即我們需要指定的目標值。

 

MWU_10-1631600138264.png

圖11 單樣本 t 檢定——方法選擇

 

在彈出的對話方塊中的指定假設均值中填寫 60 (圖12),即檢定樣本人群軀體健康評分的均值與目標值60是否存在統計學差異。如果已知標準差,也可在圖 12 中輸入標準差,如果未知,則基於樣本資料估計。

 

MWU_11-1631600138269.png

圖12 單樣本 t 檢定——指定目標值

 

結果如下圖 13 所示,提示差異有統計學意義 (t=-5.7130,p<0.0001)。

 

MWU_12-1631600138284.png

圖13 單樣本 t 檢定結果

 

3. 配對t檢定:兩組配對資料的比較

與獨立樣本的概念相對的是配對樣本,即樣本不是獨立的,如某高血壓人群治療前後的血壓值,對於張三該人而言,其治療前和治療後的血壓值會有一定關係,如果治療前為 180,通常治療後不大可能突然降為 120,很可能比 180 會稍低。

 

例3:在含水量資料中,擬探索患者干預前與干預後皮膚含水量是否有差異。由於本研究探索的是同一批患者不同時間點檢查結果是否有差異,屬於配對資料,若資料服從常態分佈,則使用配對 t 檢定。若不滿足常態分佈,則採用做非參數配對檢定,非參數檢定將在後續的章節為大家詳細介紹。

 

配對t檢定的統計分析思路為,計算干預前後差值,將差值的均值與 0 比較,從而獲得干預前後的差異是否有統計學意義。所以,在 JMP 中匯入配對資料時,應注意匯入格式需如圖 2 所示,每一個患者的兩次測量值在同一行的兩列上,這樣才能求出每個患者測量值的差值。

 

配對 t 檢定的實現不是在「以 X 擬合 Y」功能表中,而是在「專業建模」這一功能表下。選擇「分析→專業建模→配對」(圖14)。

 

MWU_13-1631600138291.png

圖14配對 t 檢定——功能表選擇

 

這裡需要提醒一下:本文是以 JMP 15 為例介紹,在不同的 JMP 版本中,配對功能表的位置可能不一樣,在早期的 JMP 軟體中可從「分析」選項下直接找到「配對」模組。

 

在配對 t 檢定中,至少需要兩個結局變數,本例分別為皮膚含水量(干預前)和皮膚含水量(干預後),將這兩個變數放入「Y,配對回應」(圖15)。JMP 進行配對 t 檢定的計算時,默認放入的第 2 行變數減去第 1 行變數,在操作時需注意放入變數的先後順序。

 

如圖 15 中,干預前在第 1 行,干預後在第 2 行,因此結果是基於干預後-干預前。本案例中想要瞭解干預後皮膚含水量是否上升,因此先放皮膚含水量 (干預前),再放皮膚含水量 (干預後)。

 

MWU_14-1631600138298.png

圖15配對 t 檢定——變數選擇

 

配對 t 檢定結果見圖 16。結果首先給出差值的計算方式為皮膚含水量 (干預後) - 皮膚含水量 (干預前),結果部分給出了干預前和干預後分別的均值,以及均值差為 6.32,說明干預後的皮膚含水量高於干預前,皮膚含水量平均升高了 6.32。患者干預前後皮膚含水量差異有統計學意義 (t=12.595,p<0.0001)。

 

MWU_15-1631600138309.png

圖16 配對 t 檢定結果

 

以上就是本期為大家帶來的基於 JMP 的三種常見的 t 檢定應用場景、應用思路及分析的注意事項。在後續的文章中,我們將陸續為大家帶來變異數分析及兩兩比較、秩和檢定及其兩兩比較、卡方檢定和趨勢檢定。敬請期待!

 

原文:一文学会t检验的3种常用方法

 

Last Modified: Dec 19, 2023 2:50 PM