樣本數愈多愈好嗎？樣本數與power值的計算

JMP_Taiwan · Mar 31, 2022 10:50 AM

在進行研究時，很多研究人員會思考一個問題：「我取的樣本數足夠嗎？」由於樣本數會直接影響到研究的嚴謹性及研究結論的可靠性。當樣本數太小時，研究結果不穩定，得到「假陰性」結果的風險也大；當樣本數太大，又會增加研究成本和實驗難度。

到底該如何確定研究的樣本數是否合理呢？今天JMP就要來介紹如何透過Power analysis去取得合適的樣本數。

樣本數和power之間的關係

在研究開始前，我們會需要知道多少樣本數來進行研究。

提到樣本數，就不得不提一個同樣重要的概念： power，稱作統計檢定力、統計檢定力、統計效能分析，本文統一稱爲power。簡單來說，power的意思是：如果實際中兩組確實有差異性，以當前樣本數能夠發現這種差異的能力。

在已知其它參數的條件下，樣本數和power是可以相互計算的。要計算樣本數，必須設定power；同理可證，如果已知樣本數，也可以計算出當前樣本數下的power是多少。在實驗中統計學結果爲陰性結果，如果此時power太低，意味著很可能樣本數不足，因此無法得出本來有差異的結果。

如何用JMP計算樣本數？

樣本數的計算，僅需要兩步驟（就像把大象放進冰箱那麽簡單）：

第一步，查閱歷史文獻，獲得樣本數計算所需的參數，如平均值、標準差、率等

第二步，把這些參數輸入JMP，得到結果。

JMP可以實現臨床試驗中常見的幾種組間比較的樣本數估算，如平均值比較的估算，率比較的估算，還可以實現等效性檢定的樣本數估算，而且操作簡單、交互性強。以下將重點介紹如何使用JMP進行樣本數和power計算。

在JMP中選擇實驗設計→樣本數大小分析器( Sample size explorers)→ power（圖1），可以看到power選單下有多種計算power和樣本數的場景，你可以根據研究目的選擇相應的具體選單。

圖1 兩組獨立樣本均值的樣本數和power計算——選單選擇

下面分別介紹兩種最常見的情形，即兩組均值比較、兩組率比較。

01兩組均值比較的樣本數估算

估算前準備

兩組均值比較的樣本數估算，需要提前確定以下參數：

01檢定類型爲單尾還是雙尾，在沒有特殊要求的情况下通常爲雙尾；

02型一誤差的上限α，通常取值0.05（雙尾檢定）或0.025（單尾檢定）；

03型二誤差β或power1-β，一般建議power在0.80以上；

04各組的均值（或兩組差值）和標準差，該數據可以通過查閱文獻或進行預試驗獲得；

05各組間樣本數比例，通常爲1:1，有時也可設爲1:2（根據研究目的和實際情况而定）；

06若爲隨訪研究，還需考慮失訪率，通常取值10%（根據實際情况而定）；

07在撰寫開題報告或研究標書時，需要提供上述參數，以論證研究的可行性與可靠度。

樣本數估算的JMP實現

點擊圖1中的兩個獨立樣本均值的power，進入樣本數和power計算界面（圖2）。

圖2 兩組獨立樣本均值的樣本數和power計算——操作界面

圖2的左側爲樣本數計算涉及的各個參數，從上到下依次爲檢定類型、固定參數（alpha和標準差）、檢定參數（包括待檢差值、樣本數和power），右側爲樣本數估算曲線。

在JMP 16之前的版本中，如果要計算樣本數，需要輸入power；同樣，要計算power，需要輸入樣本數；JMP 16版本中，樣本數（或power）可以隨時調整，相應的power（或樣本數）則隨之變動，此外，JMP 16也提供了樣本數和power關係的圖形，可以視情況任意調整，觀察在不同power（或樣本數）的值下樣本數（或power）的變化情况。

例1：已知兩組均值的樣本數計算power：

在一次研究中，我們得到了一個陰性結果，此時我們希望瞭解研究的power，以獲得研究的可信度。該研究中，兩組的標準差分別爲2和3，均值的差值爲2.5，樣本數分別爲每組20例。power計算的操作參見圖3，可見相應power爲85.31%。

圖3 兩組獨立樣本均值的power計算動圖

例2：已知power計算兩組均值的樣本數：

某兩組比較的隨機對照試驗中，我們通過查閱文獻，已知兩組的標準差分別爲1和1.5，均值的差值爲1，一類錯誤alpha爲0.05，power爲80%。樣本數操作參見圖4，可見每組需要27例樣本。

圖4 兩組獨立樣本均值的樣本數計算動圖

圖5右側的樣本數估算曲線的縱坐標爲power，橫坐標爲總樣本數。兩紅線的交叉點爲當前所示的power與樣本數。此功能幫助研究者在計算樣本數的同時，理解power與樣本數間的關係，有助於研究者根據臨床實際情况，獲得可行且可靠的樣本數。

前面兩個例子我們都是通過輸入power或樣本數，實際中也可以通過對圖5進行拖拉的方式獲得相應的樣本數或power。如將power沿曲線拖拉至80%，可見左側樣本數顯示每組需要27例樣本（圖5）。

圖5 樣本數與power的趨勢關係動圖

02兩組率比較的樣本數估算

估算前準備

兩組率比較的樣本數估算與兩組均值比較所需的參數基本一致，只是參數（04）不同，這裏不再需要各組的均值和標準差，而是需要獲取各組的率。

樣本數估算的JMP實現

點擊圖1中的兩獨立樣本比例的power，進入相應的操作界面（圖6）。

圖6 兩組獨立樣本比例的樣本數和power計算——操作界面

例3：已知兩組率的樣本數計算power：

已知兩組的率分別爲0.6和0.8，α爲0.05，樣本數各50例，其power是多少？操作見圖7，可見power爲60.88%。

這一power略有點低，如果我們想達到80%的power，需要多少樣本數呢？可以在power中輸入80，如圖8所示，樣本數發生了變化，說明若希望power達到80%，則每組至少需要79例樣本。

圖7 兩組獨立樣本率的power計算動圖

圖8 兩組獨立樣本率的樣本數計算動圖

點擊圖8中的保存設置，可以對目前的參數及樣本數進行存儲（圖9）。點擊圖2中的製成數據收集表，JMP將根據當前的樣本數新建一個數據表（圖10），方便研究者直接進行數據的收集工作。

圖9 保存設置輸出結果

圖10 製成數據收集表輸出結果

看完以上操作，是不是迫不及待開始你的實驗了呢？下載JMP 16，開始你的第一筆分析吧！

原文：试验设计系列（一）| 样本量与功效（power）的计算