在進行研究時,很多研究人員會思考一個問題:「我取的樣本數足夠嗎?」由於樣本數會直接影響到研究的嚴謹性及研究結論的可靠性。當樣本數太小時,研究結果不穩定,得到「假陰性」結果的風險也大;當樣本數太大,又會增加研究成本和實驗難度。
到底該如何確定研究的樣本數是否合理呢?今天JMP就要來介紹如何透過Power analysis去取得合適的樣本數。
樣本數和power之間的關係
在研究開始前,我們會需要知道多少樣本數來進行研究。
提到樣本數,就不得不提一個同樣重要的概念: power,稱作統計檢定力、統計檢定力、統計效能分析,本文統一稱爲power。簡單來說,power的意思是:如果實際中兩組確實有差異性,以當前樣本數能夠發現這種差異的能力。
在已知其它參數的條件下,樣本數和power是可以相互計算的。要計算樣本數,必須設定power;同理可證,如果已知樣本數,也可以計算出當前樣本數下的power是多少。在實驗中統計學結果爲陰性結果,如果此時power太低,意味著很可能樣本數不足,因此無法得出本來有差異的結果。
如何用JMP計算樣本數?
樣本數的計算,僅需要兩步驟(就像把大象放進冰箱那麽簡單):
第一步,查閱歷史文獻,獲得樣本數計算所需的參數,如平均值、標準差、率等
第二步,把這些參數輸入JMP,得到結果。
JMP可以實現臨床試驗中常見的幾種組間比較的樣本數估算,如平均值比較的估算,率比較的估算,還可以實現等效性檢定的樣本數估算,而且操作簡單、交互性強。以下將重點介紹如何使用JMP進行樣本數和power計算。
在JMP中選擇實驗設計→樣本數大小分析器( Sample size explorers)→ power(圖1),可以看到power選單下有多種計算power和樣本數的場景,你可以根據研究目的選擇相應的具體選單。
圖1 兩組獨立樣本均值的樣本數和power計算——選單選擇
下面分別介紹兩種最常見的情形,即兩組均值比較、兩組率比較。
01兩組均值比較的樣本數估算
估算前準備
兩組均值比較的樣本數估算,需要提前確定以下參數:
01檢定類型爲單尾還是雙尾,在沒有特殊要求的情况下通常爲雙尾;
02型一誤差的上限α,通常取值0.05(雙尾檢定)或0.025(單尾檢定);
03型二誤差β或power1-β,一般建議power在0.80以上;
04各組的均值(或兩組差值)和標準差,該數據可以通過查閱文獻或進行預試驗獲得;
05各組間樣本數比例,通常爲1:1,有時也可設爲1:2(根據研究目的和實際情况而定);
06若爲隨訪研究,還需考慮失訪率,通常取值10%(根據實際情况而定);
07在撰寫開題報告或研究標書時,需要提供上述參數,以論證研究的可行性與可靠度。
樣本數估算的JMP實現
點擊圖1中的兩個獨立樣本均值的power,進入樣本數和power計算界面(圖2)。
圖2 兩組獨立樣本均值的樣本數和power計算——操作界面
圖2的左側爲樣本數計算涉及的各個參數,從上到下依次爲檢定類型、固定參數(alpha和標準差)、檢定參數(包括待檢差值、樣本數和power),右側爲樣本數估算曲線。
在JMP 16之前的版本中,如果要計算樣本數,需要輸入power;同樣,要計算power,需要輸入樣本數;JMP 16版本中,樣本數(或power)可以隨時調整,相應的power(或樣本數)則隨之變動,此外,JMP 16也提供了樣本數和power關係的圖形,可以視情況任意調整,觀察在不同power(或樣本數)的值下樣本數(或power)的變化情况。
例1:已知兩組均值的樣本數計算power:
在一次研究中,我們得到了一個陰性結果,此時我們希望瞭解研究的power,以獲得研究的可信度。該研究中,兩組的標準差分別爲2和3,均值的差值爲2.5,樣本數分別爲每組20例。power計算的操作參見圖3,可見相應power爲85.31%。
圖3 兩組獨立樣本均值的power計算動圖
例2:已知power計算兩組均值的樣本數:
某兩組比較的隨機對照試驗中,我們通過查閱文獻,已知兩組的標準差分別爲1和1.5,均值的差值爲1,一類錯誤alpha爲0.05,power爲80%。樣本數操作參見圖4,可見每組需要27例樣本。
圖4 兩組獨立樣本均值的樣本數計算動圖
圖5右側的樣本數估算曲線的縱坐標爲power,橫坐標爲總樣本數。兩紅線的交叉點爲當前所示的power與樣本數。此功能幫助研究者在計算樣本數的同時,理解power與樣本數間的關係,有助於研究者根據臨床實際情况,獲得可行且可靠的樣本數。
前面兩個例子我們都是通過輸入power或樣本數,實際中也可以通過對圖5進行拖拉的方式獲得相應的樣本數或power。如將power沿曲線拖拉至80%,可見左側樣本數顯示每組需要27例樣本(圖5)。
圖5 樣本數與power的趨勢關係動圖
02兩組率比較的樣本數估算
估算前準備
兩組率比較的樣本數估算與兩組均值比較所需的參數基本一致,只是參數(04)不同,這裏不再需要各組的均值和標準差,而是需要獲取各組的率。
樣本數估算的JMP實現
點擊圖1中的兩獨立樣本比例的power,進入相應的操作界面(圖6)。
圖6 兩組獨立樣本比例的樣本數和power計算——操作界面
例3:已知兩組率的樣本數計算power:
已知兩組的率分別爲0.6和0.8,α爲0.05,樣本數各50例,其power是多少?操作見圖7,可見power爲60.88%。
這一power略有點低,如果我們想達到80%的power,需要多少樣本數呢?可以在power中輸入80,如圖8所示,樣本數發生了變化,說明若希望power達到80%,則每組至少需要79例樣本。
圖7 兩組獨立樣本率的power計算動圖
圖8 兩組獨立樣本率的樣本數計算動圖
點擊圖8中的保存設置,可以對目前的參數及樣本數進行存儲(圖9)。點擊圖2中的製成數據收集表,JMP將根據當前的樣本數新建一個數據表(圖10),方便研究者直接進行數據的收集工作。
圖9 保存設置輸出結果
圖10 製成數據收集表輸出結果
看完以上操作,是不是迫不及待開始你的實驗了呢?下載JMP 16,開始你的第一筆分析吧!
原文:试验设计系列(一)| 样本量与功效(power)的计算
延伸閱讀:
You must be a registered user to add a comment. If you've already registered, sign in. Otherwise, register and sign in.