很多朋友都曾面臨這樣的問題:統計軟體做出一堆結果,要逐一複製貼上到文章中,或是一個個手動抄寫下來,這樣複製黏貼或抄寫的過程中,不僅容易出錯,還有可能讓人質疑資料的合理性。那有沒有既節省時間、又不用擔心弄錯的好方法,能在 JMP 直接輸出分析表格呢?當然有!今天這篇文章我們將通過實例說明,透過簡單幾個步驟,便能在 JMP 中快速生成交叉分析的統計報表。
Tabulate的基本應用
假設我們有下面的資料 (圖1,僅顯示部分):
圖 1 - 示範資料
JMP的製表功能位於「分析Analyze」菜單中,選擇「制表Tabulate」,如下圖 2:
圖 2 - JMP 的製表菜單
進入 Tabulate 的界面後,你會發現 JMP 的一貫特色 -- 互動性,也就是說,不是在菜單中選定你想要輸出的統計描述指標,然後結果中輸出固定的表格;而是根據你的需求拖拉你想要顯示的指標,這樣的設計可以方便使用者更加自由快速地調整輸出的內容。
圖 3 - JMP tabulate 操作介面
從圖 3 可以看出,製表功能支持包括數目、均值、標準差、最小值、最大值等多種常用統計量的輸出,基本上可以滿足研究論文的所有需求。
01 - 顯示分類變量的例數
JMP中表格製作的方式,延續了JMP一貫的拖移功能。例如,我們想看一下吸菸和不吸菸人群各自的例數,只需簡單將變量「吸煙」拖入右上角「欄 (column)」的拖放區即可 (也可拖入左下角「列 (Rows) 的托放區 」,取決於是豎列顯示還是橫行顯示)。
02 - 顯示連續變量的均值、標準差
對於吸菸這種分類指標,只要拖入,默認顯示兩組人數。如果想顯示吸菸和不吸菸兩組人群的年齡情況,只需將「年齡」拖入行的拖放區即可,如圖 5。
圖 5 - 拖入第二個變量示意圖
把「年齡」拖入相應位置後,結果如圖 6 所示,JMP 會默認給出「總和」的結果 (連續變量都是默認顯示其總和),即吸菸和不吸菸兩組人年齡的總和。
圖 6
如果想進一步顯示其它統計量,如平均值和標準差。直接在左側的列表中選擇「標準差」,將其拖入右側表中相應位置即可。這裡最關鍵的是注意拖拉時的游標位置,如果「標準差」拖到「總和」下方 (圖7所示位置),此時顯示一條藍色短線,意思是在「總和」的下方增加一行「標準差」指標。
圖7 - 增加不同統計指標示意圖
如果想要將「總和」替換為
均值”,可將“均值”拖到「總和」的位置 (圖8所示位置)。此時該位置顯示為一個藍色方框,意思是替換,用「平均值」取代「總和」。
圖 8 - 替換統計指標示意圖
這樣我們就獲得了吸菸與年齡之間的平均值和標準差資料,如圖9。
圖 9 - 統計指標顯示結果
03 - 顯示多個變量的均值、標準差
除了年齡,假設我們還想顯示身體健康評分的均值和標準差,此時無需重複一遍對”變量的操作,只需將「軀體健康評分」拖至「年齡」下方即可 (圖10),此時在年齡變量下方位置出現一條藍色粗線 (注意與圖7比較,圖7是在統計指標下方,這裡是在變量下方),根據「年齡」已有的統計指標 (平均值和標準差),「軀體健康評分」顯示相同的內容。
圖 10 - 增加新變量示意圖
結果如下圖 11 所示,這樣我們就獲得了以是否吸菸為分組的,年齡和軀體健康評分的均值和標準差。
圖 11 - 增加新變量的結果
04 - 不同變量顯示不同的統計描述指標
從前面圖 10 可以看出,只要設置好 1 個變量的統計指標,其它變量如果想顯示同樣內容,只要把它們拖到已有的變量下方即可。然而實際中,這樣的拖拉方式如圖 12 所示,拖到整個表格下方,相當於另起爐灶,重新加一個新表格。
圖 12 - 不同變量顯示不同指標的拖拽示意圖
由於是新加的表格,而且 BMI 是連續變量,因此仍然默認顯示「總和」(圖13)。如果要換成「中位數」,此時操作與前面介紹相同,將中位數覆蓋「總和」即可。拖拉方式見圖 8。
圖 13 - 新加入不同變量不同指標的結果
使用JMP快速找出因子之間的關係
透過前面的介紹,可以知道其實這種操作方式非常簡單,唯一需要注意的就是拖拉時藍色線條的位置及其形狀。為了讓大家更好地熟悉這幾種方式,圖 14 進行動態展示。
圖 14
可能有些人會說,該有的指標是有了,但是看起來並不是最終想要的,小數點太多了,此還該如何進行數值上的調整呢?下篇文章我們就介紹一下如何針對表格格式進行調整,以及如何保存成你直接能用的格式,立即下載 JMP 試用,跟著文章練起來吧!
原文:如何在JMP中快速生成統計報表?
【推薦閱讀】資料分析必學10技巧:
You must be a registered user to add a comment. If you've already registered, sign in. Otherwise, register and sign in.