cancel
Showing results for 
Show  only  | Search instead for 
Did you mean: 
資料清理之「拆分」:在 JMP 快速實現一欄拆分為多欄

在資料分析的過程中,你可能需要將一欄或多欄指標細拆成多欄指標。例如在人口普查結果中瞭解男女性在不同年齡區段的分布情形;又或者,出於分析或做圖需要,依據性別將身高拆分別兩列等。今天就要帶你瞭解如何在 JMP 實踐將一欄資料拆分成多欄。

 

Michelle_Wu_0-1630314405983.png

 

假設我們有一份重複測量資料,時間點和測量值是作為兩個變量記錄的,例如大家常見的男女對比金字塔圖,也需要將男和女的資料分列成兩個變量後再進行繪製。今天我們就依據這兩個例子,給大家介紹 JMP 的另一個實用功能——拆分。

首先看一下重複測量的範例資料,共 15 個受試者,分為三組接受不同處理,重複測量三次,資料紀錄(截取部分)如圖1

 

Michelle_Wu_1-1630314405993.png

圖1

 

為了進行重複測量方差分析,我們需要將三個時間點的測量值根據時間點分成三列。拆分的對話框通過點擊工具欄的表 (Tables)→拆分 (Split),如圖2.

 

Michelle_Wu_2-1630314405998.png

圖2

 

我們將時間點放入拆分依據框中,然後將測量值放入拆分欄,即根據時間點對測量值進行拆分,拆分為與時間點個數相同數量的欄。其餘欄我們可以選擇全部保留,如果後續分析用不到,也可以選擇全部刪除,或者手動選擇想保存的欄,如圖3

 

Michelle_Wu_3-1630314406001.png

圖3

 

因為拆分資料欄必然形成新的資料表,可將新的資料表重新命名。以下我們用簡單 gif 進行動態示範,見圖4

 

圖4.gif

圖4

 

拆分之後生成的新資料表如圖 5 所示。原資料為 45 列,每個被試者三個時間點各佔一列,拆分之後,新數據為 15 列,每個被試者佔一列,三個時間點分別在 t1 - t3 三欄顯示,這樣就可以滿足重複測量方差分析的資料格式要求了。

 

Michelle_Wu_5-1630314406035.png

圖5

 

再給大家列舉一種需要用到 JMP 拆分功能的情形,例如我們常見的性別金字塔,如圖6

Michelle_Wu_6-1630314406038.png

圖6

 

若想做出這樣的圖,男性和女性的資料必須單獨成列,做為兩個變量,但是在正常情況下,性別往往是作為一個獨立變量存在的,這時就需要用到今天講的拆分功能。

我們以某個資料犯利用動圖進行展示,假設我們想做圖展示男女糖尿病人的 BMI 值分佈情況,該怎麼拆分呢?如圖7動圖所示。

 

圖7.gif

圖7

 

當新的資料表生成後,我們就可以做圖了。至於如何製作金字塔圖,敬請關注本系列續的 JMP 做圖專輯。

欄的拆分和堆疊,是大家在 JMP 中清洗資料是非常常見且實用的功能,#資料分析必學10技巧 系列文章持續推送中,敬請期待!下載 JMP 試用,跟著文章練起來吧!

 

推薦閱讀:

原文連結:數據清洗之“拆分” — 快速實現一列拆分為多列 

註:本文為此系列文章的第六期。點擊 #資料分析必學10技巧,即可回顧其他文章。

 

Last Modified: Aug 30, 2021 11:20 AM