在資料分析的過程中,你可能需要將一欄或多欄指標細拆成多欄指標。例如在人口普查結果中瞭解男女性在不同年齡區段的分布情形;又或者,出於分析或做圖需要,依據性別將身高拆分別兩列等。今天就要帶你瞭解如何在 JMP 實踐將一欄資料拆分成多欄。
假設我們有一份重複測量資料,時間點和測量值是作為兩個變量記錄的,例如大家常見的男女對比金字塔圖,也需要將男和女的資料分列成兩個變量後再進行繪製。今天我們就依據這兩個例子,給大家介紹 JMP 的另一個實用功能——拆分。
首先看一下重複測量的範例資料,共 15 個受試者,分為三組接受不同處理,重複測量三次,資料紀錄(截取部分)如圖1。
圖1
為了進行重複測量方差分析,我們需要將三個時間點的測量值根據時間點分成三列。拆分的對話框通過點擊工具欄的表 (Tables)→拆分 (Split),如圖2.
圖2
我們將時間點放入拆分依據框中,然後將測量值放入拆分欄,即根據時間點對測量值進行拆分,拆分為與時間點個數相同數量的欄。其餘欄我們可以選擇全部保留,如果後續分析用不到,也可以選擇全部刪除,或者手動選擇想保存的欄,如圖3。
圖3
因為拆分資料欄必然形成新的資料表,可將新的資料表重新命名。以下我們用簡單 gif 進行動態示範,見圖4。
圖4
拆分之後生成的新資料表如圖 5 所示。原資料為 45 列,每個被試者三個時間點各佔一列,拆分之後,新數據為 15 列,每個被試者佔一列,三個時間點分別在 t1 - t3 三欄顯示,這樣就可以滿足重複測量方差分析的資料格式要求了。
圖5
再給大家列舉一種需要用到 JMP 拆分功能的情形,例如我們常見的性別金字塔,如圖6
圖6
若想做出這樣的圖,男性和女性的資料必須單獨成列,做為兩個變量,但是在正常情況下,性別往往是作為一個獨立變量存在的,這時就需要用到今天講的拆分功能。
我們以某個資料犯利用動圖進行展示,假設我們想做圖展示男女糖尿病人的 BMI 值分佈情況,該怎麼拆分呢?如圖7動圖所示。
圖7
當新的資料表生成後,我們就可以做圖了。至於如何製作金字塔圖,敬請關注本系列續的 JMP 做圖專輯。
欄的拆分和堆疊,是大家在 JMP 中清洗資料是非常常見且實用的功能,#資料分析必學10技巧 系列文章持續推送中,敬請期待!下載 JMP 試用,跟著文章練起來吧!
推薦閱讀:
原文連結:數據清洗之“拆分” — 快速實現一列拆分為多列
註:本文為此系列文章的第六期。點擊 #資料分析必學10技巧,即可回顧其他文章。
You must be a registered user to add a comment. If you've already registered, sign in. Otherwise, register and sign in.