拆分資料集有煩惱?這些實用妙招試試看!
在日常分析數據的過程中,我們往往只需要整個數據集中的一部分,比如只關註一部分觀測/行(男性或女性、某個年齡段的患者或者是患有某種疾病的患者)或者一部分變量/列等等這些可以稱之為子集的數據集,而拆分原始數據的過程也同時是生成子集的過程。 那麼 如何選擇符合條件的觀測值?如何一鍵拆分數據為多個子集?JMP中又有哪些簡便快捷的隨機抽樣方法?今天就帶大家一起學習資料清理的一個重要部分。 在 JMP 中生成子集 圖1 生成子集的主要操作頁面 那麼具體該如何拆分呢? 這個對話框裡的每個選項都有何意義? 又該如何利用好這些選項呢?我們先從最簡單的說起。 01如果只需要一部分變量(列) 比如在下圖的數據集裡,只需要Y和年齡兩個變量(當然實際情況不會是這樣,一般情況下,除非變量特別多,都不需要單獨把一些變量拎出來),你只需...