cancel
Showing results for 
Show  only  | Search instead for 
Did you mean: 
Try the Materials Informatics Toolkit, which is designed to easily handle SMILES data. This and other helpful add-ins are available in the JMP® Marketplace
Choose Language Hide Translation Bar

[Monthly User Guide] 두 개의 범주형 변수를 그룹화하여 분석하기

뉴스레터 구독자에게 발송되는 Monthly User Guide입니다. 관련 문의는 ikju.shin@jmp.com으로 부탁드립니다.

 

분석을 하다보면 두 개의 범주형(Category) 변수를 묶어서 하나의 변수처럼 분석하고 싶은 경우가 많은데, 이에 대해 살펴 보겠습니다. 비슷비슷하고 약간씩 다른 상황이 몇 가지 있을 수 있는 데, 여러가지 방법으로 살펴 보겠습니다.

 

JMP 안에 있는 Sample Data를 활용하겠습니다.

Help / Sample Data Library / big class.jmp

여기서 age와 sex는 범주형 변수이고 height와 weight는 연속형 변수입니다.

 

 

1. 먼저 성별/나이별로 키와 몸무게의 평균/표준편차/Min/Max 등을 구하고자 한다면 Analyze / Tabulate를 이용하여 구할 수 있을 것입니다.

 

2.png

 

2. 여기서 성별은 2가지 Level, 나이는 6가지 Level 인데, 두 범주형 변수간의 교호작용 등을 고려하지 않고, 두 범주를 묶어서, 즉 12가지 Level을 가진 하나의 범주처럼 만들어 가설 검정(유의차 검정)을 하고자 한다면 두 범주를 하나의 범주로 만들지 않고도 Analyze / Fit Y by X 에서 Local Data Filter 등을 이용할 수도 있습니다.

 

3.png

 

3. JMP의 Formula를 이용할 수도 있겠습니다.

Column 단위 Formula(:통계량을 구하고자 하는 변수, :범주형 구분변수, :범주형 구분변수) 이런 식으로 Formula를 활용할 수 있습니다. 예를 들어 age별 & sex별 weight의 최대 값을 구하고 싶다면, 새로운 Column에서 Formula를 Col Maximum( :weight, :age, :sex ) 로 구성하면, 아래와 같이 해당 조건(12가지)별 Max값이 계산됩니다.

 

4.png

 

이와 관련된 Formula는 Statistical 아래에 Col ~~ 형태로 있습니다.

 

5.png

 

4. New Formula Column 기능을 활용하는 방법도 있습니다. 예를 들어 age별 & sex별 weight의 평균값을 구하고 싶다면

1) Age, Sex 두 Column 선택 후 우측 마우스 클릭, New Formula Column에서 Group by 선택한 다음

 

6.png

 

2) weight 변수 선택 후 New Formula Column / aggregate / mean 을 클릭하면 아래와 같이 그 값이 표시됩니다. Formula를 확인해 보면, 위의 3번과 동일한 Formula 임을 알 수 있습니다.

 

7.png

 

5. 이번에는 Age 변수와 Sex 변수를 하나의 변수로 만드는 방법을 알아보겠습니다.

두 변수 선택 후 Cols / Utilities / Combine Columns 를 클릭하여 아래와 같이 입력하면

(여기서 Delimiter는 구분자로서 age 변수명과 sex 변수명 사이에 표시하는 구분자입니다)

 

8.png

 

아래와 같이 Age 변수와 Sex 변수가 합쳐진 하나의 변수가 만들어집니다.

 

9.png

 

이 변수를 다른 용도로 활용할려면 Multiple Response로 정의된 modeling Type을 Ordinal 또는 Nominal로 변경하여야 합니다.

 

10.png

 

6. Formula를 활용하여 Age 변수와 Sex 변수를 하나의 변수로 만들수도 있습니다. 약간 복잡한 Formula 입니다.

새로운 Column에서 우측 마우스 클릭, Formula 에 들어간 다음

1) Function List에서 Character / Char 선택 후 성별(sex) 변수 선택

2) Function List에서 Character / Concat : ”_” 입력 후

3) 다시 Function List에서 Character / Char 선택 후 나이(age) 변수 선택하면 아래와 같은 Formula가 만들어지고 Data Table에 새로운 Column 이 생성됩니다.

Char( :sex || "_" || Char( :age ) )

 

11.png

0 REPLIES 0