일반적으로 JMP의 Distribution Platform을 이용하여 히스토그램을 그리게 되면, JMP 내부의 기준(data binning, number of observations)에 따라 bin width가 자동으로 setting 되어 그려집니다.
JMP histogram의 bin width를 조정하는 방법은 grabber tool을 이용하는 것이 일반적이나, 분석자가 다음과 같은 특정 규칙(Freedman–Diaconis rule)에 따라 bin width를 지정하고 싶다면, Set Bin Width 옵션을 활용할 수 있습니다.

위 수식에서 필요한 값은 분석코자 하는 변수의 IQR(Interquartile Range), sample size(n) 입니다.
JMP Sample Data인 Diabetes.jmp를 예를 들어보겠습니다.
별도의 bin width 를 지정하지 않았다면, 아래와 같이 BMI, BP 두개의 연속형 변수의 히스토그램은 아래와 같이 표현됩니다.

참고로, 위 그래프에서의 bin width는 아래와 같습니다.
bin width(BMI)=5, bin width(BP)=10
Freedman–Diaconis rule
위 데이터에서 Freedman–Diaconis rule을 이용하여 계산하게 되면,
IQR(BMI)=6.15, IQR(BP)=21, n=442
bin width(BMI, Freedman–Diaconis rule)=1.614721725
bin width(BP, Freedman–Diaconis rule)=5.513683937
따라서, 산출된 bin width를 적용하면 위 그래프는 아래와 같이 바뀝니다.

Freedman–Diaconis JMP Add-In
위와 같이 수작업을 통해 bin width 를 계산하여 적용하기 보다, 간단한 JSL을 통해 add-in을 만들어 적용할 수 있게 하였습니다.
아래는 활용사례이며, Freedman–Diaconis bin width 단순 수작업을 피하기 위해 만들어진 간단한 add-in입니다. 또한 히스토그램은 stack된 형태를 default로 하였습니다.



혹시 Freedman–Diaconis rule을 활용한 히스토그램이 필요한 분은 설치하여 활용하시는 것을 추천드립니다.
Freedman-Diaconis Bin Width_v2.jmpaddin
You must be a registered user to add a comment. If you've already registered, sign in. Otherwise, register and sign in.