해결됨: Correct Degrees of Freedom?

부적절한 컨텐트 신고 · Jul 5, 2023 03:12 PM

안녕하세요,

6가지 범주 효과가 있는 연속 변수를 모델링하기 위해 적합 모델 기능을 사용하고 있습니다. 그러나 모형에 대해 나열된 DF는 6 대신 8로 제공되며 매개변수 추정치는 이러한 범주형 변수 중 두 개를 각각 두 개의 범주로 나눕니다. 이 두 변수가 두 가지 범주로 분류되는 이유는 무엇입니까? 자유도가 정확합니까? 적합 모델 화면과 매개변수 추정 화면의 사진을 포함했습니다. 감사합니다!

undefined

Victor_G · Jul 6, 2023 03:18 AM

안녕 @JenniferB ,

커뮤니티에 오신 것을 환영합니다!
데이터에 대한 전체 액세스 권한이 없으면 답변이 조금 더 복잡할 수 있지만 스크린샷에서 제공하는 정보로 최선을 다하겠습니다. 데이터 세트에 대한 내 가정 중 일부가 잘못된 경우 저를 정정하십시오.
모델에 대해 계산된 자유도(DF) 뒤에 무엇이 있는지 살펴보겠습니다.

데이터 세트의 DF: "분산 분석" 패널을 보면 데이터 세트에 50개의 서로 다른 관찰이 있는 것 같으므로 총 50개의 자유도가 있습니다. 중복된 관측치가 있는 경우, 즉 동일한 X 값을 가진 관측치가 있는 경우 이러한 관측치는 자유도를 추가하지 않습니다(그러나 반응 분산을 추정하는 데 도움이 될 수 있음).
모델의 DF: 모델에서 "소비"하는 DF의 수는 보유한 요인 유형에 따라 다릅니다. 예를 들어 각 수치 연속 요인은 모델에서 1DF를 사용하여 방정식의 모수를 추정합니다. 범주형 요인의 경우 사용되는 DF의 수는 수준 수에 따라 다릅니다. 범주형 요인의 N 수준에 대해 모델링에 사용되는 DF의 수는 N-1이고, 마지막 수준 매개변수 추정치는 다른 것으로부터 계산할 수 있기 때문에: 3-수준 요인의 경우 수준 추정치의 합은 L1+L2+L3 = 0입니다.
예를 들어 고기 종류에 따른 핫도그 가격 방정식을 보면 3단계 매개변수 추정치의 합이 실제로 0인지 확인할 수 있습니다.

주제로 돌아가서 모델에 다음과 같은 요소가 있는 것 같습니다.

Q28: 성별: 2단계 범주형 요인(1 DF를 나타냄),
Q31: 고향: 3단계 범주형 요인(2개의 DF를 나타냄),
Q32: 최고 등급: 2단계 범주형 요인(1 DF를 나타냄),
Q39: EuthExp: 3단계 범주형 요인(2개의 DF를 나타냄),
Q43: PriorTraining: 2-레벨 범주형 요인(1 DF를 나타냄),
Q44: Euth6mos: 2-수준 범주형 요인(1 DF를 나타냄).

따라서 JMP의 계산이 정확합니다. 총 1+2+1+2+1+1 = 모델에 사용된 DF가 8개이고 데이터세트에 사용 가능한 DF가 50개이므로 42개의 DF가 남아 오류 추정에 사용됩니다. , "Analysis of Variance" 패널에 표시됩니다.

이 답변이 귀하가 보고 있는 출력을 명확하게 해주기를 바랍니다.

Victor_G · Jul 6, 2023 03:18 AM

안녕 @JenniferB ,

커뮤니티에 오신 것을 환영합니다!
데이터에 대한 전체 액세스 권한이 없으면 답변이 조금 더 복잡할 수 있지만 스크린샷에서 제공하는 정보로 최선을 다하겠습니다. 데이터 세트에 대한 내 가정 중 일부가 잘못된 경우 저를 정정하십시오.
모델에 대해 계산된 자유도(DF) 뒤에 무엇이 있는지 살펴보겠습니다.

데이터 세트의 DF: "분산 분석" 패널을 보면 데이터 세트에 50개의 서로 다른 관찰이 있는 것 같으므로 총 50개의 자유도가 있습니다. 중복된 관측치가 있는 경우, 즉 동일한 X 값을 가진 관측치가 있는 경우 이러한 관측치는 자유도를 추가하지 않습니다(그러나 반응 분산을 추정하는 데 도움이 될 수 있음).
모델의 DF: 모델에서 "소비"하는 DF의 수는 보유한 요인 유형에 따라 다릅니다. 예를 들어 각 수치 연속 요인은 모델에서 1DF를 사용하여 방정식의 모수를 추정합니다. 범주형 요인의 경우 사용되는 DF의 수는 수준 수에 따라 다릅니다. 범주형 요인의 N 수준에 대해 모델링에 사용되는 DF의 수는 N-1이고, 마지막 수준 매개변수 추정치는 다른 것으로부터 계산할 수 있기 때문에: 3-수준 요인의 경우 수준 추정치의 합은 L1+L2+L3 = 0입니다.
예를 들어 고기 종류에 따른 핫도그 가격 방정식을 보면 3단계 매개변수 추정치의 합이 실제로 0인지 확인할 수 있습니다.

주제로 돌아가서 모델에 다음과 같은 요소가 있는 것 같습니다.

Q28: 성별: 2단계 범주형 요인(1 DF를 나타냄),
Q31: 고향: 3단계 범주형 요인(2개의 DF를 나타냄),
Q32: 최고 등급: 2단계 범주형 요인(1 DF를 나타냄),
Q39: EuthExp: 3단계 범주형 요인(2개의 DF를 나타냄),
Q43: PriorTraining: 2-레벨 범주형 요인(1 DF를 나타냄),
Q44: Euth6mos: 2-수준 범주형 요인(1 DF를 나타냄).

따라서 JMP의 계산이 정확합니다. 총 1+2+1+2+1+1 = 모델에 사용된 DF가 8개이고 데이터세트에 사용 가능한 DF가 50개이므로 42개의 DF가 남아 오류 추정에 사용됩니다. , "Analysis of Variance" 패널에 표시됩니다.

이 답변이 귀하가 보고 있는 출력을 명확하게 해주기를 바랍니다.

JenniferB · Jul 6, 2023 10:51 AM

네, 말이 됩니다! 도와주셔서 감사합니다!

젠

statman · Jul 6, 2023 11:09 AM

한 가지 가능한 설명은 총 50개의 DF가 있는 경우 총 51개의 관찰이 있어야 한다는 것입니다.

Victor_G · Jul 6, 2023 11:10 AM

예, 인터셉트를 위해 DF 1개를 세는 것을 잊었습니다. 잘 잡았습니다!

올바른 자유도?

Re: 올바른 자유도?

Re: 올바른 자유도?

Re: 올바른 자유도?

Re: 올바른 자유도?

Re: 올바른 자유도?

추천 글

Creating Heat Maps

Get Going with JMP: Essentials for Using JMP