- Mark as New
- Bookmark
- Subscribe
- Mute
- Subscribe to RSS Feed
- Get Direct Link
- Report Inappropriate Content
비정규 데이터 세트를 변환하고 모델링하는 방법
안녕하세요,
저는 3개의 중앙점을 사용하여 변수 5개 전체 요인 선별을 통해 생성된 데이터세트로 작업하고 있습니다. 원시 데이터는 지수 분포로 심하게 치우쳐 있습니다. 나는 log, log10, 제곱근 및 다양한 box-cox 변환을 시도했지만 거의 정규 분포에 접근하는 것조차 얻지 못하는 것 같습니다.
상태 | 무늬 | 데이터1 |
1 | +−−+− | 0.59 |
2 | −+−−− | 1.6 |
삼 | −−−+− | 1.78 |
4 | +−++− | 0.45 |
5 | +−−−− | 1.37 |
6 | −++−− | 0.87 |
7 | ++−+− | 0.05 |
8 | −−−−− | 4.46 |
9 | ++−−− | 0.14 |
10 | −+−+− | 0.36 |
11 | +++−− | 0.11 |
12 | +−+−− | 0.8 |
13 | −++++− | 0.33 |
14 | ++++− | 0.05 |
15 | −−+−− | 2.43 |
16 | −−++− | 1.53 |
17 | 0 | 0.86 |
18 | 0 | 0.79 |
19 | 0 | 0.9 |
20 | −+−−+ | 0.94 |
21 | ++++ | 0.87 |
22 | −−+++ | 0.91 |
23 | −−−++ | 0.72 |
24 | −+−++ | 0.05 |
25 | −−+−+ | 2.74 |
26 | −++−+ | 0.72 |
27 | −++++ | 0.08 |
28 | +−+−+ | 2.92 |
29 | −−−−+ | 4.08 |
30 | ++−−+ | 0.88 |
31 | +−−−+ | 3.98 |
32 | +−−++ | 0.82 |
33 | +++++ | 0.08 |
34 | ++++−+ | 0.78 |
35 | ++−++ | 0.06 |
1. 데이터 세트를 처리하는 데 어떤 종류의 변환이 적합합니까?
2. 데이터를 변환하는 적절한 방법이 없다면 어떻게 모델링할 수 있습니까? (Fit Model 등을 사용하여)
3. 데이터가 변환된 후 예측 프로파일러 결과가 변환된 경우 어떻게 해석합니까?
원래 English (US) 로 작성된 이 게시물은 귀하의 편의를 위해 번역되었습니다. 답장을 보내면 English (US) 로 다시 번역됩니다.
1 REPLY 1
- Mark as New
- Bookmark
- Subscribe
- Mute
- Subscribe to RSS Feed
- Get Direct Link
- Report Inappropriate Content
Re: 비정규 데이터세트를 변환하고 모델링하는 방법
데이터를 변환하는 이유는 무엇입니까?정규 분포가 필요한 것은 잔차입니다.
원래 English (US) 로 작성된 이 게시물은 귀하의 편의를 위해 번역되었습니다. 답장을 보내면 English (US) 로 다시 번역됩니다.