キャンセル
次の結果を表示 
表示  限定  | 次の代わりに検索 
もしかして: 
The Discovery Summit 2025 Call for Content is open! Submit an abstract today to present at our premier analytics conference.
See how to use to use Text Explorer to glean valuable information from text data at April 25 webinar.
言語を選択 翻訳バーを非表示
最初に公開されたスレッドを表示

線形回帰で変数のログを使用していますか?

jk577648
Level I

私はJMPを使用している新しい学生で、質問があります。

分布から明らかなように、かなり歪んだいくつかの変数を含むデータセットがあります。  1つは私の従属変数で、他はすべて独立変数です。

従属変数のLog_variableと主な独立変数の1つを使用して新しい列を作成します。 

どちらの分布も、正規分布に向かって大幅に改善されました。

上で述べたように、私は他の独立変数も大きく歪んでおり、それらをログに変換することを検討しています。

 

私の質問は、大きく歪んだ独立変数をlog_variableに変換することは常にお勧めですか?

または、これを最小限に使用する必要がありますか?

 

参考までに、変数を「準備」したら(つまり、欠損値と潜在的な外れ値に対処し、log_variablesを作成して)、変数の重回帰分析を実行します。

おかげで、

 

JK

 

 

 

この投稿のオリジナルは 、English (US) で書かれており、ユーザビリティ向上のため自動翻訳機能を使用して表示しています。コメントを投稿すると、オリジナルの言語(English (US))やご指定の言語 でも表示されます。

4件の返信4

再:線形回帰で変数のログを使用していますか?

正規性の要件は、全体的または周辺的な分布ではなく、応答の条件付き分布に適用されます。予測変数にはまったく適用されません。スキューの一部はランダムではなく、モデルによって説明される場合があります!そのため、残差を評価します。それらは正規分布し、独立しており、一定の分散を持っていると期待しています。Fit Least Squaresプラットフォームには、問題の評価に役立つ診断ツールがあります。

 

変換の利点を評価するツールもあります。ログ変換を評価しました。パワー変換の一般化は、プロファイリングの下の最小二乗法の赤い三角形のメニューで使用可能なBox-Cox Y変換です。

この投稿のオリジナルは 、English (US) で書かれており、ユーザビリティ向上のため自動翻訳機能を使用して表示しています。コメントを投稿すると、オリジナルの言語(English (US))やご指定の言語 でも表示されます。

jk577648
Level I

再:線形回帰で変数のログを使用していますか?

Box-Cox変換機能を確認しましたが、ゼロと
負の値なので、実行されません。

はい、私は、残差に対する正規性の要件を認識しています。
それらはランダムであり、平均はゼロです。
私はそれを検証するために残差分布をレビューしました。

また、フィットの概要とパラメーターの推定値を見直して修正しました
モデルを0.05レベルの信頼度と低いVIF値に下げます。

私の入力変数の範囲は極端なものであるため、低$ミリオンから
変数に400億ドル。
これをログに変換して、Adj Rの2乗値を半分に減らしましたが、
RMSEは300を超えて1.5になりました。

変換の同じアプローチを適用することが合理的かどうか疑問に思う
実行する前に、ログ変数から他の入力変数に
回帰。

モデルは、モデルのゆがみの一部を説明するかもしれないことを理解しています
log_variablesに変換せずにデータを取得するため、決定要因は何ですか
変数をいつ変換するか、受信したままに保つか

ありがとう。

この投稿のオリジナルは 、English (US) で書かれており、ユーザビリティ向上のため自動翻訳機能を使用して表示しています。コメントを投稿すると、オリジナルの言語(English (US))やご指定の言語 でも表示されます。

P_Bartell
Level VIII

再:線形回帰で変数のログを使用していますか?

JMPのパワーと使いやすさ...回帰設定での予測子または応答の変換に関する私の一般的な推奨事項は、変換が前もって良いアイデアであることを示唆するドメインの専門知識がない限りです。モデリング時に従おうとした原則があります。「元の実用的な問題に答える最も単純なモデルは、「最良の」モデルです。」

 

変換されていない変数から始めて、JMPのすべてのモデル診断テストと視覚化を使用して、変換されていないモデルのパフォーマンスを確認するのに十分な簡単なタスクです。次に、その知識を使用して、元の問題を解決するために必要であれば、変換プロセスをガイドします...これはしゅうの考え? 

この投稿のオリジナルは 、English (US) で書かれており、ユーザビリティ向上のため自動翻訳機能を使用して表示しています。コメントを投稿すると、オリジナルの言語(English (US))やご指定の言語 でも表示されます。

再:線形回帰で変数のログを使用していますか?

私は混乱しています。非正の値がある場合、応答のログをどのように取得しましたか?応答の範囲が100万ドルから40億ドルの場合、Box-Cox Y変換コマンドを使用できないのはなぜですか?

 

応答が異なる場合(Y対Log Y)、回帰統計を比較することは困難です。

 

X変数を変換することもできます。

 

数桁以上異なるデータは、一般的にこのような変換の恩恵を受けます。

 

モデルの偏りと分散、節約、有効なモデルの仮定、経験的検証または相互検証に基づいて、選択が有用であると判断します。

 

このモデルは予測目的または説明目的ですか?

この投稿のオリジナルは 、English (US) で書かれており、ユーザビリティ向上のため自動翻訳機能を使用して表示しています。コメントを投稿すると、オリジナルの言語(English (US))やご指定の言語 でも表示されます。