cancel
Showing results for 
Show  only  | Search instead for 
Did you mean: 
The Discovery Summit 2025 Call for Content is open! Submit an abstract today to present at our premier analytics conference.
Get the free JMP Student Edition for qualified students and instructors at degree granting institutions.
Choose Language Hide Translation Bar
View Original Published Thread

DOE の拡張により、すでにブロックされている設計を支援

Students_Tea
Level II

やあ、

現在実行中の実験に関して、何らかの支援をいただけないでしょうか?

これは合計3つの因子を持つカスタムデザインです。2つの連続変数と1つの2レベルカテゴリ変数です。これはJMP 15.2で実行されます。

彼らを呼ぼう

連続因子 1 = A (範囲 25-75)、連続因子 2 = B (範囲 10-180)、カテゴリ因子 = C (酸性、中性)

私は連続変数の範囲の中央と 2 次相互作用に関する情報の収集に興味があったので、モデルには主効果、2 次相互作用、および連続変数の 2 次項が含まれます。

デフォルトの設計では 18 回の実行設計が提案されましたが、これは 1 日の実行には多すぎるため、設計を 9 回の実行の 2 つのブロックにグループ化することを選択しました。

テストのブロック 1 が完了し、データから判断すると、要因 A が圧倒的に最も重要な要因であることが明らかであり、最適な結果はこの要因の中間点付近でのみ得られることになります。テストのブロック 2 は計画どおりに進行しますが、要因 B と C を変化させた場合の影響を確認しながら、要因 A を中間点に固定する最善の方法をすでに考えています。

因子 A を中間点に固定したまま設計を拡張することは可能でしょうか。それとも、設計にすでにブロッキング因子が含まれており、拡張によって 3 番目のブロッキング因子が追加されるため、これは難しいでしょうか。

この投稿のオリジナルは 、English (US) で書かれており、ユーザビリティ向上のため自動翻訳機能を使用して表示しています。コメントを投稿すると、オリジナルの言語(English (US))やご指定の言語 でも表示されます。

1 ACCEPTED SOLUTION

Accepted Solutions
Victor_G
Super User

Re: すでにブロックされている設計に対する DOE 拡張ヘルプ

こんにちは@Students_Tea

皆様のさまざまなコメント/情報および質問を受けて:

  • 目標と完全に一致しています。設計の選択は、目的と収集したい知識とよく一致しているようです。予測モデルを構築するには、ポイントをより「ランダムに均一な」方法で追加し (たとえば、スペース充填設計による拡張)、ポイント間の距離を均一化して短縮し、実験空間をより良く均一にカバーできるようにし、機械学習モデルを使用できるようにして、より優れた予測パフォーマンスを提供できるようにすることをお勧めします。
  • 情報をありがとうございます。実験のコンテキストを理解し、「全体像」をよりよく視覚化するのに役立ちます。
  • 実験が溶解実験である場合、要因に応じて溶解速度を調査する価値があるかもしれません。異なる時点での測定値や代理応答はありますか?
  • 実験の順序がデータテーブル内の順序と同じである場合、実験中に測定ドリフトまたはゆっくりとしたドリフトが発生する可能性があります。特にソースについてすでに何らかの考えがある場合は、これを調査する価値があるかもしれません。
  • 設計を拡張することはできますが、この自己相関の問題によって一部の効果が隠されたり隠されたりして、モデル内のパラメータ推定値の誤った推定を引き起こす可能性があります。この問題を解決または軽減してから拡張できれば、新しく生成されたデータによってモデル内の係数をより適切に推定できるため、初期セットは依然として関連性があります (情報量は多少少なくなるかもしれませんが)。
  • 因子 A の範囲を縮小するのは良い考えです。範囲が小さすぎて応答に変化が生じないように注意してください。拡張プロセスでは、拡張の最小実行回数は 8 回であるため、Augment Design プラットフォームで 8 回の実行を生成し、データテーブルに中心点を「手動で」追加できます (ただし、カテゴリ因子のレベルを選択する必要がある場合があります)。
  • ブロッキング係数に関しては、REML 分散成分推定レポートで Wald p 値を確認できます (このパネルが JMP 15 に表示されるかどうか、どのように表示されるかは不明です。JMP ヘルプの制限付き最大尤度 (REML) 法の説明は次のとおりです)。
    undefined

    ここで、Wald p 値は 0.5 なので、ランダム ブロック効果は 0 と有意に異ならない可能性があることを示しています。ただし、このランダム ブロック効果は、残差分散全体の 64% を捕捉します。

この回答が役に立つことを願っています。

8 REPLIES 8
Victor_G
Super User

Re: すでにブロックされている設計に対する DOE 拡張ヘルプ

こんにちは@Students_Tea

コミュニティへようこそ!

あなたが行ったようにブロッキングを使用して設計を作成する場合、実験実行を互いに類似したブロックにグループ化します。因子レベルの再分割はブロック 1 と 2 の間で類似している必要があるため、ブロック 2 の実験を実行できない場合は、完全な設計の一部を使用するのと状況が似ています。ただし、この状況で計画された実験の半分だけを使用すると、次のようになります。

  • 有意な主効果および高次効果を検出する検出力の大幅な低下:
    undefined
  • 予測分散が大きい:
    undefined
  • パラメータ推定値の不確実性が高い:
    undefined
  • 効果間の相関関係を高める:
    undefined

したがって、統計的にも効果サイズも大きい因子 A の有意な効果がすでに検出されている可能性がありますが、完全な設計の最初のブロックのみを使用すると効果 (特に関心があると思われる高次の効果) を検出する能力が低下するため、因子 A の効果をより正確に推定し、他の効果 (主効果と高次の効果) を検出できるようにするために、ブロック 2 から他の計画された実験を実行することをお勧めします。

また、設計を拡張して因子の範囲を変更することもできます。A が応答に主な影響を与える場合は、ブロック 1 から最初の一連の実験を拡張し、A のレベル/範囲を中間レベルを中心とした狭い値に制限することができます (この領域で良好な結果が得られた場合)。これにより、応答に対する因子 A の相対的な重要性を軽減できます。また、合理的であれば、因子 2 から範囲を拡大して、効果をより簡単に検出できるようにすることもできます。

この段階では要因を固定しないことをお勧めします。調査する要因の数は限られており、完全な設計の一部のみを使用する場合、効果を検出する検出力は非常に低くなります。実験段階の早い段階で要因を固定すると、A と B の間の相互作用の可能性を検出できなくなるだけでなく、A の二次効果の可能性とその主効果をより正確に推定できなくなる可能性があります。相互作用と二次効果 (この段階ではまだ検出されていません) を検出することで、より最適な結果と、システムの概要と理解が向上する可能性があります。

お客様がお持ちと思われるデザインに類似したデザインを添付しましたので、 Compare Designsプラットフォームを使用してデザインの比較 (ブロック 1 のみの完全およびサブセット) を再現できます。

この回答がお役に立てば幸いです。

この投稿のオリジナルは 、English (US) で書かれており、ユーザビリティ向上のため自動翻訳機能を使用して表示しています。コメントを投稿すると、オリジナルの言語(English (US))やご指定の言語 でも表示されます。

Students_Tea
Level II

Re: すでにブロックされている設計に対する DOE 拡張ヘルプ

こんにちは@Victor_G

フォローアップをありがとうございます。今日からどのように作業を進めていくか、少し不明瞭だったかもしれません。

私の意図は、当初の計画どおりに実験のブロック 2 を実行することです。そうしないと、設計が台無しになり、これまで実行された作業から情報を収集する能力が損なわれることを認識しているからです。

設計を拡張して因子の範囲を変更することもできます。A が応答に主な影響を与える場合は、ブロック 1 から最初の一連の実験を拡張し、A のレベル/範囲を中間レベルを中心とした狭い値に制限することができます (この領域で良好な結果が得られた場合)。これにより、応答に対する因子 A の相対的な重要性を軽減できます。また、合理的であれば、因子 2 から範囲を拡大して、効果をより簡単に検出できるようにすることもできます。」

上で書いたことは正しい考えだと思います。係数 2 の範囲を拡張することは、この場合、制限が実質的に実用的な壁にぶつかっているため、実際には機能しません。そのため、範囲を広げることはできますが、その制限を超えて導出された値は実際には役に立ちません。

ブロック 1 とブロック 2 の部分が完了したら、実験を拡張できるはずだと私は想像していますが、DOE に関する私の知識はそれほど多くありません。拡張デザインを (テストとして) 使用する場合、デザイン内の既存のブロッキング係数が選択肢として表示されます。既存のブロッキング係数を X 係数として含める必要がありますか? これを実行する場合、係数 A の値を中間値付近に制限してから、新しい実行を別のブロックにグループ化すると、合計 26 回の実行があり、3 つの個別のランダム ブロックと 2 つのブロックを含むデザインが作成されます。最初の 2 つのブロックが 1 つのブロックにブロックされ、拡張実行が 2 番目のブロックにブロックされているようです。また、A の追加の中心点は含まれていないため、これが問題かどうかはわかりません。最適値は A の中間点にあると思われるため、その時点で追加データを取得できればよいのですが、デザインではそれが必要ないのでしょうか?

上記のように既存のデザインを拡張したときに作成されるデザインについては、添付ファイルを参照してください。

この投稿のオリジナルは 、English (US) で書かれており、ユーザビリティ向上のため自動翻訳機能を使用して表示しています。コメントを投稿すると、オリジナルの言語(English (US))やご指定の言語 でも表示されます。

Victor_G
Super User

Re: すでにブロックされている設計に対する DOE 拡張ヘルプ

こんにちは@Students_Tea

ご説明ありがとうございます。誤解を招いてしまい申し訳ありません。

Augment Designsプラットフォームの要素のパネルにランダム ブロックを含めようとすると、次のウィンドウでランダム ブロック要素が削除されます。

undefined

あなたの状況では、Augment Designs プラットフォームに因子 A、B、C を入力し、因子 A のレベルを (必要な場合) 変更し、「新しい実行を別のブロックにグループ化する」オプションをオンにすることができます。

同じ想定モデル (主効果、2 因子相互作用、および 2 次効果) では、JMP によって推奨される追加実行回数は 8 なので、この回数を 9 に増やすことができます (元の設計の以前のランダム ブロックの実行回数と一致させるため)。すると、次の設計が得られます (因子 A の最小レベルを 40 に、最大レベルを 60 に変更したことに注意してください)。

undefined

おっしゃるとおり、ランダムなブロックが 3 つと、ブロックが 2 つあります。

3 つのランダム ブロックを使用して分析を進め、実験の分散が安定/一定であるかどうかを確認できます (混合モデルによるランダム効果を使用して統計的有意性を評価します)。統計的有意性が検出された場合は、効果サイズと、ランダム ブロック間の有意差を確認します。

この回答がお役に立てば幸いです。

この投稿のオリジナルは 、English (US) で書かれており、ユーザビリティ向上のため自動翻訳機能を使用して表示しています。コメントを投稿すると、オリジナルの言語(English (US))やご指定の言語 でも表示されます。

Students_Tea
Level II

Re: すでにブロックされている設計に対する DOE 拡張ヘルプ

こんにちは@Victor_G

前回の回答ありがとうございます。とても参考になりました。元の設計の残り半分から 2 日目のデータが入ってきました。

一見すると、応答を見ると、因子 A の効果サイズが最も大きいように見えます。そのため、おっしゃったように、因子 A の周囲の範囲を狭めて設計を拡張することを考えていました。A の二次効果 (正しく理解していれば) が圧倒的に最大の効果であるように思われ、これはプロファイラーで、基本的に曲線の中央に最小値がある大きな曲線から明らかです。懸念事項の 1 つは、現在の形式の生のデータは、因子 B と C について知るのにあまり適していない可能性があることです。

たとえば、因子 A の中間点付近で因子 B が増加すると、応答が低下するはずです。応答は 0 を含む正の整数になりますが、0 未満にはなりません。これは実際にデータに示されていますが、因子 A の最低範囲と最高範囲に含まれる絶対値が大きいため、多少隠されていると考えられます。たとえば、プロファイラーを使用して望ましさを最大化すると、因子 B は最低値 10 に設定されますが、最高値 180 で応答を低くできることがわかっています。

データが不均一分散であるという理由もあると思います。生データに何らかの変換 (対数または平方根) を行って、その分散の一部を均等化し、モデルが他の要因の大きさをより簡単に区別できるようにする方が良いのではないかと考えています。データに基づいて、これは良いアイデアのように思えますか、それとも JMP はこれを修正しますか?

推奨されるデータ テーブルと適合モデル パラメータについては、添付を参照してください。

この投稿のオリジナルは 、English (US) で書かれており、ユーザビリティ向上のため自動翻訳機能を使用して表示しています。コメントを投稿すると、オリジナルの言語(English (US))やご指定の言語 でも表示されます。

Victor_G
Super User

Re: すでにブロックされている設計に対する DOE 拡張ヘルプ

こんにちは@Students_Tea

線形回帰の仮定が満たされているかどうかをより適切に評価するには、モデルの残差を確認することをお勧めします。このトピックに関する以前の完全な回答をコピーして貼り付けることはしません。こちらを参照してください: 解決済み: Re: 応答モデル (RSM) に関連する解釈 - JMP ユーザー コミュニティ

作成したモデルを再起動すると、応答 A には特定の異分散パターンは見られませんが、応答 B と C にはそれが見られるようです。残差プロットで検出された異分散と、応答が多くの桁 (10 ~ 100 から 10000 ~ 100000) に及ぶという事実は、変換 (対数変換またはその他の変換) が必要である可能性を強く示しています。

しかし、応答 A と B の「行ごとの残差」プロットで私が気づいた主な問題は、残差が減少傾向を示し、負になるという非ランダム パターンの存在です。

undefined

最初のモデル分析ではランダム ブロック効果が有意ではないと思われるため、このランダム効果のないモデルも起動して、ポイント間の自己相関を Durbin-Watson テスト ( 行診断で利用可能) で確認しました。このテストは、応答 A と B に対して統計的に有意です。ここでは、応答 A の例を示します。

undefined

また、不適合度検定も有意であるように思われることに注意してください。これは、変換が必要になる可能性があり、モデルに含まれていない項 (高次の項) が欠落している可能性があることを意味します。 不適合度を参照してください。

Box-Cox Y 変換を試す場合、JMP は応答 A、B、C に対して係数が 0.485 - 0.32 および 0.334 の変換を推奨します。これは、モデルの適合性の品質を向上させるために変換が実際に必要になる可能性があることを示しています。

ただし、これによって、時間や行に応じた残差の非ランダム性に関する状況が変わったり解決されたりするわけではないことに注意してください。

新しいテストを開始する前に、このパターンがどこから来ているのかを優先的に調査することをお勧めします (データテーブル内の順序が実験の実行順序と異なる場合を除きます)。

2 つのスクリプトが追加されたファイルが添付されています。1 つはランダム効果のあるモデル用、もう 1 つはランダム効果のないモデル用です (自己相関診断と Box-Cox 変換の推奨事項を確認するため)。

この回答がお役に立てば幸いです。

この投稿のオリジナルは 、English (US) で書かれており、ユーザビリティ向上のため自動翻訳機能を使用して表示しています。コメントを投稿すると、オリジナルの言語(English (US))やご指定の言語 でも表示されます。

Students_Tea
Level II

Re: すでにブロックされている設計に対する DOE 拡張ヘルプ

こんにちは@Victor_G

もう一度、ご返答ありがとうございます。すべてがどのように機能するかについて、より理解が深まったように感じます。これらの実験の目的は応答を最小限に抑えることであり、予測モデルを作成することが目的ではないことを付け加えておくべきだと思います。本当に必要なのは、応答を最小限に抑えることができる最適な要素の組み合わせが何であるかを、十分な自信を持って教えてくれるだけの何かです。

実際の実験の背景をもう少し説明すると役立つかもしれません。基本的には溶解実験ですが、応答は溶解せずに残っ​​ている物質の量を示すものです。したがって、応答が下がると溶解が進んでいることを示します。応答は、最適条件では溶解がほとんど見られず、非常に高くなると予想されますが、より最適な条件に達すると、この値はゼロに近づき、ゼロは DP の完全な溶解を意味し、これが目標となります。

係数 A は、水性溶媒と有機溶媒の 2 成分溶液の 1 つの溶液の割合です。

要因 B は分単位の撹拌時間です。実用上の理由から、これを 180 分を超えて延長することはできません。

因子 C は因子 A が中性か酸性かを示します。

以前の実験は中性溶液で行われていたため、結果がどうなるかまったくわからなかったわけではありません。最適な因子 A は中性 pH 溶液の中間点に非常に近く、撹拌時間が長いほど溶解が進むことが以前に示されていました。溶液を酸性化すると溶解が進む可能性があるという仮説があったため、中性溶液と酸性溶液の直接比較となるこの実験を選択しました。ただし、溶媒を酸性化すると溶解プロファイルが変わり、因子 A の最適レベルが左または右にシフトする可能性があると考えたため、範囲が比較的広く設定されています。

これまでに得られた結果から、これは真実ではないようです。むしろ、溶液を酸性化すると、全体的に反応が悪化するようです。同時に、もう少し深く掘り下げて、因子 A が最適レベルに近い場合にこれが当てはまることを示したいと思っています。さらに、モデルで、溶解が因子 B とともに増加することを示したいと思います。少なくとも中性溶液の場合は、これが予想どおりです。

一番の懸念事項は、非ランダムなパターンが見られる行ごとの残差プロットであるとおっしゃっていました。これは自己相関のようですが、私も同意します。データ テーブル内の実験の順序は、実際に実行された順序と一致していることを確認できます。

実験がどのように行われたかを考えてみたところ、慎重に検討した結果、これは持ち越し効果によって発生した可能性があると考えています。これはシステムにとって最も理にかなっていると思います。これを防ぐための措置が講じられましたが、データを見ると、これが実験から完全に除去されていないようです。そのため、今後はこれを完全に除去するための追加措置を講じることを検討できます。

これを念頭に置いて、この実験を拡張することは依然として適切でしょうか? これまでに生成されたデータは、大まかに実行された過去の実験と一致するため、保持したいと思います。

この時点で、残念ながら、進めるためにいくつかのパラメータを選択しなければならない前に、残っているのは 1 つの実験だけです。最適なパラメータは、因子 A の中間点あたりにあると予想しています。また、溶解は攪拌時間とともに増加すると予想されますが、因子 A が最適に近い場合の 10 分と 180 分の間に意味のある違いがあるかどうかは、データではまだ証明されていません。最後に、因子 A と因子 B が最適に近い場合、因子 C が重要かどうかはわかりません。

したがって、他の要因はそのままにして、要因 A の範囲を 45 ~ 55 から実験を拡張することを考えます。先ほど説明したように、ブロッキング要因を含めるには、さらに 9 回実行するのが適切と思われます。拡張プロセスで中心点を追加できないのは残念ですが、要因 A がちょうど中間点にあるときに要因 B と C がどのように動作するかを確認したいのです。

データ変換に関しては、Box-Cox 値から、ln または y の平方根の間のどこかでより良い結果が得られると思われるため、今後はこれらの変換された値をモデルに使用する可能性があります。

最後に、ブロック要因は重要な説明変数ではないようだとおっしゃっていましたが、その情報はどこから得たのですか?

ありがとう、

この投稿のオリジナルは 、English (US) で書かれており、ユーザビリティ向上のため自動翻訳機能を使用して表示しています。コメントを投稿すると、オリジナルの言語(English (US))やご指定の言語 でも表示されます。

Victor_G
Super User

Re: すでにブロックされている設計に対する DOE 拡張ヘルプ

こんにちは@Students_Tea

皆様のさまざまなコメント/情報および質問を受けて:

  • 目標と完全に一致しています。設計の選択は、目的と収集したい知識とよく一致しているようです。予測モデルを構築するには、ポイントをより「ランダムに均一な」方法で追加し (たとえば、スペース充填設計による拡張)、ポイント間の距離を均一化して短縮し、実験空間をより良く均一にカバーできるようにし、機械学習モデルを使用できるようにして、より優れた予測パフォーマンスを提供できるようにすることをお勧めします。
  • 情報をありがとうございます。実験のコンテキストを理解し、「全体像」をよりよく視覚化するのに役立ちます。
  • 実験が溶解実験である場合、要因に応じて溶解速度を調査する価値があるかもしれません。異なる時点での測定値や代理応答はありますか?
  • 実験の順序がデータテーブル内の順序と同じである場合、実験中に測定ドリフトまたはゆっくりとしたドリフトが発生する可能性があります。特にソースについてすでに何らかの考えがある場合は、これを調査する価値があるかもしれません。
  • 設計を拡張することはできますが、この自己相関の問題によって一部の効果が隠されたり隠されたりして、モデル内のパラメータ推定値の誤った推定を引き起こす可能性があります。この問題を解決または軽減してから拡張できれば、新しく生成されたデータによってモデル内の係数をより適切に推定できるため、初期セットは依然として関連性があります (情報量は多少少なくなるかもしれませんが)。
  • 因子 A の範囲を縮小するのは良い考えです。範囲が小さすぎて応答に変化が生じないように注意してください。拡張プロセスでは、拡張の最小実行回数は 8 回であるため、Augment Design プラットフォームで 8 回の実行を生成し、データテーブルに中心点を「手動で」追加できます (ただし、カテゴリ因子のレベルを選択する必要がある場合があります)。
  • ブロッキング係数に関しては、REML 分散成分推定レポートで Wald p 値を確認できます (このパネルが JMP 15 に表示されるかどうか、どのように表示されるかは不明です。JMP ヘルプの制限付き最大尤度 (REML) 法の説明は次のとおりです)。
    undefined

    ここで、Wald p 値は 0.5 なので、ランダム ブロック効果は 0 と有意に異ならない可能性があることを示しています。ただし、このランダム ブロック効果は、残差分散全体の 64% を捕捉します。

この回答が役に立つことを願っています。

この投稿のオリジナルは 、English (US) で書かれており、ユーザビリティ向上のため自動翻訳機能を使用して表示しています。コメントを投稿すると、オリジナルの言語(English (US))やご指定の言語 でも表示されます。

Students_Tea
Level II

Re: すでにブロックされている設計に対する DOE 拡張ヘルプ

こんにちは@Victor_G

ご質問にお答えすると、溶解速度は基本的に生データによって示されます。時間は要因 B であるため、これは直接測定され、いずれにしても反復ごとに溶解が測定される 3 つのポイントがあります。

ゆっくりとしたドリフトについてはよくわかりません。これが真実であるかどうかを確認するには、今後の実験からより多くのデータを確認する必要があります。私の感覚では、これは自己相関の問題に関連しています。基本的に、設計マトリックスによって、結果が低いサンプルの多くが 2 番目のブロックに押し込まれました。最悪のサンプル条件の一部からのキャリーオーバーがあったようで、最良のサンプル条件の場合、実際にはそれらのサンプルのキャリーオーバーはほとんどまたはまったくありませんでした。基本的に、悪いサンプルの後に悪いサンプルが続くと、結果は高くなります。良いサンプルの後に良いサンプルが続くと、平均と比較して結果が低下します。これが拾われていたものであることはほぼ確実であり、時系列の自己相関チェッカーを見ると、それらはほぼ正確に一致しています。これは、サンプル実行間のクリーニングをさらに行うことで将来修正できます。

いずれにせよ、結果が出るまで待たなければなりませんが、本当にありがとうございました。本当に助かりました。

この投稿のオリジナルは 、English (US) で書かれており、ユーザビリティ向上のため自動翻訳機能を使用して表示しています。コメントを投稿すると、オリジナルの言語(English (US))やご指定の言語 でも表示されます。