JMPの「プロファイル」機能では、予測モデルを視覚化して、因子(説明変数)を変更したときの応答(目的変数)の予測値の変化をインタラクティブに調べることができます。さらに、応答の最大化、最小化するような因子の値を見つける「最適化」の機能も搭載されています。
しかし、因子の値を無制限に調べてしまうと、実際のデータから大きく逸脱した現実ではあり得ない設定値を扱うことがあり、これは「外挿」と呼ばれる予測の危険性を伴います。そのため、最適化をした際、現実にはあり得ない因子設定による予測値を求めることもできてしまうので注意が必要です。
そこでJMPの「プロファイル」機能では、「外挿の抑制」をオンにすることで、現実的でない因子設定を回避することが可能です。以下の例では、この「外挿の抑制」機能を使った場合と使わない場合を比較して説明します。
外挿の抑制を用いた実例
今回は、医薬品の製造工程における溶出率(Y)の予測を行う例を取り上げます。プロセス変数(X1, X2, X3)を用いた応答曲面モデルを作成し、最適化を行います。
データの出典:Pharmaceutical Quality by Design Using JMP®: Solving Product Development and Manufacturing Problems
JMPの「モデルのあてはめ」を用いて応答曲面モデルをあてはめ、「予測プロファイル」にて [満足度の最大化]で最適化する際、外挿の抑制をしない場合(オフ)と抑制した場合(オン)とを比較してみます。
外挿を抑制をオフにした場合
デフォルトの設定では外挿が許可されています。この設定では、応答(Y: 溶出率)を最大化する因子の設定値が求められますが、元データからかけ離れた因子設定になることがあります。
外挿を抑制をオンにした場合
「予測プロファイル」のレポート左にある赤い三角ボタンから [外挿の抑制] > [オン] を選択してから最適化をしています。この時に得られる因子の設定値は、上記の外挿をオフにしているときとは異なっていることがわかります。
外挿の抑制をオフにしたときとオンにしたときの最適値を図示して比べてみましょう。
3つの因子(X1, X2, X3)について、外挿の抑制をオフにした場合とオンにした場合の最適値を三次元散布図と散布図行列で比較しました。赤色の点が外挿の抑制をオフにした場合、青色の点が外挿の抑制をオンにした場合の最適値です。
外挿の抑制をオフにした場合はデータから遠く離れた位置に最適値がありましたが、オンにした場合は元データの集まりの中に最適値が位置しています。これにより、外挿が抑制されていることが確認できます。
外挿の抑制をした成果がお分かりになりましたでしょうか?
「外挿の抑制」とは何をやっているのか?
それでは、この外挿の抑制とはどんなことをしているのでしょうか。
一言で述べると、次のようになります。
「データにおけるてこ比の最大値を閾値として、それ以下のてこ比の領域で因子を検討する」
データにおけるてこ比とは、その点が作成したモデルにどの程度影響を与えているかを数値化したものです。てこ比が高い点は、今回の例でいうと応答曲面モデルに強く影響していることになり、外れ値や異常値を見つける一つの手段でもあります。
JMPでは、「モデルのあてはめ」のレポート左上の赤い三角ボタンから [列の保存] > [ハット] を選択することにより、てこ比の値をデータテーブルに保存できます。
保存したてこ比の分布をみると最大値が0.587 であり、これが外挿の抑制に対する閾値となります。
外挿の抑制では、[外挿の詳細] オプションにて、下図の赤枠の部分を表示させることができます。この後の図では参考のために、プロファイルに「データ点」を表示しておきます。
「閾値」(=0.587)は、先ほど求めたてこ比の最大値です。「指標」は、現在の因子設定(X1=16.51, X2=253.3, X3=386.67)におけるてこ比の値です。この時の値は0.478となっているので、閾値を超えていません。
因子の設定値を変更して、最大のてこ比(=0.587)をとったときのデータ点(X1=40, X2=239, X3=370)を指定してみます。このときは、指標の値と閾値の値が一致します。ここが閾値ギリギリの値となります。
プロファイルに表示されている曲線が途切れているように、閾値を超えるてこ比を持つ因子の設定はできないようになっています。そのため、最適化をする際も、閾値を超えない範囲内で行っています。
「モデルのあてはめ」で手法を「標準最小二乗」に設定(応答曲面モデルはこれに該当)しているとき、デフォルトの外挿の閾値は、
K × 最大のてこ比 (K =1)
で算出されます。K=1なので、前述のように「最大のてこ比」が閾値となります。このKは、[閾値の基準を設定] オプションにより変更することができます。
このKの値を変更することで、外挿の抑制の強さを調整することができます。例えば、Kを2などと大きくすれば外挿の範囲が広がり、Kを0.5などと小さくすれば外挿がさらに制限されます。
注意:JMP Proでは、最小二乗法のほかにニューラル、サポートベクトルマシン、一般化回帰などのプロファイルや、[グラフ] メニューの [プロファイル] でも外挿の抑制を行う機能があります。これらの場合、閾値の基準として正則化されたT^2が用いられます。
by 増川 直裕(JMP Japan)
Naohiro Masukawa - JMP User Community
You must be a registered user to add a comment. If you've already registered, sign in. Otherwise, register and sign in.