あなたは環境調査員です。東京都全域(離島を除く)の大気汚染状況を調べたいと考えていますが、時間やコストの都合上、東京都内の任意の50地点でしか調査を行うことができません。
この場合、調査する50地点をどのように決めたら良いでしょうか。東京都全域を対象とするため、可能な限り調査地点を偏らないようにすることが重要です。その一つの方法として、JMPを用いて得られた結果が、以下の地図に示す50地点のプロットです。
調査可能な場所か、調査のしやすい場所かは別にして、測定地点が極端に近くなることがなく、領域全体にバランスよくばらついて配置されていることが確認できます。

ここでの50地点は、JMPの実験計画作成方法の一つである「Space Filling計画」(空間充填計画)を使って決められたものです。
実験計画法の中では、あまり馴染みが薄い手法ですが、本記事ではSpace Filling計画の基本的な考え方や特徴を説明し、上記の地図の例で作成した計画に対してGauss過程モデルを適用する流れを解説します。
Space Filling計画とは
Space Filling 計画とは、その言葉のとおり「空間を埋める」ことを目的とした計画です。対象とする因子の範囲全体にわたって実験点を均等に配置し、特定の領域に偏らないデータ取得を目的とします。
連続因子を扱う場合、このような配置には主に次の2つ(①、②)の考え方があります。
①点と点の距離ができるだけ離れるように配置(距離最大化)
②空間全体に対し均等な間隔で点を配置(一様性)
これらのどちらを重視するか、あるいは両者を組み合わせるかによって、さまざまな計画手法が存在します。JMPのSpace Filling計画では、次の7つの方法が使用できます。

実験の回数(配置する点の個数)を20回にし、2次元の計画領域に配置した例を示します。
左下の図は「球の詰め込み」により、右下の図は「一様」により配置した結果です。前者は点同士の距離が大きくなるよう配置され、後者は各軸方向に均一な分布となることが確認できます。

「球の詰め込み」は、2 つの計画点の間の最短距離が最大になるような計画を作成する方法であり、①を重視した手法です。一方、「一様計画」は、各因子の点が均一に散らばる計画を作成する方法であり、②を重視した手法です。
また、これらの中間的な手法として「ラテン超方格法」があります。
MaxPro基準
Space Filling計画では、計画の良さを評価するための診断統計量が提供されます。その一つがMaxPro(Maximum Projection)基準です。この後の説明のためにも、この基準に少し触れておきます。

MaxProの算出式などの詳細は、マニュアルに記載がありますが、実験空間全体において点がバランスよく配置されているかを評価する指標であり、値が小さいほど良い計画とされます。
MaxProの「Projection」は射影を意味し、高次元の計画を低次元に射影しても、点の均一性が保たれることを重視しています。因子数が多い場合、計画空間は高次元になりますが、設計によっては高次元では均一でも1次元や2次元に射影すると偏りが生じることがあります。
MaxProは、点同士の距離をできるだけ大きく保つとともに、各次元や部分空間における均一性も考慮した評価指標です。
高速柔軟充填計画
最初に示した地図は、「高速柔軟充填(計画)」という方法を用いています。
JMPでは計画作成時に線形制約や、許可しない因子の組み合わせを設定できる柔軟さを持っていますが、高速柔軟充填計画は、これらの制約を設定した場合にも対応できる手法です。

この手法は、①の距離最大化をベースにしつつ、②の一様性も考慮した計画です。次のような流れで実験点を決定します。
- 制約条件などを考慮した因子空間内に、多数の候補点をランダムに生成する
- クラスター分析を用いて、指定した実験回数に対応する数のクラスターに分割する
- 各クラスターから代表点を選択する。この際、デフォルトではMaxPro基準を用いて代表点を決定し、それらが最終的な実験点となる
JMPでの操作
ここでは、大気汚染状況を測る指標としてpm10(空気中に浮遊する粒子のうち、空気力学的直径が10µm以下のもの)を用いる例を示します。
以下に操作の流れを示しますが、詳細はマニュアルの地図上のSpace Filling 計画の作成例をご参照ください。
- JMPのメニューバーから [実験計画法(DOE)] > [特殊な計画] > [Space Filling計画]を選択
- 応答にpm10を、因子をlat(経度)、lon(緯度)とし、東京都の領域における最小値と最大値を指定
- [スクリプトで許可しない組み合わせを指定]で東京都の領域外を除外
- 「実験の回数」を「50」に変更し、[高速柔軟充填]をクリック

最後に[テーブルの作成]をクリックすると、次のような50地点の緯度・経度を持つデータテーブルが生成されます。これらの点が、最初の地図で示した調査地点だったのです。

Gauss過程モデルのあてはめ
環境調査員であるあなたは、ここで示した50地点に赴き、それぞれの地点のpm10を測定したとします。これらの測定値を「pm10」の列に入力します。

注意:pm10は「OpenWeatherMap」のAPIを用い、ある時刻における値を取得
応答入力後、因子と応答の関係をモデル化します。Space Filling計画で作成されたテーブルには、Gauss過程モデルを適用するスクリプトが付加されています。

このスクリプトは、応答をY、因子をXとしたGauss(ガウス)過程モデルをあてはめることを意味します。
Space Filling計画で得られるデータの分析には、Gauss過程モデルが有効です。特にシミュレーション実験のように測定誤差がほとんどない場合、観測データを滑らかに結び、既知の点を完全に補間するモデルとして機能します。
今回の例では、測定点でない地点のpm10の予測が必要になります。今回のように空間全体に均等に配置されたデータに対しGauss過程モデルをあてはめることによって、未観測地点に対しても安定した予測が可能になります。
先ほどのスクリプトを実行すると、Gauss過程モデルをあてはめたレポートが表示されます。下図には、底面を経度、緯度、高さをpm10としたときの予測式の曲面を表していますが、実験点すべてがこの曲面上に乗っていることがわかります。
実際に予測式をデータテーブルに保存すると、pm10の実測値と予測値が一致することが確認できます。

東京全域におけるpm10の分布予測
Gauss過程モデルによる予測値を地図上に可視化すると、以下のような分布が得られます。赤色はPM10が高い領域、青色は低い領域を示します。

この地図から、例えば次のような傾向が読み取れます。
・羽田空港やその近くの湾岸エリアでpm10が高くなっている
⇒ 交通量や工業活動が多い地域のため
西側地域(奥多摩や西東京)でpm10が低くなっている
⇒ 都市化が進んでいなく、自然環境が多い地域のため
まとめ
本記事では、次のことを解説しました。
- Space Filling計画は、空間全体にバランスよく点を配置し、偏りのないデータ取得を目的とする手法である。
- 配置方法には、点同士の距離を最大化する方法と、一様に分布させる方法がある。
- JMPでは複数の手法が利用でき、制約条件に対応可能な高速柔軟充填計画が実務で有効である。
- 得られたデータにガウス過程モデルを適用することで、未観測の条件における応答値も含めて、全体の関係性や分布を滑らかに推定できる。
また、JMP Pro 19の新機能である「Bayes(ベイズ)最適化」では、Space Filling計画により因子空間を偏りなくサンプリングし、そのデータにガウス過程モデルを適用することで、予測と不確実性を評価し、次に評価すべき有望な条件を効率的に選定することができます。
by 増川 直裕(JMP Japan)
Naohiro Masukawa - JMP User Community