先日、日本のお客様向けに「JMPを用いた統計的仮説検定入門」という題目でWebセミナーを実施しました。セミナーの特性上、医療や医薬関係に従事している方が多く参加すると思っていたのですが、実際は半導体、電気・電子部品、素材などを開発している製造業の方々も多く参加されました。
このセミナーでは、JMPの同等性検定について説明しました。セミナー後の参加者へのアンケートによると、同等性検定を利用するケースとして、工程変更前後の品質、新規導入した装置、組立工場が違う製品、原材料変更、製品ロット間での同等性を調べることが挙げられていました。
同等性検定の結果を視覚的に表す「フォレストプロット」
また、アンケートでは業務で同等性を調べるケースが多いとのコメントや、業務で同等性検定を利用する用途があり、役に立ったというコメントも頂きました。
そこで本ブログでは、セミナー内容の復習およびフォローアップとして、製造業で2グループの計量値に対する同等性検定の例について、再度解説します。また、数名の方から同等性検定に必要なサンプル数の算出方法について知りたいという要望があり、その点についても解説します。
2グループの計量値の差に対する同等性検定
工程前後の製品の比較する場合、前と後の2グループの値を比較します。2グループの計量値についてJMPで同等性検定を行うには、[分析] > [二変量の関係] の「一元配置分析」のレポートのオプションとして、[同等性検定] > [平均] を選択します。
JMP 17まではt検定に基づく同等性検定のみ対応していましたが、最新版の「JMP 18」では、t検定に加え、ノンパラメトリック手法であるWilcoxon検定に基づく同等性検定もサポートされています。
ここでは、t検定、Wilcoxon検定に基づく同等性検定の例を紹介します。例で使用するサンプルデータも本ブログに添付していますので、ご参考にしてください。
2標本t検定に対する同等性検定の例(パラメトリック)
例1: 旧工程と現工程における金属部品の表面硬度の同等性
- 金属部品の製造する際、製造工程(熱処理の方法)を変更したので、製造工程を変更する前(旧工程)と、後(現工程)とで部品の表面硬度(HRC*)が同等をみなせるかどうかを調べたい。
- 納品先の製品仕様を考慮し、同等とみなす許容幅は1.5(HRC)とする。
- 旧工程、現工程でそれぞれ50個の部品サンプルを抽出し、表面硬度を測定した。
*HRC: Rockwell硬度
(添付のサンプルデータ「金属部品の表面硬度データ(旧工程、現工程).jmp」を参照)
同等性検定を実施する前に、旧工程、現工程それぞれの表面硬度の分布、正規性や等分散性を確認したレポートを示します。
グラフ右側の正規分位点プロットを見ると、各グループともプロット点が参照線にほぼ従っており、参照線の傾き(グループの標準偏差に比例)がほぼ等しいため、t検定の前提である正規性と等分散性を満たしていると考えられます。
また、「平均と標準偏差」のレポートより、現工程の平均は旧工程の平均より約0.5ほど大きいことがわかります。これらの平均のばらつきも考慮し、許容幅の範囲内で同等とみなせるかを検定します。
[同等性検定] > [平均] の設定で検定の種類として「t検定」を選択し、マージン(差)を1.5に設定したときのレポートです。
「フォレストプロット」には、"旧工程の平均"と"現工程の平均"の差と、差に対する両側90%信頼区間が表示されており、この区間は許容幅である(-1.5, 1.5)の中に収まっています。そのため、旧工程の部品硬度と新工程の部品硬度は、実質的に同等とみなすことができます。
2標本Wilcoxon検定に対する同等性検定の例(ノンパラメトリック)
例2: 材料の違いによる半導体ウェハーの膜厚の同等性
- 異なる材料(A、B)で製造された半導体ウェハーの膜厚(nm)が同等とみなせるか調べたい。
- 過去の知見から、同等とみなす許容幅は5(nm)とする。
- 材料A、材料Bで作成された各30枚のウェハーをサンプルとして抽出した。
(添付のサンプルデータ「ウェハの膜厚データ(材料A,B).jmp」を参照)
例1と同様に分布や正規性を確認してみます。
このデータでは、各グループともに膜厚が非常に大きいサンプルがいくつかあり、正規分位点プロットを参照するとプロット点が参照線に従っていないことが分かります。
このようなケースでは、データを変数変換して正規分布に近づけることが考えられますが、今回のような大きな外れ値があるデータでは、対数変換などの簡単な変換では正規分布に近づかないこともあります。そこで、ここでは分布を仮定しないノンパラメトリック法により同等性の検定を行います。
[同等性検定] > [平均] の設定で検定の種類として「Wilcoxon検定」を選択し、マージン(差)を5に設定したときのレポートです。
「フォレストプロット」には、材料Aと材料Bの差を示すHodges-Lehmann推定値(位置パラメータの推定値)とその両側90%信頼区間が表示されており、この区間は許容幅である(-5,5)に収まっていません。そのため、このケースでは材料Aの膜厚と材料Bの膜厚は同等とはみなすことができません。
同等性検定に必要な標本(サンプル)サイズ
JMPでは、「標本サイズエクスプローラ」の機能を使って、2標本t検定の同等性検定に対する検出力と標本サイズを求めることができます。
例:次のようなケースで、2標本t検定の同等性検定に対する必要な標本サイズを求める。
- 金属部品の製造する際、製造工程(熱処理の方法)を変更したので、製造工程を変更する前(旧工程)と、後(現工程)とで部品の表面硬度(HRC)の同等性検定を実施する。検定で用いる許容幅は1.5(HRC)とする。
- 過去の知見より、旧工程と現工程における標準偏差を2(HRC)と想定する。
- 有意水準5%、検出力80%以上、各工程で抽出するサンプルは同数とする。
手順
1. [標本サイズエクスプローラ] > [検出力] > [独立二標本同等性の検出力] を選択します。
2. 「エクスプローラの設定」で、上側マージン、下側マージンに許容幅(1.5, -1.5)を入力します。右側の「アルファ」の欄は有意水準の値を入力します。この例では有意水準は0.05なのでデフォルト設定のままで構いません。
3. 「プロファイル」で、群1、群2の標準偏差をどちらも2と入力します
4. 左側の「検出力」に0.8を入力します。
このとき、検出力80%以上になる最も小さい標本サイズが「全体の標本サイズ」に表示されます。ただ、今回の想定では群1と群2の標本サイズを等しくしたいため、群1の標本サイズを32と編集します。このときの検出力は少し大きくなり、81.39%になります。
これより、旧工程、新工程それぞれ32個の部品をサンプリングすれば良いことになります。
上記の手順では「検出したい差」を0のままにしましたが、本来は、想定する旧工程の平均と新工程の平均の差を入力します。例えば事前に旧工程の部品の平均は44.5で、新工程の平均が45.0と想定できるのであれば、検出したい差として0.5 (または-0.5)を入力します。
ただし、現実的には事前に新しい工程に関する十分な知見を持っているケースは少ないと思われます。そのため、その場合はとりあえず「検出したい差」を0のままにして考えても良いでしょう。しかし、検出したい差のグラフの形状からわかるように、値が0から遠ざかるほど検出力は低下します。したがって、安全を考慮するのであれば、検出したい差を0より少し大きい(または小さい)値で入力するか、検出力を90%に設定して標本サイズを求めることも一案です。
また、この方法で求められた標本サイズは、あくまで統計理論に基づいて計算されたものであるため、実務における実現可能性(標本を抽出するコストや時間など)を考慮して、最終的な標本数を決定する必要があるでしょう。
JMPでは、近年のバージョンアップ(JMP 17、JMP 18)で同等性検定の機能が大幅に拡張されました。ここでは紹介しませんでしたが、JMP 18では対応のある検定(t検定、Wilcoxon検定)に対する同等性検定の機能も追加されています。ぜひ最新版のJMPで同等性検定の機能をお試しいただき、業務にお役立てください。
※上記の例題で使用したデータは仮想データです。
※関連するブログシリーズ
製造業における「同等性検定」の活用 Part1. 平均の同等性検定 - JMP User Community
製造業における「同等性検定」の活用 Part2. 割合の同等性検定 - JMP User Community
by 増川 直裕(JMP Japan)
Naohiro Masukawa - JMP User Community
金属部品の表面硬度データ(旧工程、現工程).jmp
You must be a registered user to add a comment. If you've already registered, sign in. Otherwise, register and sign in.