cancel
Showing results for 
Show  only  | Search instead for 
Did you mean: 
  • JMP will suspend normal business operations for our Winter Holiday beginning on Wednesday, Dec. 24, 2025, at 5:00 p.m. ET (2:00 p.m. ET for JMP Accounts Receivable).
    Regular business hours will resume at 9:00 a.m. EST on Friday, Jan. 2, 2026.
  • We’re retiring the File Exchange at the end of this year. The JMP Marketplace is now your destination for add-ins and extensions.

Naohiro Masukawa

Choose Language Hide Translation Bar
JMPを使ってデータの欠測値を効率よく調べる3つの手順

以下のデータは、各国の年ごとの GDP を示したものです。1960 年から 2024 年までの各年が、それぞれ 1 つの列(変数)として構成されています。そのため、1 行が 1 つの国の GDP の推移を表しています。

データを眺めていると、ところどころに欠測値が存在することが分かります。

Masukawa_Nao_0-1766119249565.png

データの出典:世界銀行(https://www.worldbank.org/)取得日:2025/12/16 

 

このデータにおいて欠測値になっている理由としては、統計の取得体制の問題や、まだ調査・集計が行われていないことなどが考えられます。この後、国ごとのGDPのトレンド把握や国同士の比較を行うのであれば、まずはデータの欠測値の状況を把握しておくことが重要です。

データ中の欠測値を調べる方法として、JMPでは「欠測値を調べる」という、欠測値のパターンを確認したり、補完を行ったりできるプラットフォームが用意されています。

Masukawa_Nao_0-1766134017072.png

ただ、まずは

  • 欠測値がどの程度存在するのか
  • どのようなパターンで発生しているのか

を素早く確認したい、という場合には、他の機能を利用する方法も考えられます。

本記事では、欠測値を迅速かつ効果的に調べる方法を 3 つ紹介します。
以下の 1 → 2 → 3 の流れで確認していく方法がおすすめです。

  1. 「列マネージャー」の利用:各変数の欠測値数を把握
  2. 「欠測値パターン表示」の利用:欠測が生じている傾向を把握
  3. 「セルプロット」の利用:データの順番に対する欠測パターンを把握

1~3のそれぞれについて見ていきましょう。

 

1. 「列マネージャー」の利用

JMP 18以降では、列パネル(データテーブル左中央)にある「列マネージャー」ボタンをクリックすることで、各列の要約統計量を即座に確認できます。これにより、各列の欠測値の数を確認できます。

Masukawa_Nao_1-1766134290019.png

このデータでは、すべての年に欠測値が存在していること、特に 1960 年~1964 年頃は欠測値が多く、その後は徐々に減少していることが分かります。

 

2. 「欠測値パターン表示」の利用

1.では、各変数ごとの欠測値の数を確認しましたが、例えば「連続する 2 年間だけデータが取得されていない」といった欠測のパターンが存在する場合もあります。

「欠測値パターン表示」の機能を用いると、データテーブル内に欠測値が含まれる場合、この欠測値に何らかのパターンがあるかどうかを確認できます。また、欠測値が1つも含まれていない行を抽出するといった用途でも利用できます。

[テーブル] > [欠測値パターン表示] で1960年~2024年の列(計65列)を対象に実行すると、新しいデータテーブルが出力されます。ここでは、それを度数で降順にソートした結果を示します。

Masukawa_Nao_2-1766134486359.png

出力されたテーブルの値に対し、0は欠測でない、1が欠測であることを示しています。

列「パターン」には、指定した列に対する欠測値の有無を0/1で表現されています。列「度数」は、その欠測パターンに該当する行数を示しています。

1 行目は、パターンが「000000…000」となっており、すべての列で欠測がない、すなわちすべての年に値が入力されている行であることを示しています。このデータでは、そのような行が 110 件存在します。

5行目は、最初の5列(1960~1964年)が欠測で、1965以降は欠測がないパターンであり、このような行が6件あることがわかります。

なお、「欠測値パターン表示」で出力されるテーブルは元のデータと連動しています。例えば 1 行目を選択すると、元のデータテーブル上で該当する行が選択されます。

Masukawa_Nao_3-1766134516930.png

この状態で、[テーブル] > [サブセット]を使うことにより、欠測値が1つも含まれていないデータのみを抽出できます。

3. 「セルプロット」の利用

欠測値が発生する位置として、データの先頭付近・中央付近・末尾付近のどこに多いのかを把握することも重要です。例えば、時間順に取得された工程データでは、欠測がデータの前半に多いのか、後半に多いのかを把握したいケースがあります。

このような場合に「セルプロット」を用いると、データを縮小したセル表示の中で、欠測値の分布を直感的に可視化できます。

今回の例では、2020 年~2024 年の 5 年間の GDP 平均値を用いて国を降順に並べ替え、近年の GDP 水準と欠測との関係を確認してみます。

[グラフ] > [セルプロット]で 年を[Y, 応答変数]、国名(Country Name)を[ラベル]に指定すると、セルプロットのレポートが表示されます。

セルプロットは、データテーブルの各セルを色付きの四角形として可視化したグラフです。

ここではセルの色ではなく、セル内に表示される「×」マークに注目してください。この「×」は、そのセルが欠測値であることを示しています。

Masukawa_Nao_4-1766134710443.png

このように「×」の分布を見ると、GDP が低めの国(データの下側)ほど欠測値が多い傾向があり、また近年である 2023 年、2024 年についても欠測となっている国がいくつか存在することが分かります。

これは、GDP が高い国ほど、こうした経済統計を安定して取得・公表できる体制が整っていることが一因であると考えられます。

 

欠測値は、データ分析を始める前に必ず確認しておきたい重要なポイントです。
事前に欠測の有無や傾向を把握することで、その後の分析や解釈を適切に進めることができます。

 

by 増川 直裕(JMP Japan)

Naohiro Masukawa - JMP User Community

Last Modified: Dec 23, 2025 8:06 PM