cancel
Showing results for 
Show  only  | Search instead for 
Did you mean: 
The Discovery Summit 2025 Call for Content is open! Submit an abstract today to present at our premier analytics conference.
See how to use to use Text Explorer to glean valuable information from text data at April 25 webinar.

Naohiro Masukawa

Choose Language Hide Translation Bar

Latest Posts

  • Lasso回帰の有効性をシミュレーションで確認 ~多重共線性のあるデータに対して~

    機械学習の分野では、変数が多いデータを扱うことが多く、そのようなデータを扱うと多重共線性が発生することがあります。その際、多重共線性を回避する手法であるLassoをはじめとする正則化回帰が用いられることがあります。   JMP Proでは「一般化回帰」という手法としてこの正則化回帰を利用でき、パラメータ推定値(回帰係数)を収縮や変数選択によって、多重共線性を影響を抑えた安定したモデル推定が可能になります。   以下の図は、Lassoによって回帰係数が収縮されたときの様子を示しています。レポート「元の説明変数に対する推定値」を見ると、効果の小さい説明変数は0(ゼロ)に収縮されており、Lassoが変数選択を行っていることが確認できます。 では、多重共線性が存在するデータについて、Lasso回帰はどのように有効なのでしょうか。本記事では、応答(Y)との真の関係をあらかじめ定めた仮想データを用い...

    Masukawa_Nao Masukawa_Nao
    Naohiro Masukawa |
    Apr 14, 2025 5:00 PM
    104 views | 0 replies
    Masukawa_Nao_1-1744607144605.png
  • JMPのグラフビルダーで作る「サンキーダイアグラム」の描き方

    みなさんは、次のようなグラフをご覧になったことはありますでしょうか?近年、さまざまな分野で活用されているグラフです。   このグラフをはじめて見る方も、何となくその意味を感じ取ることができるのではないでしょうか。 このグラフは、「サンキーダイアググラム(Sanky Diagram)」と呼ばれています。   上記のグラフは色の好みを尋ねたアンケートの結果例です。「一番好きな色」、「性別」、「年齢」という設問を横軸に配置しており、各軸における間隔の太さは、回答数の割合に比例しています。   グラフからは「50代はBlueを好む割合が高い」、「40代の女性はPurpleを好む割合が高い」などの傾向が一目でわかります。   本記事では、まずサンキーダイアグラムの概要を説明し、その後、2つの分析例をもとに、JMPでサンキーダイアグラムを描く方法を紹介します。記事の最後には、操作方法を示したビデオも...

    Masukawa_Nao Masukawa_Nao
    Naohiro Masukawa |
    Mar 31, 2025 5:18 PM
    340 views | 0 replies
    Masukawa_Nao_1-1743406139257.png
  • 近年のバージョンアップで追加された「効果量」の表示機能 ~その用途と活用法~

    近年のJMPのバージョンアップ において、最新版のJMP 18ではt検定における効果量「Cohenのd」(Cohen's d)を、JMP 17以降では回帰分析における効果量「η2」(イータ2乗)、「ω2」(オメガ2乗)を出力できるようになりました。     効果量とは、統計モデルにおける説明変数(要因)が目的変数に与える影響の大きさを示す指標です。要因が(偶然ではなく)目的変数に影響を与えているかを示す指標としてp値がありますが、これは統計的な有意性を判断するものであり、効果の大きさを示すものではありません。   JMPでは「モデルのあてはめ」のレポートとして、以下の「効果の要約」が表示されます。このレポートでは、p値が小さい順(対数価値が大きい順)に並びますが、これは性別、薬、性別*薬の順に効果が大きいことを直接示すわけではありません。あくまで統計的な有意性の大きさを示しています。  ...

    Masukawa_Nao Masukawa_Nao
    Naohiro Masukawa |
    Mar 18, 2025 5:00 PM
    336 views | 0 replies
    Masukawa_Nao_0-1742194411409.png
  • 時系列分析による2024年の出生数予測は概ね的中。2025年の予測結果と希望の兆しとは?

    先日、昨年(2024年)の日本の出生数(速報値)が発表され、過去最低の約720,988人であることが明らかになりました。   昨年末には「70万人を割るのではないか」との予測もありましたが、なんとか踏みとどまりました。2015年からの出生数の推移をみると以下の通りです。毎年減少を続けており、2024年の出生数は2015年と比べて約3割減少しています。   昨年実施した出生数の予測に対する答え合わせ 実は、ちょうど昨年の今頃、2023年までの出生数のデータをもとに、時系列分析を用いて2024年の出生数を予測していました。「状態空間平滑化モデル」、「ARIMAモデル」の2つの手法による予測結果を以下に示します。 2024年始めに行った2024年の出生数予測 実際の出生数は予測よりやや下振れしたものの、ある程度の精度で予測できていました。特に、状態空間平滑化モデルによる予測誤差はわずか-0.7...

    Masukawa_Nao Masukawa_Nao
    Naohiro Masukawa |
    Mar 2, 2025 7:00 PM
    300 views | 0 replies
    Masukawa_Nao_0-1740731876869.png
  • 「MaxDiff計画」を用いたキャラメルポップコーンのおいしさ調査

    「ポップコーンにキャラメルがかかっているだけで、こんなにおいしいなんて!」 筆者が初めてキャラメルポップコーンを食べたときの感動は今でも忘れられません。普段はあまりポップコーンを食べることはありませんが、キャラメルポップコーンだけは好んで食べています。 スーパーにいくと、さまざまなキャラメルポップコーンが販売されています。いくつか試してみると、「これはおいしい!」と思うものや、キャラメル感が強いもの、味が控えめなものなど、それぞれに特徴があることがわかりました。   ちょうどその頃、JMPに「MaxDiff計画」という新機能が追加されました。「これはキャラメルポップコーンのおいしさを調べるために使えそうだ!」と思い、弊社(JMP Japan)の社員に協力をお願いし、調査を実施しました。かなり前の調査にはなりますが、その結果を報告します。   MaxDiff計画とは? 消費者調査では、「選...

    Masukawa_Nao Masukawa_Nao
    Naohiro Masukawa |
    Feb 19, 2025 8:10 PM
    186 views | 0 replies
    23315286_m.jpg
  • 共変量を変化させたときの薬物動態モデルの考察

    下図は、12人の患者に特定の薬剤を投与した際の薬物濃度の時間経過を示す折れ線グラフです。薬物は投与後に体内で吸収され、濃度が急激に上昇した後、分布や代謝によって濃度が緩やかに低下します。このグラフは、薬物動態の基本的なパターンを示しています。 患者ごとの折れ線を観察すると、濃度の変化に個人差が見られます。この差異は通常、薬物の種類、投与経路、患者個々の特性(例:体重や代謝能力)などによるものです。   例えば、体重が大きい患者では分布容積が増加し、最大濃度(Cmax)が低くなる可能性があります。また、投与量や薬剤の種類によっても濃度推移が変化することがあります。   これら、薬物動態に影響を及ぼす可能性がある要素は「共変量」と呼ばれ、共変量の違いによって薬物濃度はどのように影響を及ぼすかを解析することがあります。   本ブログでは、JMP(JMP Pro) の「曲線のあてはめ」プラットフ...

    Masukawa_Nao Masukawa_Nao
    Naohiro Masukawa |
    Jan 21, 2025 4:00 PM
    286 views | 0 replies
    Masukawa_Nao_0-1737425701437.png
  • 「工程のスクリーニング」の「シフトグラフ」で近年の気温上昇を検出する試み

    「工程のスクリーニング」は、多数の工程を一度に評価できるプラットフォームです。各工程における工程能力や管理図の指標を算出し、重要な工程を効率的にスクリーニングできます。   このプラットフォームでは、次のような「シフトグラフ」を描けるのはご存じでしょうか? このグラフにより、どの工程でいつシフト(後述)が発生したのかを視覚的に考察できます。また、気になる工程についてはドリルダウンで詳細に分析できます。 本ブログでは、日本各地の気温データを一種の「工程」とみなし、気温の急激な上昇(シフト)がいつ発生したか、また観測地点ごとの上昇幅の違いについて考察します。   分析対象 対象地域:日本の管区気象台および地方気象台(データが存在する58地点)対象期間:1995年~2024年(30年間)に対し、各年6月から8月(夏)のデータ指標:日ごとの平均気温、最高気温、最低気温について、3か月間の平均を算...

    Masukawa_Nao Masukawa_Nao
    Naohiro Masukawa |
    Jan 15, 2025 4:00 PM
    347 views | 0 replies
    Masukawa_Nao_0-1736901599147.png
  • 格差分析の新視点:MLBホームラン数の偏りをジニ係数で読み解く

    このブログでは、経済や社会分野で所得や貯蓄の格差を分析する際に用いられる「ローレンツ曲線」と「ジニ係数」について説明します。併せてMLB(メジャーリーグベースボール)の各チームにおけるホームラン数の偏りを分析するために、JMPを用いてローレンツ曲線で視覚化し、ジニ係数で定量化した例を紹介します。   不平等さを測る指標:ジニ係数とローレンツ曲線 データの偏りや不平等を定量化する指標として、「ジニ係数」がよく知られています。そして、その不平等を視覚的に表現するために「ローレンツ曲線」が用いられます。   ジニ係数は「不平等の指標」とも呼ばれ、所得格差や教育格差など、さまざまな分野で格差の度合いを示す際に使われています。   下図は、家庭における所得格差を視覚化したローレンツ曲線(青色)です。横軸は家庭の累積割合、縦軸は累積所得割合を示します。所得格差がなく平等の場合、ローレンツ曲線は点線で示...

    Masukawa_Nao Masukawa_Nao
    Naohiro Masukawa |
    Dec 23, 2024 4:00 PM
    429 views | 0 replies
    Masukawa_Nao_0-1734509627839.png
  • スペクトルデータの分析で「前処理」の重要性を感じた事例

    先日、日本のお客様向けに「JMPによるスペクトルデータ/クロマトグラムデータの多変量解析」というタイトルのセミナーを実施しました。   このセミナーは、タイトルの通りスペクトルやクロマトグラムデータを扱うニッチな内容だったため、参加者は少ないだろうと勝手に思っていました。しかし、想像を大きく覆すほどの多くの方にご参加いただきました。有難い限りです!   セミナーの中では、主に以下のラマンスペクトルのデータを扱いました。   分析の目的 ウコン中に含まれる鉛の含有量をラマン分光法(散乱モード)を用いて定量するためのモデルを開発する   スペクトルデータの概要 鉛濃度が異なるように調製された42種類のウコンを含む試料を準備鉛の濃度によって、A~Fの6つのグループ(各グループ7つの試料)に分類   以下の図は、42種類の試料のラマンスペクトルデータを「グラフビルダー」を使って視覚化したものです。...

    Masukawa_Nao Masukawa_Nao
    Naohiro Masukawa |
    Dec 8, 2024 4:00 PM
    493 views | 0 replies
    Masukawa_Nao_0-1733463127064.png
  • 作業効率アップ!「モデルのあてはめ」のレポートカスタマイズ術

    JMPの「モデルのあてはめ」プラットフォームでは、回帰分析、分散分析、(名義、順序)ロジスティック回帰、一般化線形モデルなど、さまざまなモデルを構築することができます。   観測されたデータについて回帰モデルをあてはめたり、実験計画法で計画した実験データについて応答曲面モデルをあてはめたりする用途において、この「モデルのあてはめ」プラットフォームが利用されます。   「モデルの指定」ウィンドウで、[Y] に連続尺度を指定すると、デフォルトの手法として[標準最小2乗]が選択されます。このとき、レポートウィンドウに最初に表示されるグラフや表がどのように決まるかご存じでしょうか?   強調点によって最初に表示されるレポートが決まる仕組み 実は、「強調点」で指定された項目によって、最初に表示される表やグラフが決まります。     それぞれの「強調点」の項目によって、最初に表示されるグラフや表を以...

    Masukawa_Nao Masukawa_Nao
    Naohiro Masukawa |
    Dec 1, 2024 4:00 PM
    556 views | 0 replies
    Masukawa_Nao_0-1732758276570.png
  • あり得ない因子設定を回避した最適化  ~プロファイルの外挿抑制について~

    JMPの「プロファイル」機能では、予測モデルを視覚化して、因子(説明変数)を変更したときの応答(目的変数)の予測値の変化をインタラクティブに調べることができます。さらに、応答の最大化、最小化するような因子の値を見つける「最適化」の機能も搭載されています。   しかし、因子の値を無制限に調べてしまうと、実際のデータから大きく逸脱した現実ではあり得ない設定値を扱うことがあり、これは「外挿」と呼ばれる予測の危険性を伴います。そのため、最適化をした際、現実にはあり得ない因子設定による予測値を求めることもできてしまうので注意が必要です。   そこでJMPの「プロファイル」機能では、「外挿の抑制」をオンにすることで、現実的でない因子設定を回避することが可能です。以下の例では、この「外挿の抑制」機能を使った場合と使わない場合を比較して説明します。     外挿の抑制を用いた実例 今回は、医薬品の製造工...

    Masukawa_Nao Masukawa_Nao
    Naohiro Masukawa |
    Nov 20, 2024 3:50 PM
    351 views | 0 replies
    Masukawa_Nao_0-1732078030894.png
  • ドジャーズ大谷選手の打球速度と打球角度を視覚化したときに気づいたこと

    今年、大型契約でドジャーズに移籍した大谷選手ですが、打者として54本塁打、57盗塁という驚異的な成績を残しました。   今年もその豪快なパワーでホームランを量産しましたが、少し気になり、今年(2024年)と昨年(2023年)のレギュラーシーズンにおけるホームランの打球速度と角度を視覚化してみました。   下図の左側が今年の54本のホームラン、右側が昨年の44本のホームランに対する打球速度(Exit Velocity)と打球角度(Launch Angle)です。   ※データの引用:BaseBall Savantより大谷選手のホームランデータを抽出   この図には、分布を表現する密度(JMPで言うところの等高線)も加えていますが、今年と昨年で違いが見てとれます。特に今年の等高線を見ると、2つのグループに分かれていることがわかります。   次に、昨年と今年の打球速度と角度の分布を詳しく見てい...

    Masukawa_Nao Masukawa_Nao
    Naohiro Masukawa |
    Oct 6, 2024 11:45 PM
    866 views | 0 replies
    Masukawa_Nao_0-1728260073421.png
  • 製造業における「同等性検定」の活用:2グループの計量値の差に対する同等性

    先日、日本のお客様向けに「JMPを用いた統計的仮説検定入門」という題目でWebセミナーを実施しました。セミナーの特性上、医療や医薬関係に従事している方が多く参加すると思っていたのですが、実際は半導体、電気・電子部品、素材などを開発している製造業の方々も多く参加されました。   このセミナーでは、JMPの同等性検定について説明しました。セミナー後の参加者へのアンケートによると、同等性検定を利用するケースとして、工程変更前後の品質、新規導入した装置、組立工場が違う製品、原材料変更、製品ロット間での同等性を調べることが挙げられていました。

    同等性検定の結果を視覚的に表す「フォレストプロット」 また、アンケートでは業務で同等性を調べるケースが多いとのコメントや、業務で同等性検定を利用する用途があり、役に立ったというコメントも頂きました。   そこで本ブログでは、セミナー内容の復習およびフォローアッ...

    Masukawa_Nao Masukawa_Nao
    Naohiro Masukawa |
    Sep 18, 2024 5:00 PM
    1118 views | 0 replies
    Masukawa_Nao_0-1726640912738.png
  • 「三角図」を用いて配合実験の等高線をグラデーション表示する方法

    JMPでは、[グラフ] メニューに「三角図」というグラフを作成できるプラットフォームがあります。3つの成分をもつデータをグラフ化し、分布やばらつきを調べるのに有用なグラフではありますが、実験計画法における配合実験で用いると効果的なケースがあります。   「三角図」では、以下に示したようなグラフを描くことができます。グラフ上の色のグラデーションは、実験計画法で作成したモデルの予測値を等高線として示したものです。     このような図は、どのような手順で描くのでしょうか。配合実験の具体例を示しながら説明します。   配合実験とは 配合実験とは、配合物の成分(比率)を因子とする実験のことであり、各因子の取りうる値が0(0%)~1(100%)の範囲にあります。さらに、すべての因子の比率の合計は1(100%)という制約もあります。このため、実験空間は(因子数 - 1)次元の領域となります。   例...

    Masukawa_Nao Masukawa_Nao
    Naohiro Masukawa |
    Sep 8, 2024 11:51 PM
    672 views | 1 replies
    Masukawa_Nao_0-1725859466060.png
  • 景気後退のシグナル点灯?? JMPでシグナル「サームルール」を算出し視覚化する

    先週末、世界中がパリオリンピックの選手の活躍に注目していた中、アメリカでは7月の雇用統計が発表されました。今回の雇用統計では失業率が市場予想を上回り、景気後退のシグナルである「サームルール(Sahm Rule)」が点灯されたことが話題となりました。   サームルールとは、元FRBのクローディア・サーム氏が提唱した失業率より計算されます。具体的には、その値(パーセンテージ)が0.5を上回ると、景気後退に陥る可能性が高いとされています。   今回の雇用統計では、2024年7月の失業率が4.3%と発表され、サームルールによるパーセンテージが0.53となり、コロナ以降初めて0.5を上回りました。     サームルールによるパーセンテージは、月次の失業率より以下の定義で算出されます。   ①直近3か月の失業率の平均(3か月移動平均) ②過去12か月間の3か月移動平均の最小値   パーセンテージ (...

    Masukawa_Nao Masukawa_Nao
    Naohiro Masukawa |
    Sep 8, 2024 11:49 PM
    1904 views | 1 replies
    Masukawa_Nao_0-1722835890787.png
  • JMPでBland-Altman分析:測定方法の一致性を評価する手法

    Bland-Altman分析は、2つの測定方法の一致性を評価するための統計的手法であり、主に医療や製造の分野で広く用いられています。以下に示すのは、Bland-Altaman分析を行う際に使用される「Bland-Altmanプロット」というグラフです。このプロットでは、縦軸に2つの測定値の差を、横軸に2つの測定値の平均をプロットすることで、測定間のバイアス(偏り)や一致性を評価できます。   図:Bland-Altman プロット   JMPでは、バージョン17で「対応のあるペア」のオプションとしてBland-Altman分析が搭載され、最新のバージョン18では機能がさらに追加されています。   本ブログでは、Bland-Altman分析の概要とJMPを使った分析の手順、注意点について説明します。   使用するデータ JMPのサンプルデータ「Method Comparison.jmp」を...

    Masukawa_Nao Masukawa_Nao
    Naohiro Masukawa |
    Sep 1, 2024 7:43 PM
    3044 views | 0 replies
    Masukawa_Nao_0-1724996189844.png
  • 「選択モデル」によるコンジョイント分析で、JMPのグラフ設定の好みを調査した結果は?

    どちらのグラフが好きですか? JMPユーザに、以下のような2のグラフ(A,B)を提示し、好ましい方を選んでいただきます。その後、別のパターンのグラフを提示し、同様に好ましいグラフを選んでいただきます。   これは、複数の選択肢から最も好ましいものを選ぶ「選択実験」を行っている状況です。選択実験を通じて、どのスタイルのグラフが最も好ましいのかを調べることができます。   実は昨年、この選択実験を日本のお客様に実施し、その結果を分析するセミナーを開催しました。本ブログでは、その際に行った選択実験の内容と結果の概要をご紹介します。   JMPのグラフスタイルに関する調査 調査の目的は、JMPで出力されるグラフに関する以下の4つ(①~④)のスタイルについて、最も好ましい設定の組み合わせを見つけることです。     スタイル選択肢①グラフの境界線あり、なし②目盛りの位置外側、内側➂ウィンドウの背...

    Masukawa_Nao Masukawa_Nao
    Naohiro Masukawa |
    Aug 22, 2024 9:40 PM
    1368 views | 0 replies
    Masukawa_Nao_0-1724371851923.png
  • オリンピックのメダル数はその国の豊かさで説明できるのか? ~メダル数を説明する回帰モデルの構築~

    熱戦が繰り広げられていたパリオリンピックが閉会しました。猛暑が続いたため、屋外には出ずに屋内でオリンピック観戦を楽しんでいた方も多かったことでしょう。   2週間程度のオリンピックでしたが、日本は合計45個のメダルを獲得し、海外大会のオリンピックでは最多の獲得数となりました。とはいっても、前回の東京オリンピックで日本が58個のメダルを獲得しています。   今回獲得したメダル数45個は妥当な数だったのでしょうか? この点を経済面から考えてみます。     かなり前のことですが、「マンキュー 入門経済学」という名著を使って経済学を学んでいた際、この本の中に「オリンピックで勝つのは誰か」という題名のコラムがあり、非常に印象に残っています。   このコラムでは、ある国が獲得するオリンピックのメダル数はその国のGDP(国内総生産)や人口が説明要因となると述べています。経済的に豊かな国ほど多くの才能...

    Masukawa_Nao Masukawa_Nao
    Naohiro Masukawa |
    Aug 12, 2024 11:59 PM
    1071 views | 0 replies
    Masukawa_Nao_0-1723517407157.png
  • 「一変量の分布」で実施できる「工程能力分析」のレポートを徹底理解(計算式を示したスクリプト付き)

    JMPで工程能力分析をする際には、「工程のスクリーニング」や「工程能力」のプラットフォームがありますが、最もわかりやすいのは「一変量の分布」プラットフォームで [工程能力] のオプションを使用する方法でしょう。   JMPのサンプルデータ「Pickles.jmp」に対して、連続尺度の列「酸度」について「一変量の分布」で仕様限界(下側 = 8、上側 = 17)を設定し、工程能力分析を実行すると、次のレポートが表示されます。     レポートには、「ヒストグラム」、「工程の要約」、「群内シグマ 工程能力」、「全体シグマ 工程能力」、「不適合率」の項目があり、これらのグラフや統計量を理解しておくことは、工程能力分析を実施する上で重要です。   単にCpkやPpkといった工程能力指数を算出することが目的であり、レポートの該当の箇所を見れば良いという考えもあるかもしれませんが、これらの指標をどのよ...

    Masukawa_Nao Masukawa_Nao
    Naohiro Masukawa |
    Aug 6, 2024 11:14 PM
    1423 views | 0 replies
    Masukawa_Nao_0-1722933796046.png
  • 次元削減の新技術 UMAP、t-SNE でデータパターンの視覚化を

    多変量データの関係性を調べる際、2次元や3次元程度に次元を削減してデータの関連性を調べる方法として主成分分析(PCA)がよく用いられます。   しかし近年、次元削減の方法としてUMAP、t-SNEという手法が脚光を浴びています。これらは非線形な次元削減手法であり、線形な次元削減方法である主成分分析ではうまくデータ構造を表現できないときでも有効であると言われています。   これらの手法も次元削減方法なので、多次元のデータを2次元や3次元に削減してデータのパターンを視覚的に調べられます。   機械学習の分野でも、UMAPやt-SNEは次元削減の目的で広く利用されています。例えば、画像認識、テキスト分類、遺伝子解析など、様々な用途で有効です。   ちょうどJMP Proには「多変量埋め込み」というプラットフォームがあり、UMAP、t-SNEの手法を搭載しています。   t-SNEを用いたサンプ...

    Masukawa_Nao Masukawa_Nao
    Naohiro Masukawa |
    Jul 23, 2024 4:40 PM
    1693 views | 0 replies
    Masukawa_Nao_0-1721718347375.png