cancel
Showing results for 
Show  only  | Search instead for 
Did you mean: 

Naohiro Masukawa

Choose Language Hide Translation Bar

Latest Posts

  • スペクトルデータの分析で「前処理」の重要性を感じた事例

    先日、日本のお客様向けに「JMPによるスペクトルデータ/クロマトグラムデータの多変量解析」というタイトルのセミナーを実施しました。   このセミナーは、タイトルの通りスペクトルやクロマトグラムデータを扱うニッチな内容だったため、参加者は少ないだろうと勝手に思っていました。しかし、想像を大きく覆すほどの多くの方にご参加いただきました。有難い限りです!   セミナーの中では、主に以下のラマンスペクトルのデータを扱いました。   分析の目的 ウコン中に含まれる鉛の含有量をラマン分光法(散乱モード)を用いて定量するためのモデルを開発する   スペクトルデータの概要 鉛濃度が異なるように調製された42種類のウコンを含む試料を準備鉛の濃度によって、A~Fの6つのグループ(各グループ7つの試料)に分類   以下の図は、42種類の試料のラマンスペクトルデータを「グラフビルダー」を使って視覚化したものです。...

    Masukawa_Nao Masukawa_Nao
    Naohiro Masukawa |
    Dec 8, 2024 4:00 PM
    968 views | 0 replies
    Masukawa_Nao_0-1733463127064.png
  • 作業効率アップ!「モデルのあてはめ」のレポートカスタマイズ術

    JMPの「モデルのあてはめ」プラットフォームでは、回帰分析、分散分析、(名義、順序)ロジスティック回帰、一般化線形モデルなど、さまざまなモデルを構築することができます。   観測されたデータについて回帰モデルをあてはめたり、実験計画法で計画した実験データについて応答曲面モデルをあてはめたりする用途において、この「モデルのあてはめ」プラットフォームが利用されます。   「モデルの指定」ウィンドウで、[Y] に連続尺度を指定すると、デフォルトの手法として[標準最小2乗]が選択されます。このとき、レポートウィンドウに最初に表示されるグラフや表がどのように決まるかご存じでしょうか?   強調点によって最初に表示されるレポートが決まる仕組み 実は、「強調点」で指定された項目によって、最初に表示される表やグラフが決まります。     それぞれの「強調点」の項目によって、最初に表示されるグラフや表を以...

    Masukawa_Nao Masukawa_Nao
    Naohiro Masukawa |
    Dec 1, 2024 4:00 PM
    877 views | 0 replies
    Masukawa_Nao_0-1732758276570.png
  • あり得ない因子設定を回避した最適化  ~プロファイルの外挿抑制について~

    JMPの「プロファイル」機能では、予測モデルを視覚化して、因子(説明変数)を変更したときの応答(目的変数)の予測値の変化をインタラクティブに調べることができます。さらに、応答の最大化、最小化するような因子の値を見つける「最適化」の機能も搭載されています。   しかし、因子の値を無制限に調べてしまうと、実際のデータから大きく逸脱した現実ではあり得ない設定値を扱うことがあり、これは「外挿」と呼ばれる予測の危険性を伴います。そのため、最適化をした際、現実にはあり得ない因子設定による予測値を求めることもできてしまうので注意が必要です。   そこでJMPの「プロファイル」機能では、「外挿の抑制」をオンにすることで、現実的でない因子設定を回避することが可能です。以下の例では、この「外挿の抑制」機能を使った場合と使わない場合を比較して説明します。     外挿の抑制を用いた実例 今回は、医薬品の製造工...

    Masukawa_Nao Masukawa_Nao
    Naohiro Masukawa |
    Nov 20, 2024 3:50 PM
    581 views | 0 replies
    Masukawa_Nao_0-1732078030894.png
  • ドジャーズ大谷選手の打球速度と打球角度を視覚化したときに気づいたこと

    今年、大型契約でドジャーズに移籍した大谷選手ですが、打者として54本塁打、57盗塁という驚異的な成績を残しました。   今年もその豪快なパワーでホームランを量産しましたが、少し気になり、今年(2024年)と昨年(2023年)のレギュラーシーズンにおけるホームランの打球速度と角度を視覚化してみました。   下図の左側が今年の54本のホームラン、右側が昨年の44本のホームランに対する打球速度(Exit Velocity)と打球角度(Launch Angle)です。   ※データの引用:BaseBall Savantより大谷選手のホームランデータを抽出   この図には、分布を表現する密度(JMPで言うところの等高線)も加えていますが、今年と昨年で違いが見てとれます。特に今年の等高線を見ると、2つのグループに分かれていることがわかります。   次に、昨年と今年の打球速度と角度の分布を詳しく見てい...

    Masukawa_Nao Masukawa_Nao
    Naohiro Masukawa |
    Oct 6, 2024 11:45 PM
    1292 views | 0 replies
    Masukawa_Nao_0-1728260073421.png
  • 製造業における「同等性検定」の活用:2グループの計量値の差に対する同等性

    先日、日本のお客様向けに「JMPを用いた統計的仮説検定入門」という題目でWebセミナーを実施しました。セミナーの特性上、医療や医薬関係に従事している方が多く参加すると思っていたのですが、実際は半導体、電気・電子部品、素材などを開発している製造業の方々も多く参加されました。   このセミナーでは、JMPの同等性検定について説明しました。セミナー後の参加者へのアンケートによると、同等性検定を利用するケースとして、工程変更前後の品質、新規導入した装置、組立工場が違う製品、原材料変更、製品ロット間での同等性を調べることが挙げられていました。

    同等性検定の結果を視覚的に表す「フォレストプロット」 また、アンケートでは業務で同等性を調べるケースが多いとのコメントや、業務で同等性検定を利用する用途があり、役に立ったというコメントも頂きました。   そこで本ブログでは、セミナー内容の復習およびフォローアッ...

    Masukawa_Nao Masukawa_Nao
    Naohiro Masukawa |
    Sep 20, 2024 12:54 AM
    1704 views | 0 replies
    Masukawa_Nao_0-1726640912738.png
  • 「三角図」を用いて配合実験の等高線をグラデーション表示する方法

    JMPでは、[グラフ] メニューに「三角図」というグラフを作成できるプラットフォームがあります。3つの成分をもつデータをグラフ化し、分布やばらつきを調べるのに有用なグラフではありますが、実験計画法における配合実験で用いると効果的なケースがあります。   「三角図」では、以下に示したようなグラフを描くことができます。グラフ上の色のグラデーションは、実験計画法で作成したモデルの予測値を等高線として示したものです。     このような図は、どのような手順で描くのでしょうか。配合実験の具体例を示しながら説明します。   配合実験とは 配合実験とは、配合物の成分(比率)を因子とする実験のことであり、各因子の取りうる値が0(0%)~1(100%)の範囲にあります。さらに、すべての因子の比率の合計は1(100%)という制約もあります。このため、実験空間は(因子数 - 1)次元の領域となります。   例...

    Masukawa_Nao Masukawa_Nao
    Naohiro Masukawa |
    Sep 8, 2024 11:18 PM
    1016 views | 1 replies
    Masukawa_Nao_0-1725859466060.png
  • JMPでBland-Altman分析:測定方法の一致性を評価する手法

    Bland-Altman分析は、2つの測定方法の一致性を評価するための統計的手法であり、主に医療や製造の分野で広く用いられています。以下に示すのは、Bland-Altaman分析を行う際に使用される「Bland-Altmanプロット」というグラフです。このプロットでは、縦軸に2つの測定値の差を、横軸に2つの測定値の平均をプロットすることで、測定間のバイアス(偏り)や一致性を評価できます。   図:Bland-Altman プロット   JMPでは、バージョン17で「対応のあるペア」のオプションとしてBland-Altman分析が搭載され、最新のバージョン18では機能がさらに追加されています。   本ブログでは、Bland-Altman分析の概要とJMPを使った分析の手順、注意点について説明します。   使用するデータ JMPのサンプルデータ「Method Comparison.jmp」を...

    Masukawa_Nao Masukawa_Nao
    Naohiro Masukawa |
    Sep 1, 2024 7:43 PM
    5274 views | 0 replies
    Masukawa_Nao_0-1724996189844.png
  • 「選択モデル」によるコンジョイント分析で、JMPのグラフ設定の好みを調査した結果は?

    どちらのグラフが好きですか? JMPユーザに、以下のような2のグラフ(A,B)を提示し、好ましい方を選んでいただきます。その後、別のパターンのグラフを提示し、同様に好ましいグラフを選んでいただきます。   これは、複数の選択肢から最も好ましいものを選ぶ「選択実験」を行っている状況です。選択実験を通じて、どのスタイルのグラフが最も好ましいのかを調べることができます。   実は昨年、この選択実験を日本のお客様に実施し、その結果を分析するセミナーを開催しました。本ブログでは、その際に行った選択実験の内容と結果の概要をご紹介します。   JMPのグラフスタイルに関する調査 調査の目的は、JMPで出力されるグラフに関する以下の4つ(①~④)のスタイルについて、最も好ましい設定の組み合わせを見つけることです。     スタイル選択肢①グラフの境界線あり、なし②目盛りの位置外側、内側➂ウィンドウの背...

    Masukawa_Nao Masukawa_Nao
    Naohiro Masukawa |
    Aug 22, 2024 9:40 PM
    1680 views | 0 replies
    Masukawa_Nao_0-1724371851923.png
  • オリンピックのメダル数はその国の豊かさで説明できるのか? ~メダル数を説明する回帰モデルの構築~

    熱戦が繰り広げられていたパリオリンピックが閉会しました。猛暑が続いたため、屋外には出ずに屋内でオリンピック観戦を楽しんでいた方も多かったことでしょう。   2週間程度のオリンピックでしたが、日本は合計45個のメダルを獲得し、海外大会のオリンピックでは最多の獲得数となりました。とはいっても、前回の東京オリンピックで日本が58個のメダルを獲得しています。   今回獲得したメダル数45個は妥当な数だったのでしょうか? この点を経済面から考えてみます。     かなり前のことですが、「マンキュー 入門経済学」という名著を使って経済学を学んでいた際、この本の中に「オリンピックで勝つのは誰か」という題名のコラムがあり、非常に印象に残っています。   このコラムでは、ある国が獲得するオリンピックのメダル数はその国のGDP(国内総生産)や人口が説明要因となると述べています。経済的に豊かな国ほど多くの才能...

    Masukawa_Nao Masukawa_Nao
    Naohiro Masukawa |
    Aug 12, 2024 11:59 PM
    1412 views | 0 replies
    Masukawa_Nao_0-1723517407157.png
  • 「一変量の分布」で実施できる「工程能力分析」のレポートを徹底理解(計算式を示したスクリプト付き)

    JMPで工程能力分析をする際には、「工程のスクリーニング」や「工程能力」のプラットフォームがありますが、最もわかりやすいのは「一変量の分布」プラットフォームで [工程能力] のオプションを使用する方法でしょう。   JMPのサンプルデータ「Pickles.jmp」に対して、連続尺度の列「酸度」について「一変量の分布」で仕様限界(下側 = 8、上側 = 17)を設定し、工程能力分析を実行すると、次のレポートが表示されます。     レポートには、「ヒストグラム」、「工程の要約」、「群内シグマ 工程能力」、「全体シグマ 工程能力」、「不適合率」の項目があり、これらのグラフや統計量を理解しておくことは、工程能力分析を実施する上で重要です。   単にCpkやPpkといった工程能力指数を算出することが目的であり、レポートの該当の箇所を見れば良いという考えもあるかもしれませんが、これらの指標をどのよ...

    Masukawa_Nao Masukawa_Nao
    Naohiro Masukawa |
    Aug 6, 2024 11:41 PM
    2091 views | 0 replies
    Masukawa_Nao_0-1722933796046.png
  • 景気後退のシグナル点灯?? JMPでシグナル「サームルール」を算出し視覚化する

    先週末、世界中がパリオリンピックの選手の活躍に注目していた中、アメリカでは7月の雇用統計が発表されました。今回の雇用統計では失業率が市場予想を上回り、景気後退のシグナルである「サームルール(Sahm Rule)」が点灯されたことが話題となりました。   サームルールとは、元FRBのクローディア・サーム氏が提唱した失業率より計算されます。具体的には、その値(パーセンテージ)が0.5を上回ると、景気後退に陥る可能性が高いとされています。   今回の雇用統計では、2024年7月の失業率が4.3%と発表され、サームルールによるパーセンテージが0.53となり、コロナ以降初めて0.5を上回りました。     サームルールによるパーセンテージは、月次の失業率より以下の定義で算出されます。   ①直近3か月の失業率の平均(3か月移動平均) ②過去12か月間の3か月移動平均の最小値   パーセンテージ (...

    Masukawa_Nao Masukawa_Nao
    Naohiro Masukawa |
    Aug 5, 2024 2:39 AM
    2258 views | 1 replies
    Masukawa_Nao_0-1722835890787.png
  • 次元削減の新技術 UMAP、t-SNE でデータパターンの視覚化を

    多変量データの関係性を調べる際、2次元や3次元程度に次元を削減してデータの関連性を調べる方法として主成分分析(PCA)がよく用いられます。   しかし近年、次元削減の方法としてUMAP、t-SNEという手法が脚光を浴びています。これらは非線形な次元削減手法であり、線形な次元削減方法である主成分分析ではうまくデータ構造を表現できないときでも有効であると言われています。   これらの手法も次元削減方法なので、多次元のデータを2次元や3次元に削減してデータのパターンを視覚的に調べられます。   機械学習の分野でも、UMAPやt-SNEは次元削減の目的で広く利用されています。例えば、画像認識、テキスト分類、遺伝子解析など、様々な用途で有効です。   ちょうどJMP Proには「多変量埋め込み」というプラットフォームがあり、UMAP、t-SNEの手法を搭載しています。   t-SNEを用いたサンプ...

    Masukawa_Nao Masukawa_Nao
    Naohiro Masukawa |
    Jul 23, 2024 4:40 PM
    2508 views | 0 replies
    Masukawa_Nao_0-1721718347375.png
  • JMPで効果的なプレゼンテーションを!  ~ジャーナルとレーザーポインタの利用~

    JMPで分析した結果を組織内でプレゼンテーションする際、JMPのジャーナル機能が役立ちます。   ジャーナルはJMPのファイル形式の一つであり、分析に使ったデータテーブル、レポート、スクリプト、WebのURL、テキストなどを含めることができます。   そのため、プレゼンテーションの内容を一つのジャーナルファイルとして保存しておくと、Power Pointなどを使わなくてもJMPだけで完結できます。インタラクティブなJMPな機能を効果的に使うためには、ジャーナルを使うのが最適です。   ジャーナルの例   本ブログでは、JMPでデータ分析結果のプレゼンテーションをされる方を想定し、ジャーナルの基本的な作成方法をご紹介します。併せて、実際にプレゼンテーションをする際に役立つ、JMPのレーザーポインタの機能も紹介します。   ※最後に、ジャーナルの作成方法について動画にしたものを用意しています...

    Masukawa_Nao Masukawa_Nao
    Naohiro Masukawa |
    Jul 9, 2024 4:27 PM
    852 views | 0 replies
    Masukawa_Nao_0-1720492875345.png
  • 「JMP 18」でディスク容量を節約!文字列コンパクト化の実践

    近年、JMPユーザの中で、センサーから秒単位で取得されたデータ、多くのパラメータがある製造データ、ゲノムデータなど、いわゆるビッグデータを扱う方が増えています。   大きなデータの場合、その分ファイルサイズが大きくなるので、ディスクの容量が必要になります。   JMPではもともと、データテーブルを保存時にファイルを圧縮する機能がありますが、最新バージョンの「JMP 18」では、文字タイプの列をコンパクトにする機能が追加されました。この機能を使うと、ファイルサイズを小さくする、メモリを節約することが期待できます。   このブログでは、JMP 18で列をコンパクトにする操作方法を説明し、コンパクトにする内部的な仕組みや、いくつかのデータでコンパクトにしたときのファイルサイズの比較を行います。   文字タイプの列をコンパクトに この機能を述べる際に重要なこととして、コンパクトにできるのは文字タ...

    Masukawa_Nao Masukawa_Nao
    Naohiro Masukawa |
    Jun 19, 2024 7:04 PM
    665 views | 0 replies
    Masukawa_Nao_0-1718765860494.png
  • Masukawa_Nao_0-1716187878792.png
  • JMP 18の新機能 Part 2:データ探索に便利な機能と予測プロファイルのアップデート

    前回のブログ(Part 1) では、JMP 18で強化された「Pyhtonインテグレーション」の機能を用いて、scikit-learnのサンプルデータ「カリフォルニアの住宅価格」をJMPのデータテーブルとして読み込む方法をご紹介しました。   今回のブログ(Part 2)では、読み込んだデータを用いて、住宅価格を築年数、部屋数、緯度、経度などから予測する回帰モデルを作成し、予測プロファイルを使ってモデルを視覚化します。その際、JMP 18ではプロファイルで予測区間を表示できるようになりましたので、この機能も活用してみます。     ただし、データを観察せずいきなりモデルを作成することは危険ですので、グラフ化や要約によってデータを探索してみます。JMP 18では、データを探索するのに便利な機能も追加されています。   ヘッダ統計量、列スイッチャーによるデータ探索 JMPでデータを探索する際...

    Masukawa_Nao Masukawa_Nao
    Naohiro Masukawa |
    May 15, 2024 1:50 AM
    1056 views | 0 replies
    Masukawa_Nao_1-1715741842095.png
  • 1回30分のオムニバスセミナー「JMP 情報局」で実施したことのまとめ(第5回~第8回実施分)

    JMPジャパン事業部では、今年3月から4月にかけて「JMP情報局」というセミナーを毎週火曜日、全8回で実施しました。このセミナーは、毎回30分という短時間でJMPの様々な情報をお伝えすることを目的としており、想定を上回る多くの方々にご参加いただきました。   エンディングで頂いた多くのリアクション   本ブログでは、4月に実施した第5回~第8回で実施した主要なトピックについてまとめています。   ※第1回から第4回の主な内容は、以下のブログをご参照ください。 1回30分のオムニバスセミナー「JMP 情報局」で実施したことのまとめ(第1回~第4回実施分) - JMP User Community。   目次 第5回(本放送4/2、再放送4/9 ) 改めて「一変量の分布」でできることを知る第6回(本放送4/9、再放送4/11 ) 「予測区間と許容区間について」第7回(本放送4/16、再放送4...

    Masukawa_Nao Masukawa_Nao
    Naohiro Masukawa |
    Apr 24, 2024 11:08 PM
    2697 views | 0 replies
    エンディング.png
  • 「Excelプロファイル」でできることを、JMPのプロファイルだけで完結させる方法

    先日、JMPジャパン事業部では「JMP情報局」というセミナーの中で、「Excelプロファイル」に関する説明を行いました。これまであまり紹介してこなかった機能でしたが、多くの方にご参加頂き、いくつかの質問もいただきました。   Excelプロファイルは、Microsoft Excelで作成した数式をJMPの「プロファイル」を使って視覚化する機能です。JMPをインストールする際にExcelアドインを選択すると、このアドインがインストールされます。   JMPのドキュメンテーションには、Excelアドインを使用した例として、サンプルデータ(Demand.xlsx)を用いた総支出(Overall Cost)を在庫(Amount Stocked)や需要(Demand)から算出する数式をもとに、JMPのプロファイルを起動して数式を視覚化する例が示されています。   JMPヘルプの該当箇所(日本語) E...

    Masukawa_Nao Masukawa_Nao
    Naohiro Masukawa |
    Mar 25, 2024 12:30 AM
    1317 views | 0 replies
    nao_masukawa_0-1711331455070.png
  • 過去最低と言われている2023年の出生数ですが、ARIMAモデルでは想定以上に良い結果という結論に・・・ 2024年の出生数予測も

    先日、2023年の日本国内の出生数(速報値)が758,631人となり、過去最少となったという報道がありました。2022年比で約5.1%も減少しており、少子化に待ったなしという状況ではあります。しかし、過去のデータを基にした予測と比較すると、この程度の減少で踏みとどまることができたと肯定的に見ることができます。   本ブログでは、昨年の同時期実施したにARIMAモデルによる2023年の出生数予測の答え合わせと、時系列モデルを用いた2024年の出生数予測について紹介します。   昨年同時期に予測したARIMAモデルによる2023年出生数は、どれぐらい当たっていたのか?   昨年(2023年)の同時期に、2022年までの出生数(月ごと)のデータでARIMAモデルをあてはめ、2023年の出生数を予測するというブログを書いています。丁度、厚生労働省から2023年の月別出生数が公開されたので、答え合わ...

    Masukawa_Nao Masukawa_Nao
    Naohiro Masukawa |
    Feb 28, 2024 10:18 PM
    8375 views | 0 replies
    nao_masukawa_0-1709165930990.png
  • 「データテーブルに表示できるヒストグラム」のさらなる活用(JMPのTips)

    JMPではデータテーブルの左上にあるヒストグラムのアイコンをクリックすると、その場で各列についてのヒストグラムを表示できるのが大きな特徴です。この機能は2つ前のバージョンである「JMP 15」で追加され、多くのお客様から支持を受けています。   下図は、JMPのサンプルデータ「Diabetes.jmp」に対してデータテーブルのヒストグラムを表示したものです。ここで列「Y 2値」のヒストグラムにある ”High”の棒をクリックすると、他の列の該当部分が強調表示され、対応するデータ行が選択されます。     この機能を使うだけでもある程度データを探索できてしまうのですが、今回はデータテーブルのヒストグラムを活用するうえで有用なTipsを3つ紹介します。   その1:「一変量の分布」を起動し、より詳細なグラフ/統計量を表示   データテーブルでヒストグラムを表示させた後、ヒストグラム以外の部...

    Masukawa_Nao Masukawa_Nao
    Naohiro Masukawa |
    Dec 27, 2023 6:24 PM
    1414 views | 0 replies
    nao_masukawa_0-1703728166279.png