「CochranのQ検定」でみる製品評価の一致性
このブログでは複数の製品の特徴を評価する例を扱い、製品間の評価の一致性を調べる方法として「CochrannのQ検定」を、製品と評価の関連性を調べる方法として「対応分析」を用いる方法を紹介します。 「CochranのQ検定」はあまり知られていない検定方法かもしれませんが、今回の例のように複数製品を評価する検定手法として有用ですので、今回の例を参照し実務に使える場面があれば是非...
このブログでは複数の製品の特徴を評価する例を扱い、製品間の評価の一致性を調べる方法として「CochrannのQ検定」を、製品と評価の関連性を調べる方法として「対応分析」を用いる方法を紹介します。 「CochranのQ検定」はあまり知られていない検定方法かもしれませんが、今回の例のように複数製品を評価する検定手法として有用ですので、今回の例を参照し実務に使える場面があれば是非...
JMPでは、データテーブルで数値変数を選択した後、[列] > [ユーティリティ] > [カテゴリ化の計算式の作成] を用いると、その数値変数をさまざまな規則に基づいて、いくつかのカテゴリに分割できます。 例えば、年齢が入力されているデータを、10代、20代、・・・とカテゴリ化したり、100点満点のテストについて80点以上を"合格"のカテゴリ、80点未満...
PDFファイルからのデータ抽出 私は公開されているデータを分析することがありますが、ときどきPDFファイルにある表をデータテーブルにしたいことがあります。特に官公庁等で公開されているデータはExcelやcsv形式でなく、PDFファイルの中にテーブルとして埋め込まれていることが案外多いです。 そんなとき、4,5年前まではPDFファイル上で該当のテーブルを選択してコピーし、...
先日、世界経済フォーラム(WEF)から、ジェンダーギャップに関するレポート(2023)が発表されました。 レポートの中で用いられている「ジェンダーギャップ指数」は、各国における男女格差を数値化したものです。0~1までの値をとり、スコアが1に近いほど男女格差は小さいことを示します。レポートでは146の国を対象としていますが、何と日本は125位で、前年と比べて9ランクダウンして...
現時点での最新バージョン「JMP 17」では「予測プロファイル」のオプションとして「デザインスペースプロファイル」という機能が追加されました。 この機能により "Y(応答)とX(因子)の関係をモデル化した際、応答の仕様限界内に収まるような因子の矩形領域を見つける" ことができるのですが、そもそもこの機能は何を意図として作られたのか? そもそもデザ...
JMPの「等高線プロファイル」 JMPでは「等高線プロファイル」により、あてはめたモデルの予測式を等高線で表示し、因子(X) と特性値(Y)との関係を調べることができます。 特に医薬品の開発や製造段階ではQbD(Quality by Design)コンセプトにおいて、実験計画法により因子と特性との関係を等高線で表し、デザインスペース *を構築することが推奨されています。...
長方形ブロックの日本地図 以下のグラフは、2022年の都道府県別人口10万人あたりの交通事故の死者数(65歳以上)を示しています。グラフ右上の凡例の通り濃い赤い色ほど死者数が多いことをしめすので、パッと見ただけで四国地方の4県はほかの都道府県に比べて多いことなどがわかります。 ※データの出典:警察庁 道路の交通に関する統計 本来はきちんと...
2022年の台風発生状況を可視化 日本では梅雨から夏、秋にかけて多くの台風が発生し、日本列島に上陸すると人々に甚大な被害をもたらすことがあります。 今年もすでに台風1号が4月に発生し、今後増えていくことでしょう。台風が発生しているときはこまめにニュースなどの情報をチェックし、備えておかなくてはなりません。 昨年2022年は25個もの台風が発生し、そ...
本ブログシリーズでは、JMPのプラットフォーム「カテゴリカル」の有用性を示しています。Part 1では単一回答、複数回答などまとめて集計できることを示し、Part 2では属性(性別、年代など)で分けて回答割合やスコアを比較する方法を示しました。最終回であるPart3では、複数回答にはさまざまなデータの持ち方があり、どのような持ち方でも「カテゴリカル」で扱うことができることを示します。 &nb...
前回のPart 1では、「カテゴリカル」プラットフォームを用い、アンケートデータがもつさまざまな形式の回答(単一回答、複数回答、スコア)を一度に集計する例を示しました。 とはいっても、集計のレベルであれば頑張って表計算ソフトでもできますし、アンケートシステムを利用しているのであればシステム上で集計結果を表やグラフで表示してくれます。 では、JMPの「カ...
前回のブログで「カテゴリカル」の概要について紹介する2分間のビデオ(日本語)を紹介しましたが、視聴者からは、"カテゴリカルの機能に関心をもった”、"もっと長いビデオでも良いので詳細を詳しく説明してほしい" という感想を多くいただきました。 そこで、本ブログシリーズ(全3回)にて、アンケートの分析例をもとに「カテゴリカル」の特徴をもっと語っていきます。 ...
「カテゴリカル」プラットフォームとは JMPには、メニューバーから [分析] > [消費者調査] とたどっていくと、[カテゴリカル] というメニューがあります。 「カテゴリカル」という言葉だけだと、質的なデータの分析をする機能なんだろうなという想像はつくでしょう。確かにカテゴリカルデータの扱いが得意なのですが、実はアンケートデータの集...
新しいバージョン「JMP 17」では、「多変量の相関」のプラットフォームで、次のような偏相関図を描けるようになりました。本記事では、相関係数との比較から偏相関係数とは何かを説明し、多変量データについて偏相関図を描くことのメリットを説明します。 偏相関とは 「偏相関図」というその名の通り偏相関係数を図示したものですが、偏相関とは他の変数の影響を...
WBCで観た大谷投手のエグいスライダー その名も"スイーパー" WBCでの日本代表の活躍は、最近の大きな話題になっていますね。私は近年、地上波の野球中継があまりないことから、じっくり野球中継を見ることがなくなってしまいましたが、今回のWBCは大きな話題性も伴い、じっくり見ています。 日本選手の中では、やはり大谷選手が一番注目されており投打で結果を残していますが、本記事で...
想定よりも出生数の減少が進んでいる日本 "2022年の出生数が初の80万人割れ、想定よりかなり早いペースで出生数の減少が進んでいる" というニュースが大きな話題になっています。確かに日本の将来を考えると、出生数が想定以上に減っているのは大きな社会問題だと思います。 実は昨年(2022年)はじめに、時系列分析でよく用いられる季節ARIMAモデルを使って、2014年~202...
Part 1、Part2 ではOECD加盟国(トルコを除く)を対象とし、主成分分析を使って、各国々の幸福度に寄与する要因との関連性や、寄与する要因間の関連性、各国間の関連性などについて調べました。 今度は主成分分析と並んで、代表的な多変量解析手法である階層型クラスター分析(以下、”クラスター分析” と表記)を使ってみます。 クラスター分析はさまざまな統...
Part 1ではOECD加盟国(トルコを除く)を対象とし、主成分分析の負荷量プロットやスコアプロットから、各国々の幸福度に寄与する要因との関連性や、寄与する要因間の関連性、各国間の関連性などについて調べました。 今回のPart 2では、主成分分析の結果をさらに考察し、他の国とは異なる幸福感を持っている国はどこなのか? 異なる幸福感の要因となるものは何か? について調べてみま...
OECDの加盟国を対象とした幸福度ランキング 世界幸福度レポートをご存じでしょうか。毎年各国々の対象者に、自身の幸福度を0から10のスコアで評価してもらい、それらの結果が毎年レポートとして報告されています。 最新の2022年のレポートは、以下のリンクから参照できます。 World Happiness Report 2022 本ブログでは3回のシ...