キャンセル
次の結果を表示 
表示  限定  | 次の代わりに検索 
もしかして: 
The Discovery Summit 2025 Call for Content is open! Submit an abstract today to present at our premier analytics conference.
言語を選択 翻訳バーを非表示
最初に公開されたスレッドを表示

K 平均法を使用したクラスターのシミュレーション - 負の値

Alicia_500
Level I

こんにちは、

K 平均プラットフォームからクラスターをシミュレートすると、変数の 1 つに対して負のシミュレート値が得られますが、実際には正の値しか得られません。


この変数の元の分布を見ると、非正規分布であり、ゼロに制限されています (したがって、対数正規分布のようなものがこれによく適合します)。


クラスターシミュレーションから生成されたデータが正の値のままであることを保証する方法はありますか?


どうもありがとう、


アリシア

この投稿のオリジナルは 、English (US) で書かれており、ユーザビリティ向上のため自動翻訳機能を使用して表示しています。コメントを投稿すると、オリジナルの言語(English (US))やご指定の言語 でも表示されます。

1件の返信1
Victor_G
Super User

Re: K 平均法を使用したクラスターのシミュレーション - 負の値

こんにちはアリシア


コミュニティへようこそ!


クラスタリングは、目的、データ タイプ、クラスタリングを作成する基準(分布、ポイントの密度、ポイント間の階層構造/リンクなど)に応じて、さまざまなアルゴリズムを使用して実行できます。

データの種類に応じて利用可能なアルゴリズムについては、こちらを参照してください: 観測データのクラスタリング用プラットフォームの概要


さまざまなアルゴリズムの使用方法についてさらに詳しく知りたい場合は、このビデオをご覧ください: クラスタリング | JMP

また、クラスタリング手法の違いを説明する@チェルシー・パーレットによる非常に優れたブログもあります: 教師なし機械学習のクラスタリング手法 (jmp.com)


あなたのユースケースに関しては、提供される情報が比較的少なく、いくつかのアプローチをテストするためのデータがないため、異なる「広がり」を持つさまざまな分布に直面しているため、K-Means は最適なクラスタリング手法ではないと思います。K-Means は、分布に違いがないと想定しているため、球状のクラスターを作成します。

特徴の分布と分散の違いの影響を受けるN​​ormal Mixturesや、クラスタリングに分布を想定しない階層的クラスターを使用することもできます。


あなたの状況を理解していただけたことを願っています。

この投稿のオリジナルは 、English (US) で書かれており、ユーザビリティ向上のため自動翻訳機能を使用して表示しています。コメントを投稿すると、オリジナルの言語(English (US))やご指定の言語 でも表示されます。