いろいろ倉庫

KNIME、EXCEL、R、Pythonなどの備忘録

【KNIME】ちょっとFuzzyにクラスタリングしてみたい(Fuzzy c-Means)

・先の記事で、k-Meansで気軽にクラスタリングを試して気づいたが、似たような名前のクラスタリング手法がある。Fuzzy c-Meansとk-Medoidsだ。

・後者はいったん置いておいて、前者を前回と同じデータに対して試した。

・Fuzzy c-Meansノードの出力ポートを見てみると、それぞれのデータに対するそれぞれのクラスタっぽさがバーの長さで示されていた(下図)。

f:id:choron81:20211117000041p:plain

・Row 5が、Cluster 0とCluster 2が結構良い勝負している。結果を描画して確認してみると、column 1が3ちょっと、column 2が2弱のところに、微妙なCluster 2がいることが分かる(下図)。

f:id:choron81:20211117000235p:plain

・人間が塊を作れと言われた場合でも分類が分かれるであろうデータであり、どのクラスタに属するっぽいか表す数値(メンバシップ値)は直観に反しない結果になった。

 

終わり。