いろいろ倉庫

KNIME、EXCEL、R、Pythonなどの備忘録

【KNIME】クラスタリングしてみたい(k-Means)

・KNIMEはデータ解析プラットフォームなので、Extensionを追加しなくても、デフォルトで様々な解析が可能。

・巷で流行っている機械学習などもノードをくっつけてモデルのパラメータを与えてやればある程度実行できる。

・今回は、クラスタリングというものをやってみた。Clusterでノードを検索すると、ずらりと候補が出てきた(下図)。

f:id:choron81:20211116233235p:plain

・今回は、非階層型クラスタリングでk-Means法を試してみた。

・適当に作成した表(変数としてcolumn1とcolumn2を含む)を使って、データをk-Meansでクラスタリングし、あてがったクラスタに準じて色を付けて散布図を描くという構成にしてみた(下図)。クラスタ数は3を設定し、開始点はランダムだがシードを設定しておいた。

f:id:choron81:20211116233552p:plain

・k-Meansノードは出力ポートが3つあり、上はクラスタ割り当て後の表、真ん中はクラスタの重心、下はクラスタのモデルを出力するポートっぽい。グラフを描くなら上のポートを使うことになる。

・描画された散布図

f:id:choron81:20211116234118p:plain

・なんだかそれっぽく描画された。変数が二つしかないので描画が容易であり、直観に違わないクラスタリング結果になった。

クラスタリングだけでも様々な手法が搭載されており、手法の特徴を理解して使い分ける必要がある。

 

終わり。