いろいろ倉庫

KNIME、EXCEL、R、Pythonなどの備忘録

【KNIME】階層型クラスタリングに使う距離情報を読み込みたい。

・データ間の距離情報のみを得た場合に、階層型クラスタリグを適用したい。

・そこで、距離情報を読み込んで階層型クラスタリングに適用してみたい。

・サンプルデータとして、10個のポイントの相互距離を用いた(下図)。

f:id:choron81:20220115161422p:plain

・これを三角行列風の表に加工し、csvファイルとして出力した後、Distance Matrix Readerで読み込む。

・三角行列風の表に加工して書き出すところまでは、以下のような感じ。

f:id:choron81:20220115163816p:plain

・個人的なポイントは、Rule Engineノードを何も設定せずに回すとNull列を挿入できること。

・書き出し直前の表は以下のような感じ。

f:id:choron81:20220115163916p:plain

・Dsitance Matrix Readerノードでの読み込みとクラスタリングの処理は以下の通り。

f:id:choron81:20220115164202p:plain

f:id:choron81:20220115164254p:plain

f:id:choron81:20220115164338p:plain

・最初は距離情報から直接Distance型(?)にうまいこと変換できないかと考えていたが、writerによる出力とreaderによる読み込みを経れば形式上何とかなった。

・もっとスマートな解法がありそうな予感。

 

終わり。