いろいろ倉庫

KNIME、EXCEL、R、Pythonなどの備忘録

【KNIME】化合物だって階層型クラスタリングしてみたい。

・前回に引き続き、化合物を構造でまとめたい。

・今回は階層型クラスタリングをしてみたい。

・ワークフローを組んでみた(下図)。

f:id:choron81:20220129231528p:plain

・流れは以下の通り。

①SDF読み込み。

②情報抽出。今回はchembl_id(RowIDに設定)と構造情報だけにした(下図)。

f:id:choron81:20220129231741p:plain

③Fingerprint算出。Fingerprintが何かは以下が凄く良く纏まっている。すごい。

future-chem.com

④類似度を算出。

f:id:choron81:20220129231945p:plain

⑤階層型クラスタリングモデルを構築。

⑥データをモデルに当て嵌めたり、図示したりする(下図)。

f:id:choron81:20220129232515p:plain

f:id:choron81:20220129232556p:plain