いろいろ倉庫

KNIME、EXCEL、R、Pythonなどの備忘録

【KNIME】同じ構造を強調したい。

・先日に引き続き、化合物を少し触ってみたい。例えば共通の構造を分かりやすく表示出来たら面白いな、と思ったので、少し調べてやってみた。

・今回は、CheMBLから適当にsdfのデータセットを落としてきたので、読み込むのはsdf readerノードで実施した。構造が文字列になっており、訳が分からないので、右クリックから2D descriptionで構造式表示に変えた(下図)。

f:id:choron81:20211212225445p:plain

f:id:choron81:20211212225738p:plain

・次に、RDkit MCSノードで、共通構造を抽出した(下図)。MCSはMaximum Common Substructureの略で、最大共通部分構造のこと。

f:id:choron81:20211212231611p:plain

・次に、MCSを変数化し、RDkit Substructures Filterに渡しつつ、ヒットした化合物の列を複製する(下図)。

f:id:choron81:20211212231851p:plain

・最後に、RDkit Molcular Highlightingノードにデータを渡せば、先に付け足した列の構造の共通構造をハイライトしてくれる(下図右)。

f:id:choron81:20211212232213p:plain

・ちなみに、今回例として拾ってきたのは、CheMBLにあったカンデサルタンとその周辺化合物。

・ちなみに、RDkit MCSノードでは、類似度を設定することができる。

 

終わり。