【KNIME】化合物のChembl_IDをSMILESから引っ張ってきたい。

・例えば、化合物の構造だけ与えられて、「これと似たような化合物が、何かの生理活性を測定された報告はあるのかな？」と気になったとする。

・個別の化合物を検索するのであれば、CHEMBL（以下）などでSmilarityも含めて、アッセイ結果を検索してみるのが良い。

www.ebi.ac.uk

・化合物が50個や100個ある場合は、個別に検索するのはハードなので、自動化したいところ。

・ChemblのAPI（以下）と、KNIMEのGet Request、Xpathなどを使えばなんとかなりそうな気がする。

www.ebi.ac.uk

・流れとしては、①SMILESからChembl_IDを釣ってくる、②Chembl_IDから評価情報を釣ってくる、という感じにしたい。

・まずは①を組んでみた（下図）。

f:id:choron81:20220206182928p:plain

・SMILS情報は、以下の通り。

f:id:choron81:20220206175744p:plain

・SMILESの表記方法として、Canonical SMILESを採用している。一番上の化合物だと、Canonical SMILESでCC(C1=NC=NC=C1F)C(CN2C=NC=N2)(C3=C(C=C(C=C3)F)F)Oと表記され、Isomeric SMILESでC[C@@H](C1=NC=NC=C1F)[C@](CN2C=NC=N2)(C3=C(C=C(C=C3)F)F)Oと表記される。Get Requestノードでは、"["や"]"がエラーになるので、Isomeric SMILESだとうまくワークしない。

・String Manipulationは以下の通り。

f:id:choron81:20220206183135p:plain