KNIME・EXCEL倉庫

KNIMEやEXCELの備忘録です。

化学的な

【KNIME】エラーの出た記述子列を除去したい

・先日、化学構造からMordredを用いてDescriptorをたくさん算出した。 ・1600を超えるDescriptorを提示いただけたが、エラーが生じているものも少なくなかった。そこで、エラーが生じた記述子列を除去するワークフローを考えてみた(下図)。 ・ここでいうエ…

【KNIME】化合物のDescriptorをたくさん計算してみたい

・先日、化合物の記述子をRDKitを使って算出した。この方法で、記述子を100個強得ることができたが、もっと得たい。 ・Pythonも含めて調べてみると、mordredというライブラリを利用するのが良さそうだった。mordredに関しては、以下を参照。 github.com ・ま…

【KNIME】化合物のDescriptorを計算してみたい

・分子の性質を語るために、計算科学的に算出される指標のことを、記述子(Descriptor)と呼ぶ。このDescriptorにはいろいろな種類があり、ケモインフォマティクスの分野では必要に応じていろいろ使い分けられている。 ・KNIMEで化合物の構造情報を扱ってい…

【KNIME】化合物のChEMBL IDから構造情報を纏めてとってきたい

・諸般の事情で、化合物のChEMBL IDのリストと活性情報が手に入ったが、構造情報が付与されていなかったとする。 ・化合物数が10や20なら個別に構造を検索しても問題ないだろうが、それが数十、数百にもなるといよいよ面倒になってくる。 ・そこで、ChEMBLの…

【KNIME】SMILESを前処理したい

・化合物の構造情報を使って色々解析する際に、前処理をしたい場合がある。 ・例えば、SDFをSMILESに変換するのであれば、SDF ReaderとRDKit Canon SMILESで何とかなる。 ・今回は、このSMILESを更にKNIMEで前処理するにはどうすれば良いか、少し調べてみた…

【KNIME】化合物の共通構造と異なる構造を分かりやすくしたい。

・有機化学の基本的な考え方として、「似たような構造を持っている化合物は似たような活性を持つ」というものがある。一方で、化合物はそれぞれに異なる活性を持つことも事実と思う。 ・どこでその差が出るのか考えるときに役に立つのが、「どこが同じでどこ…

【KNIME】化合物だって階層型クラスタリングしてみたい。

・前回に引き続き、化合物を構造でまとめたい。 ・今回は階層型クラスタリングをしてみたい。 ・ワークフローを組んでみた(下図)。 ・流れは以下の通り。 ①SDF読み込み。 ②情報抽出。今回はchembl_id(RowIDに設定)と構造情報だけにした(下図)。 ③Finge…

【KNIME】化合物の類似度をランキングしてみたい。

・化合物の構造を、何らかの形で纏めたいと思った。 ・一つのやり方として、機械的に類似度を算出し、似ている化合物は同じ性質をもつだろうと推測する手法があると思う。 ・例えば、A、B、C、Dの4つの化合物がある場合、Aと一番似ている(A-B、A-C、A-Dの…

【KNIME】sdfファイルから化合物の情報を抜き出したい。

・先日、化合物をKNIMEで扱ってみた。 ・化合物の構造ファイルとして、いろいろな記述法があり、中でもSMILESとSDFはよく見かける。 ・SMILESの特徴は、1次元の文字列の配列であり、記述自体がシンプルであること。SDFの特徴は、化合物の構造以外の情報も盛…

【KNIME】同じ構造を強調したい。

・先日に引き続き、化合物を少し触ってみたい。例えば共通の構造を分かりやすく表示出来たら面白いな、と思ったので、少し調べてやってみた。 ・今回は、CheMBLから適当にsdfのデータセットを落としてきたので、読み込むのはsdf readerノードで実施した。構…

【KNIME】化合物を扱いたい。

・KNIMEの使い方は様々にあるが、そのうちで特に発達している利用法の1つにケモインフォマティクスがある。化学情報学や計算化学と日本語訳される学問で、化学物質の性質を情報学の観点から表現・解析・予測する学問らしい。せっかくKNIMEを扱っているので、…