いろいろ倉庫

KNIME、EXCEL、R、Pythonなどの備忘録

・Column Filter

【KNIME】データの表を見やすくしたい

・化合物情報などを扱う際に、列名が冗長化したりして、視認性が悪くなる場合がある。そこで、冗長なところを纏めつつ、表をTile Viewで視認性良く表示するワークフローを作成した。 ・入力データは以下の表(化合物のID、分子量、IC50(_等号・不等号、_値…

【KNIME】エラーの出た記述子列を除去したい

・先日、化学構造からMordredを用いてDescriptorをたくさん算出した。 ・1600を超えるDescriptorを提示いただけたが、エラーが生じているものも少なくなかった。そこで、エラーが生じた記述子列を除去するワークフローを考えてみた(下図)。 ・ここでいうエ…

【KNIME】化合物のChEMBL IDから構造情報を纏めてとってきたい

・諸般の事情で、化合物のChEMBL IDのリストと活性情報が手に入ったが、構造情報が付与されていなかったとする。 ・化合物数が10や20なら個別に構造を検索しても問題ないだろうが、それが数十、数百にもなるといよいよ面倒になってくる。 ・そこで、ChEMBLの…

【KNIME】化合物の類似度をランキングしてみたい。

・化合物の構造を、何らかの形で纏めたいと思った。 ・一つのやり方として、機械的に類似度を算出し、似ている化合物は同じ性質をもつだろうと推測する手法があると思う。 ・例えば、A、B、C、Dの4つの化合物がある場合、Aと一番似ている(A-B、A-C、A-Dの…

【KNIME】プレートリーダーのデータを整理したい。

・生物系の実験で、プレートリーダーで得られたデータを解析することで、試験物質のin vitro活性を評価することがしばしばある。 ・KNIMEでこの解析が自動化できないか調べてみたところ、ExtensionのCommunityノードで、HCS Toolというものがあった。これを…

【KNIME】enforce exclusionとenforce inclusion

・"column filter"などのノードの設定ウィンドウで、enforce exclusionとenforce inclusionを選ぶラジオボタンがある。 ・基本的に何も弄らずデフォルト(enforce exclusion)を使っていた。 ・元のデータが変わる際にエラーの原因になるようなので、忘れな…

【KNIME】Flow VariableでColumn Filter

・Column Filterで表から列を抽出(又は除外)する際に、Flow Variableで列名を指定したい。 ・例えば、左下の表からVariables 1(a)という名前の列を抽出する場合、以下のように組むことがある。 ・この際に、単純に"Column Filter"の"Flow Variables"で”i…