いろいろ倉庫

KNIME、EXCEL、R、Pythonなどの備忘録

【KNIME】データの表を見やすくしたい

・化合物情報などを扱う際に、列名が冗長化したりして、視認性が悪くなる場合がある。そこで、冗長なところを纏めつつ、表をTile Viewで視認性良く表示するワークフローを作成した。

・入力データは以下の表(化合物のID、分子量、IC50(_等号・不等号、_値、_単位)、EC50(_等号・不等号、_値、_単位))。出力はさらにその下のカード形式にした。

・組んだワークフローは以下。

・ざっくりした流れ

①元データのIDを行名に埋め込み。

②転置して、列名(変数名)を取り出し、"_"で分割し、"_"の前までの変数名でGroupBy。Groupsには"_"の前までの変数名を指定し、Pattern Based Aggregationでその他すべてをConcatenateするように設定しておく。Value deliminaterは空欄にしておく。

③行名を整えて転置し、表示順を弄れば、以下の表になる。

④これをTile Viewに渡せば、先述のようにカード形式で表示してくれる。

 

・視認性が高いことと、機械的に読み込んで処理できることは結構矛盾する場合がある。機械的に読み込んだものを視認性高く出力することは、結構大事とおもう。SMILESの列を付けて構造式を表示しても良いかもしれない(Tile Viewは対応していない気がするが)。

 

おわり