KNIMEとか倉庫

KNIMEやEXCELなどの備忘録です。

可視化

【Python】ネットワークをくっつけたり共通部分を出したりしたい

・お題:似た実験をしたところ、2つのデータセットを得た。それぞれからネットワークを作成したところ、どうやら被っているところと違うところがあるらしい。これらを可視化したい。 ・networkxの公式サイトを参考にした。正しくはそちらを参照いただきたい…

【Python】ネットワークの中の大事なノードを見つけたい

・お題:先日、ネットワークの図を描いてみた。たくさんあるノードの中で、どれが大事っぽいのか推定してみたい。 ・大事さと私がイメージしていることは、ネットワーク界隈では中心性と呼ぶらしい。私の「大事さ」はぼんやりとしたイメージだけれど、「中心…

【Python】ネットワークからコミュニティを抽出したい

・お題:ネットワークを描いたところ、なんだがゴチャっとしている。どのノード同士がまとまった集団を形成しているのか、コミュニティを抽出してみたい。 ・ネットワークの中にある局所的に繋がりが密な集団をコミュニティと呼ぶらしく、ネットワークの中か…

【Python】相関ネットワークの図を描きたい②

・お題:いろいろな変数の数値データが入った表を入手した。変数の相関関係からグラフを描きたい。 ・やりたいことは先日と同じだけれど、今回はnetworkxの描画をもう少し工夫してみた。以下のサイトを参考にさせて頂いた。 qiita.com ・とりあえず、データ…

【Python】相関のネットワークの図を描きたい

・お題:それぞれの変数に関して、相関係数をもとに、ネットワーク図を描いてみたい。 ・変数間の相関係数をもとにネットワークを描くことがあるらしい。偽相関の懸念や因果関係を表すわけではないなどの注意点があるが、せっかくなのでやってみたい。 ・と…

【Python】Pyvisでインタラクティブなネットワーク図を描いてみたい

・お題:先日、networkxを使ってエッジリストからネットワーク図を描いてみた。エッジが見づらいことがあったので、インタラクティブにグラフを動かせるようにしたい。 ・調べてみると、pyvisというライブラリでインタラクティブなネットワークグラフを描け…

【Python】エッジリストからネットワーク図を描きたい

・お題:どのノードからどのノードにエッジが伸びているかと、そのエッジのウェイトが入っている表(エッジリスト)を入手した。ここから、ネットワーク図を描いてみたい。 ・neoworkxを利用した。 networkx.org ・まずはエッジリストを適当に作成する。 imp…

【Python】散布図でプロットにカーソルを合わせると画像がホバーするようにしたい

・お題:先日、画像を散布図上に表示したが、プロットが多いとどうしても画像とプロットが被ってしまい、とても見づらい。プロットにカーソルを合わせると画像がホバーする仕様にしたい。 ・以下のサイトを参考にさせて頂いた。正しいことは以下のサイトをご…

【Python】散布図に矢印で画像を表示したい。

・お題:散布図を描いたところ、画像をデータとして反映させたくなった。矢印で散布図に対応する画像を表示させたい。 ・画像はIcooonmonoから拝借した。png画像として落とし、ワーキングディレクトリに保存した。 icooon-mono.com ・画像情報を矢印で追加す…

【Python】ネットワークグラフを描きたい

・お題:いろいろなモノの関係を視覚的に表現したグラフに、ネットワークグラフというのがあるみたい。なんだかカッコいいので、作ってみたい。 ・networkxというライブラリを使った。正しいことは公式サイトを参照していただきたい。インストールは割愛。 n…

【Python】日本語でワードクラウドしたい

・お題:先日、英語の文章をそれっぽく画像にするワードクラウドで遊んだ。今回は、日本語でワードクラウドしてみたい。 ・先日のライブラリ(wordcloud)に日本語の文章を放り込んでも、なんだか思ったようにいかなかったので、ちょっといろいろ弄って日本…

【Python】ワードクラウドしてみたい

・お題:文章中の単語を並べて表現した画像をワードクラウドというらしい。おしゃれなので、ちょっとやってみたい。 ・今回使ったのは、wordcloudというライブラリ。まずはwordcloudをインストールする。正しいことは以下を参照いただきたい。 amueller.gith…

【Python】表からインタラクティブにグラフを作りたい②

・お題:表からインタラクティブにグラフを作りたい。 ・あれから追加で調べてみたところ、pivottablejsというライブラリはJupyter Labで使えるし多機能かつ直感的な操作が可能みたいだったので、試してみた。 ・とりあえず、pivottablejsをインストール。 …

【Python】表からインタラクティブにグラフを作りたい

・お題:表からインタラクティブにグラフを作りたい。 ・pixiedustというライブラリを使ってみた。正しいことは以下をご確認いただきたい。 pixiedust.github.io ・とりあえず、pixiedustをインストールした。試しにインポートしたところ、jinja2でエラーが…

【Python】インタラクティブな散布図を描きたい

・お題:indexにサンプル名、Xにx軸データ、Yにy軸データが入ったpandasのDataFrameを入手した。これで散布図を描きたいのだが、カーソルをプロットに乗せるとサンプル名とx,yの情報が出るようなインタラクティブな仕様にしたい。 ・PythonのDash(というかp…

【Python】ベン図に要素も表示したい

・お題:Pythonでベン図を描画したい。今回は、要素も分かるように表示したい。 ・以前、Pythonでベン図を描いた。ただし、デフォルトの設定だと要素数は表示されるが、要素自体はよく分からない。ということで、要素を表示してみた。 ・今回は、動物園を作…

【Python】dtreevizで決定木を可視化したい

・お題:決定木を、dtreevizというライブラリで、分かりやすく可視化したい。 ・決定木は判断根拠が分かりやすいアルゴリズムで、最終的な分類結果だけではなく、その判断プロセスを確認できる点で重宝されることが多い。 ・例えばIrisデータセットを決定木…

【Python】相関係数を求めたりヒートマップを描いたりしたい

・お題:pandasのDataFrameで得られた連続変数に関して、columnごとの相関係数を求めて、ヒートマップを作成したい。 ・とりあえず、データセットを作成する。 import numpy as npimport pandas as pddf=pd.DataFrame(np.random.random(20).reshape(5,4), co…

【Python】平均値の棒グラフに個別値もプロットしたい

・お題:A、B、C及びDの4つの試験条件で、実験をしたところ、10個ずつデータを得ることができた。各試験条件ごとに、平均値を棒グラフで示し、ついでに個別値もプロットしたい。 ・これまでEXCELで似たようなことをやっていたが、jitterの設定ができず、個別…

【Python】複数のヒストグラムをいい感じに並べたい

・お題:いろいろなヒストグラムを分かりやすく並べて描画したい。 ・ヒストグラムは分布をみるのに便利だけれど、たくさん描くと見づらくなってしまう。そこで、良い感じに複数のヒストグラムを並べて描画できないか、少し調べてみた。 ・とりあえず、データ…

【Python】ベン図を描きたい

・お題:ベン図を描きたい。細かい設定なしで、集合を放り込むだけで、勝手にベン図を描いてくれると尚良い。 ・少し調べてみたところ、ベン図を描画できるライブラリがあった。matplotlib-vennというライブラリ。pip install matplotlib-vennでインストール…

【KNIME】構造情報を一覧で見やすくしたい

・先日、Tile Viewで情報を見やすく成型したが、構造情報をうまく表示することができなかった。 ・Tile Viewは対応するセルの情報をカードに出力してくれるのだから、画像データをそのまま渡せばよいのでは?と思って調べたところ、SMILESの構造情報を画像と…

【Python】データを一気に眺めたい

・お題:データを眺めるのに、グラフを一つ一つ作成するのが面倒なので、一気に作成したい。 ・データを扱うすごい人は、データを入手した際に、データの特徴を把握するためにいろいろな角度から眺めるらしい。これは探索的データ分析(EDA)と呼ばれ、とて…

【Python】綺麗なグラフを簡単に作りたい。

・お題:綺麗なグラフを簡単に作成し、データの分布や関係を見たい。 ・ややこしいコマンドを書かず、とにかく綺麗なグラフで変数の関係を一目で分かるようにしたい。一つ一つのグラフを作成するなら、seabornというライブラリがとても便利。聞きなれないプ…

【Python】動くグラフを作りたい

・お題:動くsinカーブのグラフを作成したい。 ・少し調べてみたところ、matplotlib.animationのArtistAnimationとFuncAnimationという機能でグラフを動かせるらしい。 ・まずArtistAnimationを使う。こちらは、紙芝居形式で、グラフを次々と表示させること…

【Python】グラフを描きたい

・お題:y=sinXとy=cosXのグラフを描きたい。 ・「python グラフ」などで検索すれば情報がたくさん出てくる。しかし、素養のない私のような人間は、すぐにやり方を忘れてしまうし、思い出すにも時間がかかる。そこで、ミニマムパッケージのグラフの書き方を…

【KNIME】化合物だって階層型クラスタリングしてみたい。

・前回に引き続き、化合物を構造でまとめたい。 ・今回は階層型クラスタリングをしてみたい。 ・ワークフローを組んでみた(下図)。 ・流れは以下の通り。 ①SDF読み込み。 ②情報抽出。今回はchembl_id(RowIDに設定)と構造情報だけにした(下図)。 ③Finge…

【KNIME】棒グラフに色を付けたい。

・散布図はcolor managerノードで簡単に色を付けることができたが、棒グラフ(Bat Chart)のカラムに色を付ける方法が分からなかった。 ・少し癖があったので、メモしておく。 ・以下のようなフローを組んだ。 ・左のウィンドウはTable Creatorの中身。各列…

【KNIME】多変量データをt-sneで可視化したい

・多変量データを可視化する方法には様々あるが、今回はt-sneという手法を試してみたい。ティーズニーと読むらしい。 ・t-SNE (t-distribution Stochastic Neighbor Embedding)は、データ間の距離(類似性)を保持したまま、低次元化する手法だそうだ。・距…

【KNIME】Spectral Clusteringでクラスタリングしたい。

・先日KNIMEでk-meansクラスタリングなどを実施してみた。k-meansクラスタリングの特徴は、プロットした空間中で中心から距離をベースに考えるところで、要は2次元グラフ上なら丸く分布していないと綺麗に分けることができない。 ・歪んだ分布の場合、Spectr…