KNIMEとか倉庫

KNIMEやEXCELなどの備忘録です。

Python

【Python】ベン図を描きたい

・お題:ベン図を描きたい。細かい設定なしで、集合を放り込むだけで、勝手にベン図を描いてくれると尚良い。 ・少し調べてみたところ、ベン図を描画できるライブラリがあった。matplotlib-vennというライブラリ。pip install matplotlib-vennでインストール…

【Python】表を縦長にしたい

・お題:マトリックスになっている表を、リスト形式に変形したい。 ・表の形式として、マトリックス形式とリスト形式というやつがあるらしい。 マトリックス形式が以下の形式で、プレートマップのような感じ。 対して、それぞれの要素を縦に並べたような表を…

【Python】DataFrameをマルチにまとめたい

・お題:複数のDataFrameを纏めて、マルチインデックスやマルチカラムの一つのDataFrameとして扱いたい。 ・pandasのDataFrameの扱い方がよく分からなかったので、少し調べてみた。すぐ忘れるので、メモしておく。 ・とりあえず、csvをDataFrameとして読み込…

【Python】マルチカラムから列をとってきたい

・お題:マウスに試験物質を連投したところ、以下の体重データが得られた。各処置条件の平均値、中央値、最大値、最小値を一つの表に作成し、そこからデータを切り出すことで、経日的なグラフで示したい。 データ Compound Dose No Day0 Day1 Day2 Day3 Day4…

【Python】平均値を算出してグラフにしたい

・お題:マウスに試験物質を連投したところ、以下の体重データが得られた。各処置条件の平均値を、経日的なグラフで示したい。 データ Compound Dose No Day0 Day1 Day2 Day3 Day4 Day5 Day6 Day7 A 1 1 25.9 25.9 26.1 26.9 27.8 28.6 28.9 29.3 A 1 2 25.2…

【Python】scikit-learnで欠損値を補完したい。

・お題:欠損値を補完したい。 ・前回、主にpandasを用いて欠損値を数えたり削除したり何らかの定数で補完する方法を少し調べた。 ・今回は、scikit-learnでもうちょっと頑張って欠損値を補完したい。 ・とりあえず、データセットを作る。 import pandas as …

【Python】欠損値を何とかしたい

・お題:データセット中の欠損値の有無などを調べて、何とかしたい。 ・入手したデータが、端から端までピッチリ埋まっていることは、実験データを収集するうえで期待できない場合が多い。入手したデータセットの欠損値に関して情報を得て、何とかしたい。 …

【Python】boolean型でifしたい

・お題:boolean型の変数を使って、ifの条件分岐をしたい。 ・boolean型は、True/Falseを示す型のことらしい。 ・a=Trueとすれば、aにTrueというboolean変数が入った状態になる。また、Trueはintの1、Floatの1.0、strの"True"に対応しており、Falseはintの0…

【Python】文字列に変数を埋め込みたい

・お題:文字列に変数を埋め込みたい。・printを使うと引数の文字列を表示することができる。表示する文字列の中に変数を埋め込みたい場合、f文字列というのを使うことが多いらしい。 ・とりあえず埋め込む。 a="りんご" b="ぶどう" を実行した後に、 print(f…

【Python】用語が分からない「メソッド」「モジュール」「ライブラリ」「パッケージ」

・Pythonを弄っていて見聞きする言葉の意味が、素養のない私の頭には全く入らないので、ググって私なりに解釈してみた。厳密な意味での解釈からは程遠いことを前提に、実務的に区別することを目標にした。・今回は、「メソッド」「モジュール」「ライブラリ…

【Python】リストを辞書に変換したい

・お題:リストを辞書に変換したい。 ・いくつかのデータを纏めて管理するデータ型として、Pythonにはリストをはじめとするいくつかの型が用意されている。 ・リスト([a,b,c,d]みたいなやつ)からデータを引っ張ってくるには、リストの何番目のデータをとっ…

【Python】無名関数を使いたい

・お題:無名関数を使えるようになりたい。 ・Pythonでは、必要に応じて関数を組んで処理を回すことがある。defを使って書くほどもない関数を、簡単に記述する際に無名関数というやつを使うらしい。 ・defで定義して特に不自由することはないと思うけれど、…

【Python】データを一気に眺めたい

・お題:データを眺めるのに、グラフを一つ一つ作成するのが面倒なので、一気に作成したい。 ・データを扱うすごい人は、データを入手した際に、データの特徴を把握するためにいろいろな角度から眺めるらしい。これは探索的データ分析(EDA)と呼ばれ、とて…

【Python】綺麗なグラフを簡単に作りたい。

・お題:綺麗なグラフを簡単に作成し、データの分布や関係を見たい。 ・ややこしいコマンドを書かず、とにかく綺麗なグラフで変数の関係を一目で分かるようにしたい。一つ一つのグラフを作成するなら、seabornというライブラリがとても便利。聞きなれないプ…

【Python】動くグラフを作りたい

・お題:動くsinカーブのグラフを作成したい。 ・少し調べてみたところ、matplotlib.animationのArtistAnimationとFuncAnimationという機能でグラフを動かせるらしい。 ・まずArtistAnimationを使う。こちらは、紙芝居形式で、グラフを次々と表示させること…

【Python】グラフを描きたい

・お題:y=sinXとy=cosXのグラフを描きたい。 ・「python グラフ」などで検索すれば情報がたくさん出てくる。しかし、素養のない私のような人間は、すぐにやり方を忘れてしまうし、思い出すにも時間がかかる。そこで、ミニマムパッケージのグラフの書き方を…

【Python】辞書を参考にしてリストの値を置換したい。

・お題:辞書を参考にしてリストの値を置換したい。もし辞書にないキーがリストに現れたら、据え置きしたい。 ・例えば、何が売れたかのリストがあるとする。 Lis=["りんご","ぶどう","みかん","みかん","ばなな"] ・これに対して、品目を値段に置換し、値段…

【Python】リスト内包表記でFizzBuzzしたい

・お題:リスト内包表記の条件分岐でFizzBuzzしたい。 ・FizzBuzz問題は、ある数列に対して、3の倍数だとFizz、5の倍数だとBuzz、15の倍数だとFizzBuzzを返す条件分岐の問題のこと。今回は、1~100までの整数に関して実施することを考える。 ・リスト内包表…

【Python】引数までの素数を算出する関数を作りたい

・お題:引数までの素数をリスト形式で出力する関数を作成したい。 ・エラトステネスの篩のアルゴリズムを参考にしてみる。 ja.wikipedia.org ・2から指定の数までの自然数のリストを作成し、そこから素数でないもの(割り切れてしまったもの)を除外するこ…

【Python】約数を求めてみたい。

・お題:引数の約数をリスト形式で出力する関数を作成したい。 ・今回もリスト内包表記を使ってみた。 ・順を追って考えていく。 ①[n for n in range(12)]と入力すると、[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11]と返ってくる。rangeをちょっとずらしつつ、こ…

【Python】指定長のランダムな塩基配列を作成したい。

・最近Pythonを勉強し始めたので、Pythonに関するメモ記事も書いていこうと思う。 ・Pythonは全く初心者で、お作法など全く分からないので悪しからず。 ・お題:特定の長さのランダムな塩基配列を作成する関数を作成したい。 ・例えば一塩基ずつ区切られたリ…

【KNIME】全角と半角を変換したい

・全角と半角が混在している文字列があったとする。 ・表記の揺れは小さい方が良いので、KNIMEでこの揺れを半角か全角のどちらかに揃えたいと思ったのだが、やっぱりやり方が分からなかった。 ・そこで、Python Scriptノードを使って、Pythonで実装してみた…

【KNIME】アルファベットを含むセルをmissing"?"にしたい

・KNIMEでいろいろ扱っていると、特定の条件を満たすセルのデータを消したくなることがある。例えば、数値データばかりのところに、よくわからないアルファベットを含む文字列が混ざっている場合など。 ・こういう場合、文字列を含むセルをmissingにしたいが…

【KNIME】化合物のDescriptorをたくさん計算してみたい

・先日、化合物の記述子をRDKitを使って算出した。この方法で、記述子を100個強得ることができたが、もっと得たい。 ・Pythonも含めて調べてみると、mordredというライブラリを利用するのが良さそうだった。mordredに関しては、以下を参照。 github.com ・ま…

【KNIME】Spectral Clusteringでクラスタリングしたい。

・先日KNIMEでk-meansクラスタリングなどを実施してみた。k-meansクラスタリングの特徴は、プロットした空間中で中心から距離をベースに考えるところで、要は2次元グラフ上なら丸く分布していないと綺麗に分けることができない。 ・歪んだ分布の場合、Spectr…

【KNIME】curve fittingで酵素反応速度論的パラメータを推定してみたい(非線形回帰)。

・酵素反応速度論的解析をする際に、モデルの式に数値を当てはめてパラメータを推定するcurve fittingをやりたかったのだけれど、KNIMEでのやり方が分からなかった。 ・Pythonなら出来そうだったので、KNIMEにPythonを入れ込んで、サンプルデータのfittingを…

【KNIME】回帰分析に適用するモデルを決めたい(Pycaret)

・教師あり学習に使うモデルを決めるために、PythonのライブラリPycaretをKNIMEで実行してみた。 ・まず、先日作成したPythonの仮想環境にPycaretを入れようとインストールしようとしたが、上手くいかなかった。 ・knimeenvを作成した際にconda create -n kn…

【KNIME】KNIMEでPythonを使ってみたい。

・KNIMEにはデータ分析に関連する様々な機能が搭載されており、Extensionを用いることにより、PythonやRなどを動かすこともできる。 ・少し解析をやっていて、Pythonを回したいシチュエーションに出くわした。それならPythonだけで十分じゃないかという話は…