いろいろ倉庫

KNIME、EXCEL、R、Pythonなどの備忘録

2022-01-01から1年間の記事一覧

【Python】PandasのDataFrameの特定の列に色をつけたい

・お題:PandasのDataFrameの特定の列やセルに色を付けて、表を見やすくしたい。 ・公式サイトを参考にした。正しいことは公式サイトを参照していただきたい。 pandas.pydata.org ・とりあえず、データセットを作成する。 import pandas as pdimport numpy a…

【Python】DataFrameから特定のデータ型の列だけ取り出したい

・お題:PandasのDataFrameを入手した。このDataFrameから特定のデータ型の列だけ抜き出したい。 ・Pandasの公式にやり方が書いてあった。正しいことはそちらをご確認いただきたい。 pandas.pydata.org ・とりあえずデータフレームを作成する。今回は、スポ…

【Python】ネットワークの中の大事なノードを見つけたい

・お題:先日、ネットワークの図を描いてみた。たくさんあるノードの中で、どれが大事っぽいのか推定してみたい。 ・大事さと私がイメージしていることは、ネットワーク界隈では中心性と呼ぶらしい。私の「大事さ」はぼんやりとしたイメージだけれど、「中心…

【Python】ネットワークからコミュニティを抽出したい

・お題:ネットワークを描いたところ、なんだがゴチャっとしている。どのノード同士がまとまった集団を形成しているのか、コミュニティを抽出してみたい。 ・ネットワークの中にある局所的に繋がりが密な集団をコミュニティと呼ぶらしく、ネットワークの中か…

【Python】相関ネットワークの図を描きたい②

・お題:いろいろな変数の数値データが入った表を入手した。変数の相関関係からグラフを描きたい。 ・やりたいことは先日と同じだけれど、今回はnetworkxの描画をもう少し工夫してみた。以下のサイトを参考にさせて頂いた。 qiita.com ・とりあえず、データ…

【Python】辞書のバリューでキーをとってきたい

・お題:諸般の事情で、辞書型のvalueから対応するkeyをとって来る必要が出てきた。やってみたい。 ・きっともっとエレガントなやり方があると思うが、私なりに考えてみた。 ・とりあえず、辞書を作成する。 Dic1={"A":"a", "B":"b", "C":"c", "D":"c"} ・こ…

【Python】相関のネットワークの図を描きたい

・お題:それぞれの変数に関して、相関係数をもとに、ネットワーク図を描いてみたい。 ・変数間の相関係数をもとにネットワークを描くことがあるらしい。偽相関の懸念や因果関係を表すわけではないなどの注意点があるが、せっかくなのでやってみたい。 ・と…

【Python】Pyvisでインタラクティブなネットワーク図を描いてみたい

・お題:先日、networkxを使ってエッジリストからネットワーク図を描いてみた。エッジが見づらいことがあったので、インタラクティブにグラフを動かせるようにしたい。 ・調べてみると、pyvisというライブラリでインタラクティブなネットワークグラフを描け…

【Python】エッジリストからネットワーク図を描きたい

・お題:どのノードからどのノードにエッジが伸びているかと、そのエッジのウェイトが入っている表(エッジリスト)を入手した。ここから、ネットワーク図を描いてみたい。 ・neoworkxを利用した。 networkx.org ・まずはエッジリストを適当に作成する。 imp…

【Python】文章からStop wordsを除きたい

・お題:以前、文章の特徴を解析しようと思い、文章を数値化した。aやtheなどのあまり意味の無い単語がたくさん出てきて、解析の邪魔になるので、除きたい。 ・自然言語解析であまり使われない代名詞や冠詞などのことを、stop wordsと呼び、前処理として除か…

【Python】PubMedからアブストを引っ張ってきたい

・お題:論文のアブストを題材に自然言語処理で遊ぼうと思ったところ、アブストを集めるのが面倒だった。キーワードからアブストを集めるところを、Pythonにやってほしい。 ・少し調べたところ、biopythonでできるらしい。正しいことは公式サイトをご確認い…

【Python】文章の類似度を算出したい

・お題:文章がたくさんある中で、自分が気になる文章と似ている文章を探したい。cos類似度というやつを使って、類似度をランキングしてみたい。 ・先日、文章をその中に含んでいる単語で数値化して表現した。今回は、その数値化された文章を使って、cos類似…

【Python】文章を数値で表したい。

・お題:文章同士の関係を評価する際に、まずは文章を数値で表現することがあるらしい。今回は、TF-IDFというやつで文章を数値で表現してみたい。 ・以下のサイトを参考にさせて頂いた。正確なことはそちらをご参照いただきたい。 www.takapy.work qiita.com…

【Python】化合物情報をプロットして、カーソルを乗せると構造がホバーするようにしたい

・お題:化合物のいろいろな特徴をプロットしたグラフを作成したが、構造が見づらいので、マウスオンで構造がホバーするようにしたい。 ・とりあえず、データセットを落とす。今回は、ChEMBLからデータセットを拝借した。 www.ebi.ac.uk ・Assayから適当な実…

【Python】散布図でプロットにカーソルを合わせると画像がホバーするようにしたい

・お題:先日、画像を散布図上に表示したが、プロットが多いとどうしても画像とプロットが被ってしまい、とても見づらい。プロットにカーソルを合わせると画像がホバーする仕様にしたい。 ・以下のサイトを参考にさせて頂いた。正しいことは以下のサイトをご…

【Python】散布図に矢印で画像を表示したい。

・お題:散布図を描いたところ、画像をデータとして反映させたくなった。矢印で散布図に対応する画像を表示させたい。 ・画像はIcooonmonoから拝借した。png画像として落とし、ワーキングディレクトリに保存した。 icooon-mono.com ・画像情報を矢印で追加す…

【Python】ネットワークグラフを描きたい

・お題:いろいろなモノの関係を視覚的に表現したグラフに、ネットワークグラフというのがあるみたい。なんだかカッコいいので、作ってみたい。 ・networkxというライブラリを使った。正しいことは公式サイトを参照していただきたい。インストールは割愛。 n…

【Python】DataFrameから条件に合うデータを抜き出したりしたい

・お題:DataFrameを入手した。ここから、気になるデータを抽出したりしたい。 ・PandasのDataFrameで特定のデータを抽出したりできるとうれしい。 ・データセットを作成する。 import pandas as pdimport numpy as npimport random df=pd.DataFrame({"Age":…

【Python】日本語でワードクラウドしたい

・お題:先日、英語の文章をそれっぽく画像にするワードクラウドで遊んだ。今回は、日本語でワードクラウドしてみたい。 ・先日のライブラリ(wordcloud)に日本語の文章を放り込んでも、なんだか思ったようにいかなかったので、ちょっといろいろ弄って日本…

【Python】ワードクラウドしてみたい

・お題:文章中の単語を並べて表現した画像をワードクラウドというらしい。おしゃれなので、ちょっとやってみたい。 ・今回使ったのは、wordcloudというライブラリ。まずはwordcloudをインストールする。正しいことは以下を参照いただきたい。 amueller.gith…

【Python】表からインタラクティブにグラフを作りたい②

・お題:表からインタラクティブにグラフを作りたい。 ・あれから追加で調べてみたところ、pivottablejsというライブラリはJupyter Labで使えるし多機能かつ直感的な操作が可能みたいだったので、試してみた。 ・とりあえず、pivottablejsをインストール。 …

【Python】表からインタラクティブにグラフを作りたい

・お題:表からインタラクティブにグラフを作りたい。 ・pixiedustというライブラリを使ってみた。正しいことは以下をご確認いただきたい。 pixiedust.github.io ・とりあえず、pixiedustをインストールした。試しにインポートしたところ、jinja2でエラーが…

【Python】簡単にGUIを作りたい

・お題:ポップアップしたウィンドウで、変数を入力したりしたい。 ・Easy GUIというライブラリが少し調べた限りでは一番簡単だった。正しいことは以下を参照いただきたい。 EasyGui Tutorial — easygui 0.97 (2014-12-20) documentation ・インストールがす…

【Python】ショートカットキーを覚えたい。

・お題:Jupyter Labでショートカットの使い方を覚えたい。 ・調べてみると、Jupyter Labにもショートカットキーがある。以下の記事でまとめられていたので、少しピックアップしてみた。 ・詳しいことは元記事を見ていただきたい。 qiita.com ・元記事ではた…

【Python】condaで仮想環境を構築したい

・お題:condaで仮想環境を構築したい。 ・仮想環境を構築する際に、毎回調べるのが面倒なので、メモしておく。上から順番に実行すれば、たぶんそれっぽい環境が構築できる。 ・現在の仮想環境を確認conda info -e ・python=3.7で環境構築conda create -n my…

【Python】DataFrameをEXECELファイルにシートとして追加したい。

・お題:DataFrameをEXCELファイルとして出力したい。できれば、既存のファイルにシートを付け足す感じで出力したい。 ・前提として、pandasとopenpyxlが使える状態であるとする。 ・DataFrameを作成する。 import pandas as pddf=pd.DataFrame({"A":[1,2,3]…

【Python】EXCEL表の特定の範囲をDatFrameにしたい。

・お題:EXCELからデータを抜き出したいが、EXCELの形式上、特定領域に読みたい表がある。領域を指定して表を読み込みたい。 ・以下のEXCELファイルから、NameとScoreの表だけ抜き出してDataFrameにしたい。 ・まず、ライブラリopenpyxlをインストールする。…

【Python】PandasのDataFrameをいくつも表示したい

・お題:PandasのDataFrameはJupyter Notebookでセルを抜けるときに綺麗に表示してくれる。いくつも表示したいときにprint関数を使うと、なんだか見た目が違うので、いつもの表示をいくつもしたい。 ・DataFrameを作成する。 df=pd.DataFrame({"A":[1,2,3],"…

【Python】日付の揺れを統一したい

・お題:PandasのDataframeで日付を含む表を入手したものの、日付の表記が様々ある。統一したい。 ・DataFrameを作成する。 import pandas as pda1=["2022/1/1","2022/01/01","2022.1.1","2022.01.01","2022-1-1","2022-01-01"]df1=pd.DataFrame(a1,columns=…

【Python】正規表現で文字列を抜き出したい

・お題:長い文字列の中から、条件にあてはまる文字列を抜き出したい。 ・先日メモした正規表現を使う。とりあえず、ライブラリをインポート。 import re ・例文を作成。 mojiretsu="私の名前は田中たろうです。私は1900年10月1日生まれです。生まれはA県、…