いろいろ倉庫

KNIME、EXCEL、R、Pythonなどの備忘録

Python

【Python】テキストを読み上げたい

・お題:先日の記事で作成したテキストを、読み上げライブラリを使って読み上げたい。また、読み上げデータをgoogle driveに保存したい。 ・gTTSというライブラリを使った。pyttsx3というライブラリも試してみたが、gTTSの方が良い感じに読んでくれたように…

【Python】論文情報を取得したい

・お題:Pythonで環境構築して、Pubmedから論文情報をとってきたい。 ・まずはAnaconda Promptで環境構築した。すぐに忘れるので、メモしておく。 #python=3.10で環境構築conda create -n kikitai python=3.10 #仮想環境に入るactivate kikitai #ライブラリ…

論文を聞きたい

・お題:最近、タブレットで論文を読むと目の奥がなんだか重く感じる。しんどいので、論文を音声で聞けるようにしたい。 ・いろいろな記事を見て、なんとなくこういう流れで行けばできるんじゃないかと思ったので、やってみる。少し長くなりそうなので、今回…

【Python】主成分分析を感じてみたい

・お題:次元圧縮の手法で、主成分分析というやつがある。軸を引き直して情報の寄与の大きい軸だけとり出すことで、次元を下げるらしい。よく分からないので、体感してみたい。 ・例えば10次元の変数セットを主成分分析で軸を取り直し、寄与の大きい軸トップ…

【Python】モジュールを作ってみたい

・お題:処理の一部を関数化することがあるけれど、いちいち関数を作成するのもめんどくさい。関数を集めたモジュールを作成し、読み込むだけで関数を使えるようにしたい。 ・関数とモジュールの関係は、関数が「具体的な計算機能」のこと、モジュールが「関…

【Python】共通構造をもつ化合物を分かりやすく示したい

・お題:Pythonで共通構造を持つ低分子化合物を弄っていた。構造情報を分かりやすく示したい。 ・以下のサイトなどを参考にさせて頂いた。正しいことは元サイトをご確認いただきたい。 qiita.com ・まず、化合物の構造を落としてくる。今回はchemblから化合…

【Python】PyGWalkerでTableuっぽくグラフを描きたい。

・お題:Tableauという探索的データ解析ツールがあるらしい。PandasのDataFrameを使ってTableuっぽくグラフを描くパッケージでPyGWalkerというやつがあるらしい。Tableauは有料っぽいので、PyGWalkerを使ってみたい。 ・PyGWalkerのGitHubは以下。正しいこと…

【Python】分類問題で遊んでみたい。

・お題:機械学習というやつで遊んでみたくて、画像に写っているものが何か分類する問題をやってみようと思った。有名な問題で、手書きの数字画像がなんの数字か判別するモデルを作るやつがあるらしい。やってみたい。 ・とりあえず、データをロードしてみる…

【Python】ネットワークをくっつけたり共通部分を出したりしたい

・お題:似た実験をしたところ、2つのデータセットを得た。それぞれからネットワークを作成したところ、どうやら被っているところと違うところがあるらしい。これらを可視化したい。 ・networkxの公式サイトを参考にした。正しくはそちらを参照いただきたい…

【Python】PandasのDataFrameの特定の列に色をつけたい

・お題:PandasのDataFrameの特定の列やセルに色を付けて、表を見やすくしたい。 ・公式サイトを参考にした。正しいことは公式サイトを参照していただきたい。 pandas.pydata.org ・とりあえず、データセットを作成する。 import pandas as pdimport numpy a…

【Python】DataFrameから特定のデータ型の列だけ取り出したい

・お題:PandasのDataFrameを入手した。このDataFrameから特定のデータ型の列だけ抜き出したい。 ・Pandasの公式にやり方が書いてあった。正しいことはそちらをご確認いただきたい。 pandas.pydata.org ・とりあえずデータフレームを作成する。今回は、スポ…

【Python】ネットワークの中の大事なノードを見つけたい

・お題:先日、ネットワークの図を描いてみた。たくさんあるノードの中で、どれが大事っぽいのか推定してみたい。 ・大事さと私がイメージしていることは、ネットワーク界隈では中心性と呼ぶらしい。私の「大事さ」はぼんやりとしたイメージだけれど、「中心…

【Python】ネットワークからコミュニティを抽出したい

・お題:ネットワークを描いたところ、なんだがゴチャっとしている。どのノード同士がまとまった集団を形成しているのか、コミュニティを抽出してみたい。 ・ネットワークの中にある局所的に繋がりが密な集団をコミュニティと呼ぶらしく、ネットワークの中か…

【Python】相関ネットワークの図を描きたい②

・お題:いろいろな変数の数値データが入った表を入手した。変数の相関関係からグラフを描きたい。 ・やりたいことは先日と同じだけれど、今回はnetworkxの描画をもう少し工夫してみた。以下のサイトを参考にさせて頂いた。 qiita.com ・とりあえず、データ…

【Python】辞書のバリューでキーをとってきたい

・お題:諸般の事情で、辞書型のvalueから対応するkeyをとって来る必要が出てきた。やってみたい。 ・きっともっとエレガントなやり方があると思うが、私なりに考えてみた。 ・とりあえず、辞書を作成する。 Dic1={"A":"a", "B":"b", "C":"c", "D":"c"} ・こ…

【Python】相関のネットワークの図を描きたい

・お題:それぞれの変数に関して、相関係数をもとに、ネットワーク図を描いてみたい。 ・変数間の相関係数をもとにネットワークを描くことがあるらしい。偽相関の懸念や因果関係を表すわけではないなどの注意点があるが、せっかくなのでやってみたい。 ・と…

【Python】Pyvisでインタラクティブなネットワーク図を描いてみたい

・お題:先日、networkxを使ってエッジリストからネットワーク図を描いてみた。エッジが見づらいことがあったので、インタラクティブにグラフを動かせるようにしたい。 ・調べてみると、pyvisというライブラリでインタラクティブなネットワークグラフを描け…

【Python】エッジリストからネットワーク図を描きたい

・お題:どのノードからどのノードにエッジが伸びているかと、そのエッジのウェイトが入っている表(エッジリスト)を入手した。ここから、ネットワーク図を描いてみたい。 ・neoworkxを利用した。 networkx.org ・まずはエッジリストを適当に作成する。 imp…

【Python】文章からStop wordsを除きたい

・お題:以前、文章の特徴を解析しようと思い、文章を数値化した。aやtheなどのあまり意味の無い単語がたくさん出てきて、解析の邪魔になるので、除きたい。 ・自然言語解析であまり使われない代名詞や冠詞などのことを、stop wordsと呼び、前処理として除か…

【Python】PubMedからアブストを引っ張ってきたい

・お題:論文のアブストを題材に自然言語処理で遊ぼうと思ったところ、アブストを集めるのが面倒だった。キーワードからアブストを集めるところを、Pythonにやってほしい。 ・少し調べたところ、biopythonでできるらしい。正しいことは公式サイトをご確認い…

【Python】文章の類似度を算出したい

・お題:文章がたくさんある中で、自分が気になる文章と似ている文章を探したい。cos類似度というやつを使って、類似度をランキングしてみたい。 ・先日、文章をその中に含んでいる単語で数値化して表現した。今回は、その数値化された文章を使って、cos類似…

【Python】文章を数値で表したい。

・お題:文章同士の関係を評価する際に、まずは文章を数値で表現することがあるらしい。今回は、TF-IDFというやつで文章を数値で表現してみたい。 ・以下のサイトを参考にさせて頂いた。正確なことはそちらをご参照いただきたい。 www.takapy.work qiita.com…

【Python】化合物情報をプロットして、カーソルを乗せると構造がホバーするようにしたい

・お題:化合物のいろいろな特徴をプロットしたグラフを作成したが、構造が見づらいので、マウスオンで構造がホバーするようにしたい。 ・とりあえず、データセットを落とす。今回は、ChEMBLからデータセットを拝借した。 www.ebi.ac.uk ・Assayから適当な実…

【Python】散布図でプロットにカーソルを合わせると画像がホバーするようにしたい

・お題:先日、画像を散布図上に表示したが、プロットが多いとどうしても画像とプロットが被ってしまい、とても見づらい。プロットにカーソルを合わせると画像がホバーする仕様にしたい。 ・以下のサイトを参考にさせて頂いた。正しいことは以下のサイトをご…

【Python】散布図に矢印で画像を表示したい。

・お題:散布図を描いたところ、画像をデータとして反映させたくなった。矢印で散布図に対応する画像を表示させたい。 ・画像はIcooonmonoから拝借した。png画像として落とし、ワーキングディレクトリに保存した。 icooon-mono.com ・画像情報を矢印で追加す…

【Python】ネットワークグラフを描きたい

・お題:いろいろなモノの関係を視覚的に表現したグラフに、ネットワークグラフというのがあるみたい。なんだかカッコいいので、作ってみたい。 ・networkxというライブラリを使った。正しいことは公式サイトを参照していただきたい。インストールは割愛。 n…

【Python】DataFrameから条件に合うデータを抜き出したりしたい

・お題:DataFrameを入手した。ここから、気になるデータを抽出したりしたい。 ・PandasのDataFrameで特定のデータを抽出したりできるとうれしい。 ・データセットを作成する。 import pandas as pdimport numpy as npimport random df=pd.DataFrame({"Age":…

【Python】日本語でワードクラウドしたい

・お題:先日、英語の文章をそれっぽく画像にするワードクラウドで遊んだ。今回は、日本語でワードクラウドしてみたい。 ・先日のライブラリ(wordcloud)に日本語の文章を放り込んでも、なんだか思ったようにいかなかったので、ちょっといろいろ弄って日本…

【Python】ワードクラウドしてみたい

・お題:文章中の単語を並べて表現した画像をワードクラウドというらしい。おしゃれなので、ちょっとやってみたい。 ・今回使ったのは、wordcloudというライブラリ。まずはwordcloudをインストールする。正しいことは以下を参照いただきたい。 amueller.gith…

【Python】表からインタラクティブにグラフを作りたい②

・お題:表からインタラクティブにグラフを作りたい。 ・あれから追加で調べてみたところ、pivottablejsというライブラリはJupyter Labで使えるし多機能かつ直感的な操作が可能みたいだったので、試してみた。 ・とりあえず、pivottablejsをインストール。 …