いろいろ倉庫

KNIME、EXCEL、R、Pythonなどの備忘録

2022-12-01から1ヶ月間の記事一覧

【Python】PandasのDataFrameの特定の列に色をつけたい

・お題:PandasのDataFrameの特定の列やセルに色を付けて、表を見やすくしたい。 ・公式サイトを参考にした。正しいことは公式サイトを参照していただきたい。 pandas.pydata.org ・とりあえず、データセットを作成する。 import pandas as pdimport numpy a…

【Python】DataFrameから特定のデータ型の列だけ取り出したい

・お題:PandasのDataFrameを入手した。このDataFrameから特定のデータ型の列だけ抜き出したい。 ・Pandasの公式にやり方が書いてあった。正しいことはそちらをご確認いただきたい。 pandas.pydata.org ・とりあえずデータフレームを作成する。今回は、スポ…

【Python】ネットワークの中の大事なノードを見つけたい

・お題:先日、ネットワークの図を描いてみた。たくさんあるノードの中で、どれが大事っぽいのか推定してみたい。 ・大事さと私がイメージしていることは、ネットワーク界隈では中心性と呼ぶらしい。私の「大事さ」はぼんやりとしたイメージだけれど、「中心…

【Python】ネットワークからコミュニティを抽出したい

・お題:ネットワークを描いたところ、なんだがゴチャっとしている。どのノード同士がまとまった集団を形成しているのか、コミュニティを抽出してみたい。 ・ネットワークの中にある局所的に繋がりが密な集団をコミュニティと呼ぶらしく、ネットワークの中か…

【Python】相関ネットワークの図を描きたい②

・お題:いろいろな変数の数値データが入った表を入手した。変数の相関関係からグラフを描きたい。 ・やりたいことは先日と同じだけれど、今回はnetworkxの描画をもう少し工夫してみた。以下のサイトを参考にさせて頂いた。 qiita.com ・とりあえず、データ…

【Python】辞書のバリューでキーをとってきたい

・お題:諸般の事情で、辞書型のvalueから対応するkeyをとって来る必要が出てきた。やってみたい。 ・きっともっとエレガントなやり方があると思うが、私なりに考えてみた。 ・とりあえず、辞書を作成する。 Dic1={"A":"a", "B":"b", "C":"c", "D":"c"} ・こ…

【Python】相関のネットワークの図を描きたい

・お題:それぞれの変数に関して、相関係数をもとに、ネットワーク図を描いてみたい。 ・変数間の相関係数をもとにネットワークを描くことがあるらしい。偽相関の懸念や因果関係を表すわけではないなどの注意点があるが、せっかくなのでやってみたい。 ・と…

【Python】Pyvisでインタラクティブなネットワーク図を描いてみたい

・お題:先日、networkxを使ってエッジリストからネットワーク図を描いてみた。エッジが見づらいことがあったので、インタラクティブにグラフを動かせるようにしたい。 ・調べてみると、pyvisというライブラリでインタラクティブなネットワークグラフを描け…

【Python】エッジリストからネットワーク図を描きたい

・お題:どのノードからどのノードにエッジが伸びているかと、そのエッジのウェイトが入っている表(エッジリスト)を入手した。ここから、ネットワーク図を描いてみたい。 ・neoworkxを利用した。 networkx.org ・まずはエッジリストを適当に作成する。 imp…

【Python】文章からStop wordsを除きたい

・お題:以前、文章の特徴を解析しようと思い、文章を数値化した。aやtheなどのあまり意味の無い単語がたくさん出てきて、解析の邪魔になるので、除きたい。 ・自然言語解析であまり使われない代名詞や冠詞などのことを、stop wordsと呼び、前処理として除か…

【Python】PubMedからアブストを引っ張ってきたい

・お題:論文のアブストを題材に自然言語処理で遊ぼうと思ったところ、アブストを集めるのが面倒だった。キーワードからアブストを集めるところを、Pythonにやってほしい。 ・少し調べたところ、biopythonでできるらしい。正しいことは公式サイトをご確認い…

【Python】文章の類似度を算出したい

・お題:文章がたくさんある中で、自分が気になる文章と似ている文章を探したい。cos類似度というやつを使って、類似度をランキングしてみたい。 ・先日、文章をその中に含んでいる単語で数値化して表現した。今回は、その数値化された文章を使って、cos類似…

【Python】文章を数値で表したい。

・お題:文章同士の関係を評価する際に、まずは文章を数値で表現することがあるらしい。今回は、TF-IDFというやつで文章を数値で表現してみたい。 ・以下のサイトを参考にさせて頂いた。正確なことはそちらをご参照いただきたい。 www.takapy.work qiita.com…