いろいろ倉庫

KNIME、EXCEL、R、Pythonなどの備忘録

2021-12-01から1ヶ月間の記事一覧

【KNIME】アルファベットの文字列を大文字または小文字に変換したい

・文字列をKNIMEで弄る際に、アルファベットを大文字又は小文字に統一したい場合がある。 ・そのような場合は、String Manipulationで変換可能できる(下図)。 ・大文字に変換したい場合はupperCase関数、小文字に変換したい場合はlowerCase関数を使用する…

【KNIME】Extensionで機能を追加したい

・KNIMEで専門的な解析をしたい場合は、追加機能をインストールする必要がある。 ・拡張機能(Extension)は、Fileから追加できる(下図)。 ・例えば、Twitterから情報をとってきたりするExtensionが欲しい場合、検索窓にキーワードを入力して検索すれば、…

【KNIME】円グラフの色も綺麗に塗りたい

・先に、散布図のプロットを綺麗に塗り分けたが、円グラフも綺麗に塗り分けたいと思った。 ・これもColor ManagerでRowにつけた色で塗ることができるのだが、Scatter Plotとは違ってデフォルトでは駄目らしい。 ・Pie/Donut Chartノードの設定を少し弄り、Us…

【KNIME】関数でグラフを描きたい。

・関数でグラフを描く方法が分からなかったので、少し調べてワークフローを作成した(下図)。 ・工程としては、 ① 適当な表を作成(データは何でも良い。列名はXでデータ型はDouble) ② 空の行を追加(例えば100行。下図) ③ 行番号を抽出して10で割って、0…

【EXCEL】マクロを使わずに、グラフのプロットの色を一気に真っ黒に変更したい。

・EXCELのグラフのプロットを一括で黒にを揃えたい場面があった。 ・マクロを使わない手法を少し考えてみたので、記録しておく。今回やりたいのは、下の図のプロットをすべて真っ黒に変更する、というもの。 ・まず、「ページレイアウト」タブの左上にある「…

【KNIME】散布図のプロットの色を綺麗に塗りたい

・散布図のプロットを良い感じの色合いで表現したい場合がある。 ・例えば、ある変数AとBを軸に取った散布図を描いた際に、更に別の変数Cをプロットの色の違いで表現したい場合など。 ・そのような場合には、Color Managerというノードが役に立つ。 ・Table …

【KNIME】散布図のいろいろ

・KNIMEで散布図を描く際に、ノードを"scatter"で検索すると、いくつも引っ掛かった。それぞれどう違うのか、メモしておく。 ・適当なTableを作成し、Scatter Plotノードを3種類くっつけてRunしてみた(下図)。 ・グラフを表示するには、散布図ノードを右ク…

【EXCEL】平均値の棒グラフに個別値もプロットしたい。

・各群5例の個別値と平均値をグラフに表す際に、平均値をカラム(棒グラフ)で、個別値をプロットで表したいことがある。その手順を記しておく。 ・下図の左のようにデータがまとまっている場合、平均値と群名のところを選択し、散布図を挿入すると、右側の…

【KNIME】列の値を比較したい

・データを弄っていると、2つの値の大小で場合分けしたくなることがある。 ・例えば、生徒のうち、国語のテストの点数が算数のテストの点数よりも高い生徒を抽出する、など。 ・そのような場合には、列の値を比較し、情報を与えるノード(Column Comparator…

【KNIME】シルエット図を描きたい。

・シルエット図を描きたくて、少し調べてみた。 ・以下の構成で、それっぽいグラフを描くことができた。ちなみに、k=3で、直観的にはそこそこ綺麗に分けられる筈。 ・少々癖があるのがBar Chartノードで、デフォルトだと垂直グラフなので、水平グラフにする…

【KNIME】クラスタ数を決めたい(シルエット係数)

・これまでにいくつかクラスタを扱ったが、k-meansなどの手法はクラスタ数を自分で決めなければならない。 ・何を以て「最適なクラスタ数」というのはは諸説あるが、k-means法でクラスタ数を決めるのに一般的に用いられたいるのは、エルボー法かシルエット法…

【EXCEL】外れ値のあるグラフを見やすくしたい

・極端に大きい数値を含むデータをグラフ化すると、その他の差が見づらくなることがある(下図)。例では、Eが異様に大きく、他の差がよくわからなくなっている。 ・グラフの真ん中が抜けているような表示は、一般的に不適切と言われるけれど、場合によって…

【KNIME】もっとクラスタリングしてみたい(k-Medoids)

・先のノード検索の際に出てきたk-Medoidsを使ってみる。 ・細かいことは分からないが、k-Meansのように仮想の重心を置くのではなく、データの中から重心に相当するものを選抜することでクラスタリングをするらしい。 ・特長は外れ値に比較的強いことだとか…

【KNIME】ちょっとFuzzyにクラスタリングしてみたい(Fuzzy c-Means)

・先の記事で、k-Meansで気軽にクラスタリングを試して気づいたが、似たような名前のクラスタリング手法がある。Fuzzy c-Meansとk-Medoidsだ。 ・後者はいったん置いておいて、前者を前回と同じデータに対して試した。 ・Fuzzy c-Meansノードの出力ポートを…