いろいろ倉庫

KNIME、EXCEL、R、Pythonなどの備忘録

【KNIME】joinerのいろいろ

・キーとなる列の値を使って、2つの表をくっつけるのが"Joiner"ノード

・くっつけ方にもいろいろ癖あるので、メモしておく。

 

・今回は、上の表に下の表をくっつけるだけのワークフローを考える。

f:id:choron81:20210304223146p:plain

 

・上の表

f:id:choron81:20210304223046p:plain

 

・下の表

f:id:choron81:20210304223235p:plain

・GroupとIDの両方をキーに、2つの表をくっつける。

・"Joiner"の設定画面のJoin modeに、"Inner Join"、"Left Outer Join"、"Right Outer Join"、"Full Outer Join"というのがある。

・Leftは上の表のこと、Rightは下の表のこと。

 

・"Inner Join"でくっつけると、2つの表の両方にキーが存在するものだけ抜き出して、それぞれのデータをくっつける。

f:id:choron81:20210304223656p:plain

 

・"Left Outer Join"でくっつけると、上の表にキーが存在するものだけを抜き出して、下の表のデータをくっつける。

f:id:choron81:20210304223818p:plain

 

・"Right Outer Join"でくっつけると、下の表にキーが存在するものだけ抜き出して、下の表のデータをくっつける。ただし、キーは上の表のものを採用するので、下の表にしかなかったキーは"?"で埋まる

f:id:choron81:20210304224651p:plain

 

・"Full Outer Join"でくっつけると、いずれか片方の表にキーが存在すればデータをくっつける。ただし、キーは上の表のものを採用するので、下の表にしかなかったキーは"?"で埋まる

f:id:choron81:20210304225106p:plain

 

・もしGroup a-c、ID 1-4のすべてのデータを一つの表にまとめたければ、上の表に下の表のキーを含めておき、そのキーを頼りに下の表を"Left Outer Join"か"Full Outer Join"するようにする

f:id:choron81:20210304231740p:plain

 

・なお、下の表からくっつけたデータの列(score(#1))を上の表から引き継いだ列(score)に統合したい場合は、”Column Merger”を使う。

 

終わり。