いろいろ倉庫

KNIME、EXCEL、R、Pythonなどの備忘録

【KNIME】Column Mergerのいろいろ

・"Joiner"でくっつけた列を統合し、すっきりさせたい。

・列をまとめるには"Column Merger"を使うが、設定に少し癖があるので、メモしておく。

 

・今回統合したい表↓。score(#1)列のデータを、score列にまとめたい。ただし、Group bのID2のデータがそれぞれに存在する

f:id:choron81:20210304233124p:plain

 

・"Column Merger"の設定画面では、"Primary Column"と"Secondary Column"を選択し、”Output Placement”で統合の仕方を指定する。「第一列」「第二列」というよりも、「優先列」「副次列」とイメージする方が分かりやすい

 

・"Replace primary column"を選択すると、"Primary Column"の"?"が"Secondary Column"で埋まる。データがかち合った場合、"Primary Column"のデータが優先されて残る

f:id:choron81:20210304233733p:plain

 

・"Replace secondary column"を選択すると、"Secondary Column"の"?"が"Primary Column"で埋まる。データがかち合った場合、"Primary Column"のデータが優先されて残る

f:id:choron81:20210304234026p:plain

 

・"Replace both columns"を選択すると、"Primary Column"の"?"が"Secondary Column"で埋まり、"Secondary Column"が消える。データがかち合った場合、"Primary Column"のデータが優先されて残る

f:id:choron81:20210304234219p:plain

 

・"Append new column"を選択すると、"Primary Column"の"?"を"Secondary Column"で埋また新たな列ができる。データがかち合った場合、"Primary Column"のデータが優先されて残る

 

・以上より、データがかち合った場合、"Primary Column"のデータが優先されて残ることを頭に置いておきたい。

・なお、基本的に"?"をデータで埋めるので、"Secondary Column"に何らかのデータが入っており、"Primary Column"が"?"であった場合に"Replace secondary column"をしても、"Secondary Column"のデータが"?"に置き換わるわけではないことにも注意が必要。

 

終わり。