いろいろ倉庫

KNIME、EXCEL、R、Pythonなどの備忘録

【KNIME】特徴量を削りたい

機械学習において特徴量を選抜する手法は様々にある。

・一般的なものとして、分散が小さすぎる特徴量、相関が高すぎる特徴量を除去することは真っ先に挙げられると思う。

・分散が小さすぎる特徴量を除く際には、Low Variance Filterノード、相関が高すぎる特徴量を除く際には、Correlation Filterノードが有用(下図)。

f:id:choron81:20211128222845p:plain

・Low Variance Filterノードでは、Option画面で除去する分散の閾値を設定できる(下図)。

f:id:choron81:20211128222941p:plain

・Correlation Filterノードでは、相関係数閾値を設定できる(下図)。

f:id:choron81:20211128223100p:plain

・これらの処理を経ることで、特徴量を削ることができる場合がある(下図、Before:左表、After:右表)。

f:id:choron81:20211128223534p:plain

・簡単に処理を実行できて便利。

 

終わり。