いろいろ倉庫

KNIME、EXCEL、R、Pythonなどの備忘録

【KNIME】アルファベットを含むセルをmissing"?"にしたい

・KNIMEでいろいろ扱っていると、特定の条件を満たすセルのデータを消したくなることがある。例えば、数値データばかりのところに、よくわからないアルファベットを含む文字列が混ざっている場合など。

・こういう場合、文字列を含むセルをmissingにしたいが、KNIMEでのやり方がよく分からなかったので、Python Scriptで実装してみた(下図。左の窓はTable Creatorの出力、右の窓はPython Scriptの出力)。

f:id:choron81:20220409160716p:plain

Python Scriptの中身は以下の通り。Pythonの作法は分からないので、変なところはご容赦いただきたい。

 

df= input_table_1.astype(str)

#アルファベットを含むか否か判別する関数を定義
find_char=lambda x: x.str.contains('[a-zA-Z]' ,na=False)

#アルファベットのTF判別を反転して、表から抽出
output_table_1 = df[~df.apply(find_char)]

 

終わり。