いろいろ倉庫

KNIME、EXCEL、R、Pythonなどの備忘録

【その他】よく使う正規表現を纏めたい

・たまに正規表現を使うのだけれど、毎度調べるのが大変なので、よく使う表現を何パターンかメモしておく。おかしかったらごめんなさい。

 

・日付(例:2022年10月1日):[0-9]{1,4}年[0-9]{1,2}月[0-9]{1,2}日

[0-9]は半角数字。{}で何回繰り返してるか指定するっぽい。{1,4}で1~4回、{2}なら2回、{,4}なら最大4回。

・日付(例:2022年4月1日):[0-90-9]{1,4}年[0-90-9]{1,2}月[0-90-9]{1,2}日

全角の数字も引っ掛かるようにした。

・半角英字文字列とスペース(例:Tanaka Taro):[a-zA-Z\s]+

[a-zA-Z]の半角英文字小文字・大文字に\sで半角スペースを付け足し。+で1文字以上がヒットするっぽい。

・半角英数記号(例:)3#>M [e}):[!-~\s]+

[!-~]はASCIIコード表を参考に設定。多くの記号と半角英数を含むが、半角スペースを含まないので、半角スペースは\sで付け足し。

・半角カタカナ(例:アイフィドピッントヲデ):[ヲ-゚\s]+

[ヲ-゚]はJISコード表を参考に設定。スペースも追加。

・全角ひらがなカタカナ漢字(例:田中たろう):[ぁ-ヶ一-龠]+

[ぁ-ヶ]で全角ひらがなカタカナ、[一-龠]で漢字。

・何らかの文字(例:私の名前はxxxです。):私の名前は.+です。

.で何等かの文字。+で1回以上の反復。

 

おわり。