Nootropic.me

正規表現1

正規表現について欠片も分からないので勉強してみました。

言語はPythonのバージョン2.6.5を使用しています。

Pythonで正規表現を利用するにはreモジュールが必要なのでimportします。

今回は「He was born in 1992.」という文字列から数字のみを抜き出してみたいとおもいます。

dは[0-9]の数字を、+は直前の正規表現を繰り返し表現します。

spanは正規表現が一致した箇所の始めと終わりをタプルで返します。

groupは正規表現と一致した文字列を返します。なので今回は「1992」という文字列が返ってくるわけですね。

正規表現に[^1]+を用いることで文字列中の1までの文字を抽出します。

また\Dを用いることで\d以外の文字列を抽出することが出来ます。

これらの結果は同じですね。

*は直前の正規表現の0回以上の繰り返しに一致する場合なので「a」1文字と一致しますが+は1回以上の繰り返しに一致する場合なので「a」1文字とは一致しません。

?は空文字、直前の正規表現と一致した場合です。


Author:ラロ