正则表达式

正则表达式

python3中:

\w:包括a-z,A-Z,0-9

\W:不包括\w所包含的字符。

\s:所有的空白字符

\S:所有的非空白字符

\d:所有Unicode编码的十进制数[0-9]。

\D:与\d相返,所有不是Unicode编码的十进制数字。

[]:用于指定一组字符,在这一组字符中:
(1)字符可以单独列出,也就是[amk]会匹配'a','m'或'k'。
(2)可也可通过使用'-'指定字符范围,如[a-z]会匹配小字ASCII字符,[0-5][0-9]会匹配两个数字从00到59,而[0-9A-Fa-f]会匹配任何十六进制数字。如果'-'被转义(也就是[a\-z])或被放在第一个或最后一个时,匹配'-'字符
(3)在组中特殊字符会失去它们的特殊意义。如:[(+*)]将会匹配'(','+','*',或')'字符。
(4)排除字符可以使用“补集”设置。如果第一个字符是'^',所有字符都不在组中才能匹配到。如:[^5]将会匹配任何不包含'5'的字符,[^^]会匹配任何不包含'^'的字符。如果'^'不在开始第一个字符,在组中它没有任何特殊意义。
(5)在组中匹配字符']',需要在它前面放一个反斜线('\'),或把它放在组中第一个。如:[()[\]{}]和[]()[{}]是同样效果都能匹配所有的方括号、圆括号和花括号。

发表评论