正则表达式(regular expression,简称regex)是一种工具。
正则表达式的两种基本用途:查找和替换。
.字符(英文句号)可以匹配任何一个单个的字符。(.字符可以匹配任何单个的字符、数字、字母,甚至是.字符本身。)
\转义字符,这是一个元字符(metacharacter,表示这个字符有特殊含义,而不是字符本身含义。)
合法的字符区间:
A-Z,匹配从A到Z的所有大些字母;
a-z,,匹配从a到z的所有小写字母;
A-z,匹配从ASCII字符A到ASCII字母z的所有字母(不常用);
^取非字符也是元字符,用来对一个字符集合进行取非操作。
元字符大致可以分为两种:一种是用来匹配文本的(例如.),另一种是正则表达式语法所要求的(例如[和])。
//2015.02.17
空白元字符:
[\b]
回退(并删除)一个字符(Backspace键)
\f
换页符
\n
换行符
\r
回车符
\t
制表符(Tab键)
\v
垂直制表符
数字元字符:
\d
任何一个数字字符(等价于[0-9])
\D
任何一个非数字字符(等价于[^0-9])
字母数字元字符:
\w
任何一个字母数字字符(大小写均可)或下划线字符(等价于[a-zA-Z0-9_])
\W
任何一个非字母数字或非下划线字符(等价于[^a-zA-Z0-9_])
空白字符元字符:
\s
任何一个空白字符(等价于[\f\n\r\t\v])
\S
任何一个非空白字符(等价于[^\f\n\r\t\v])
+匹配一个或多个字符的一次或多次出现(至少一个;不匹配零个字符的情况)。
*匹配一个或多个字符的零次或多次出现。
?匹配一个或多个字符的零次或一次出现。
{3, }
贪婪型元字符和它们的懒惰版本:
*
*?
+
+?
{n, }
{n, }?
\b用来匹配一个单词的开始或结尾。
\B用来匹配一个字符的开始或结尾。
当世界给草籽重压时,它总会用自己的方法破土而出。