正则表达式基础(读书笔记)

正则表达式(regular expression,简称regex)是一种工具。

正则表达式的两种基本用途:查找和替换。

.字符(英文句号)可以匹配任何一个单个的字符。(.字符可以匹配任何单个的字符、数字、字母,甚至是.字符本身。)

\转义字符,这是一个元字符(metacharacter,表示这个字符有特殊含义,而不是字符本身含义。)

合法的字符区间:

A-Z,匹配从A到Z的所有大些字母;

a-z,,匹配从a到z的所有小写字母;

A-z,匹配从ASCII字符A到ASCII字母z的所有字母(不常用);

^取非字符也是元字符,用来对一个字符集合进行取非操作。

元字符大致可以分为两种:一种是用来匹配文本的(例如.),另一种是正则表达式语法所要求的(例如[和])。

//2015.02.17

空白元字符:

[\b]

回退(并删除)一个字符(Backspace键)

\f

换页符

\n

换行符

\r

回车符

\t

制表符(Tab键)

\v

垂直制表符

数字元字符:

\d

任何一个数字字符(等价于[0-9])

\D

任何一个非数字字符(等价于[^0-9])

字母数字元字符:

\w

任何一个字母数字字符(大小写均可)或下划线字符(等价于[a-zA-Z0-9_])

\W

任何一个非字母数字或非下划线字符(等价于[^a-zA-Z0-9_])

空白字符元字符:

\s

任何一个空白字符(等价于[\f\n\r\t\v])

\S

任何一个非空白字符(等价于[^\f\n\r\t\v])

+匹配一个或多个字符的一次或多次出现(至少一个;不匹配零个字符的情况)。

*匹配一个或多个字符的零次或多次出现。

?匹配一个或多个字符的零次或一次出现。

{3, }

贪婪型元字符和它们的懒惰版本:

*

*?

+

+?

{n, }

{n, }?

\b用来匹配一个单词的开始或结尾。

\B用来匹配一个字符的开始或结尾。

当世界给草籽重压时,它总会用自己的方法破土而出。

正则表达式基础(读书笔记)

相关文章:

你感兴趣的文章:

标签云: