shell grep命令,ps-ef grepshell这个指令又是在干嘛?
shell grep命令,ps-ef grepshell这个指令又是在干嘛?详细介绍
本文目录一览: grep是什么意思
在英文上的意思是:命令;正则表达式;查找字符串。
例句:
1.The grep utility filters input line by line and looks for matches.
grep实用工具逐行过滤输入并寻找匹配。
2.Using the grep command, you can filter the result and retrieve just the parameters you want
通过使用grep命令,可以过滤结果,只获取想要的参数
3.You can use the grep utility to search the system user attribute defaults in the file.
可以使用grep工具在文件中搜索系统用户属性默认值。
另外,grep也是一种文本搜索工具,它能够使用正则表达式搜索文本,并把匹配的行打印出来。
在Linux系统中,grep命令是一种强大的文本搜索工具,它能够使用正则表达式搜索文本,并把匹配的行打印出来。此外,在Shell脚本中,grep也可以用于自动化的文本处理工作1。
综上所述,grep是一种功能强大且应用广泛的文本搜索工具。
grep在shell脚本中使用,判断进程是否存在,进程不存在则重启
在shell中,判断一个进程是否存在,是判断进程数量
没有运行进程时,如下显示,只有一条,这条就是这条命令的进程。
如果进程存在就会显示多条进程信息,其中一条包括命令这条。
所以判断是否存在,只要判断数量即可,命令为
进程大于1,则进程存在正常,显示如下:
以下是最简单的判断内容,判断进程数量小于等于1,则进程不存在,然后重启即可。
shell判断相关参数:
需注意的坑:
grep 需要加上参数 -w ,意为精确匹配。如果不加上 -w ,判断进程数量会不准确。
例:判断一个名为 info.py 的脚本内容: ps -ef |grep info.py
不加 -w ,会把包括 info.py 都显示出来,如 info_py , info 之类的。所以显示数量远大于实际进程数量。
所以写脚本时必须加上 -w 参数,显示只有 info.py 的内容。
grep其他参数参考:
脚本完成后,需添加系统定时任务。
Linux常用指令---grep(搜索过滤)(转)
Linux常用指令---grep(搜索过滤) (转)
Linux系统中grep命令是一种强大的文本搜索工具,它能使用正则表达式搜索文本,并把匹?配的行打印出来。grep全称是Global?Regular?Expression?Print,表示全局正则表达式版本,它的使用权限是所有用户。
grep的工作方式是这样的,它在一个或多个文件中搜索字符串模板。如果模板包括空格,则必须被引用,模板后的所有字符串被看作文件名。搜索的结果被送到标准输出,不影响原文件内容。
grep可用于shell脚本,因为grep通过返回一个状态值来说明搜索的状态,如果模板搜索成功,则返回0,如果搜索不成功,则返回1,如果搜索的文件不存在,则返回2。我们利用这些返回值就可进行一些自动化的文本处理工作。
1.命令格式:
grep?[option]?pattern?file
2.命令功能:
用于过滤/搜索的特定字符。可使用正则表达式能多种命令配合使用,使用上十分灵活。
3.命令参数:
-a???--text???#不要忽略二进制的数据。???
-A
???--after-context=
???#除了显示符合范本样式的那一列之外,并显示该行之后的内容。???
-b???--byte-offset???#在显示符合样式的那一行之前,标示出该行第一个字符的编号。???
-B
???--before-context=
???#除了显示符合样式的那一行之外,并显示该行之前的内容。???
-c????--count???#计算符合样式的列数。???
-C
????--context=
或-
???#除了显示符合样式的那一行之外,并显示该行之前后的内容。???
-d?
??????--directories=
???#当指定要查找的是目录而非文件时,必须使用这项参数,否则grep指令将回报信息并停止动作。???
-e
??--regexp=
???#指定字符串做为查找文件内容的样式。???
-E??????--extended-regexp???#将样式为延伸的普通表示法来使用。???
-f
??--file=
???#指定规则文件,其内容含有一个或多个规则样式,让grep查找符合规则条件的文件内容,格式为每行一个规则样式。???
-F???--fixed-regexp???#将样式视为固定字符串的列表。???
-G???--basic-regexp???#将样式视为普通的表示法来使用。???
-h???--no-filename???#在显示符合样式的那一行之前,不标示该行所属的文件名称。???
-H???--with-filename???#在显示符合样式的那一行之前,表示该行所属的文件名称。???
-i????--ignore-case???#忽略字符大小写的差别。???
-l????--file-with-matches???#列出文件内容符合指定的样式的文件名称。???
-L???--files-without-match???#列出文件内容不符合指定的样式的文件名称。???
-n???--line-number???#在显示符合样式的那一行之前,标示出该行的列数编号。???
-q???--quiet或--silent???#不显示任何信息。???
-r???--recursive???#此参数的效果和指定“-d?recurse”参数相同。???
-s???--no-messages???#不显示错误信息。???
-v???--revert-match???#显示不包含匹配文本的所有行。???
-V???--version???#显示版本信息。???
-w???--word-regexp???#只显示全字符合的列。???
-x????--line-regexp???#只显示全列符合的列。???
-y???#此参数的效果和指定“-i”参数相同。
4.规则表达式:
grep的规则表达式:
^??#锚定行的开始?如:'^grep'匹配所有以grep开头的行。????
$??#锚定行的结束?如:'grep$'匹配所有以grep结尾的行。????
.??#匹配一个非换行符的字符?如:'gr.p'匹配gr后接一个任意字符,然后是p。????
*??#匹配零个或多个先前字符?如:'*grep'匹配所有一个或多个空格后紧跟grep的行。????
.*???#一起用代表任意字符。???
[]???#匹配一个指定范围内的字符,如'[Gg]rep'匹配Grep和grep。????
[^]??#匹配一个不在指定范围内的字符,如:'[^A-FH-Z]rep'匹配不包含A-R和T-Z的一个字母开头,紧跟rep的行。????
\(..\)??#标记匹配字符,如'\(love\)',love被标记为1。????
\
<!--??????#锚定单词的开始,如:'\
\>??????#锚定单词的结束,如'grep\>'匹配包含以grep结尾的单词的行。????
x\{m\}??#重复字符x,m次,如:'0\{5\}'匹配包含5个o的行。????
x\{m,\}??#重复字符x,至少m次,如:'o\{5,\}'匹配至少有5个o的行。????
x\{m,n\}??#重复字符x,至少m次,不多于n次,如:'o\{5,10\}'匹配5--10个o的行。???
\w????#匹配文字和数字字符,也就是[A-Za-z0-9],如:'G\w*p'匹配以G后跟零个或多个文字或数字字符,然后是p。???
\W????#\w的反置形式,匹配一个或多个非单词字符,如点号句号等。???
\b????#单词锁定符,如:?'\bgrep\b'只匹配grep。??
POSIX字符:
为了在不同国家的字符编码中保持一至,POSIX(The?Portable?Operating?System?Interface)增加了特殊的字符类,如[:alnum:]是[A-Za-z0-9]的另一个写法。要把它们放到[]号内才能成为正则表达式,如[A-?Za-z0-9]或[[:alnum:]]。在linux下的grep除fgrep外,都支持POSIX的字符类。
[:alnum:]????#文字数字字符???
[:alpha:]????#文字字符???
[:digit:]????#数字字符???
[:graph:]????#非空字符(非空格、控制字符)???
[:lower:]????#小写字符???
[:cntrl:]????#控制字符???
[:print:]????#非空字符(包括空格)???
[:punct:]????#标点符号???
[:space:]????#所有空白字符(新行,空格,制表符)???
[:upper:]????#大写字符???
[:xdigit:]???#十六进制数字(0-9,a-f,A-F)??
5.使用实例:
实例1:查找指定进程
命令:
ps?-ef|grep?svn
输出:
[root@localhost?~]#?ps?-ef|grep?svn
root?4943???1??????0??Dec05?????00:00:00?svnserve?-d?-r?/opt/svndata/grape/
root?16867?16838??0?19:53?pts/0????00:00:00?grep?svn
[root@localhost?~]#
说明:
第一条记录是查找出的进程;第二条结果是grep进程本身,并非真正要找的进程。
实例2:查找指定进程个数
命令:
ps?-ef|grep?svn?-c
ps?-ef|grep?-c?svn
输出:
[root@localhost?~]#?ps?-ef|grep?svn?-c
2
[root@localhost?~]#?ps?-ef|grep?-c?svn?
2
[root@localhost?~]#
说明:
实例3:从文件中读取关键词进行搜索
命令:
cat?test.txt?|?grep?-f?test2.txt
输出:
[root@localhost?test]#?cat?test.txt?
hnlinux
peida.cnblogs.com
ubuntu
ubuntu?linux
redhat
Redhat
linuxmint
[root@localhost?test]#?cat?test2.txt?
linux
Redhat
[root@localhost?test]#?cat?test.txt?|?grep?-f?test2.txt
hnlinux
ubuntu?linux
Redhat
linuxmint
[root@localhost?test]#
说明:
输出test.txt文件中含有从test2.txt文件中读取出的关键词的内容行
实例3:从文件中读取关键词进行搜索?且显示行号
命令:
cat?test.txt?|?grep?-nf?test2.txt
输出:
[root@localhost?test]#?cat?test.txt?
hnlinux
peida.cnblogs.com
ubuntu
ubuntu?linux
redhat
Redhat
linuxmint
[root@localhost?test]#?cat?test2.txt?
linux
Redhat
[root@localhost?test]#?cat?test.txt?|?grep?-nf?test2.txt
1:hnlinux
4:ubuntu?linux
6:Redhat
7:linuxmint
[root@localhost?test]#
说明:
输出test.txt文件中含有从test2.txt文件中读取出的关键词的内容行,并显示每一行的行号
实例5:从文件中查找关键词
命令:
grep?'linux'?test.txt
输出:
[root@localhost?test]#?grep?'linux'?test.txt?
hnlinux
ubuntu?linux
linuxmint
[root@localhost?test]#?grep?-n?'linux'?test.txt?
1:hnlinux
4:ubuntu?linux
7:linuxmint
[root@localhost?test]#
说明:
实例6:从多个文件中查找关键词
命令:
grep?'linux'?test.txt?test2.txt
输出:
[root@localhost?test]#?grep?-n?'linux'?test.txt?test2.txt?
test.txt:1:hnlinux
test.txt:4:ubuntu?linux
test.txt:7:linuxmint
test2.txt:1:linux
[root@localhost?test]#?grep?'linux'?test.txt?test2.txt?
test.txt:hnlinux
test.txt:ubuntu?linux
test.txt:linuxmint
test2.txt:linux
[root@localhost?test]#
说明:
多文件时,输出查询到的信息内容行时,会把文件的命名在行最前面输出并且加上":"作为标示符
实例7:grep不显示本身进程
命令:
ps?aux|grep?\[s]sh
ps?aux?|?grep?ssh?|?grep?-v?"grep"
输出:
[root@localhost?test]#?ps?aux|grep?ssh
root???2720??0.0??0.0??62656??1212????????Ss???Nov02???0:00?/usr/sbin/sshd
root??16834??0.0??0.0??88088??3288????????Ss???19:53???0:00?sshd:?root@pts/0?
root??16901??0.0??0.0??61180???764?pts/0??S+???20:31???0:00?grep?ssh
[root@localhost?test]#?ps?aux|grep?\[s]sh]
[root@localhost?test]#?ps?aux|grep?\[s]sh
root???2720??0.0??0.0??62656??1212????????Ss???Nov02???0:00?/usr/sbin/sshd
root??16834??0.0??0.0??88088??3288????????Ss???19:53???0:00?sshd:?root@pts/0?
[root@localhost?test]#?ps?aux?|?grep?ssh?|?grep?-v?"grep"
root???2720??0.0??0.0??62656??1212????????Ss???Nov02???0:00?/usr/sbin/sshd
root??16834??0.0??0.0??88088??3288????????Ss???19:53???0:00?sshd:?root@pts/0
说明:
实例8:找出已u开头的行内容
命令:
cat?test.txt?|grep?^u
输出:
[root@localhost?test]#?cat?test.txt?|grep?^u
ubuntu
ubuntu?linux
[root@localhost?test]#
说明:
实例9:输出非u开头的行内容
命令:
cat?test.txt?|grep?^[^u]
输出:
[root@localhost?test]#?cat?test.txt?|grep?^[^u]
hnlinux
peida.cnblogs.com
redhat
Redhat
linuxmint
[root@localhost?test]#
说明:
实例10:输出以hat结尾的行内容
命令:
cat?test.txt?|grep?hat$
输出:
[root@localhost?test]#?cat?test.txt?|grep?hat$
redhat
Redhat
[root@localhost?test]#
说明:
实例11:输出ip地址
命令:
?????ifconfig?eth0|grep?-E?"([0-9]{1,3}\.){3}[0-9]"
输出:
[root@localhost?test]#?ifconfig?eth0|grep?"[0-9]\{1,3\}\.[0-9]\{1,3\}\.[0-9]\{1,3\}\.[0-9]\{1,3\}"
??????????inet?addr:192.168.120.204??Bcast:192.168.120.255??Mask:255.255.255.0
[root@localhost?test]#?ifconfig?eth0|grep?-E?"([0-9]{1,3}\.){3}[0-9]"
??????????inet?addr:192.168.120.204??Bcast:192.168.120.255??Mask:255.255.255.0
[root@localhost?test]#
说明:
实例12:显示包含ed或者at字符的内容行
命令:
cat?test.txt?|grep?-E?"ed|at"
输出:
[root@localhost?test]#?cat?test.txt?|grep?-E?"peida|com"
peida.cnblogs.com
[root@localhost?test]#?cat?test.txt?|grep?-E?"ed|at"
redhat
Redhat
[root@localhost?test]#
说明:
实例13:显示当前目录下面以.txt?结尾的文件中的所有包含每个字符串至少有7个连续小写字符的字符串的行
命令:
grep?'[a-z]\{7\}'?*.txt
输出:
[root@localhost?test]#?grep?'[a-z]\{7\}'?*.txt
test.txt:hnlinux
test.txt:peida.cnblogs.com
test.txt:linuxmint
[root@localhost?test]#
实例14:日志文件过大,不好查看,我们要从中查看自己想要的内容,或者得到同一类数据,比如说没有404日志信息的
命令:
grep?'.'?access1.log|grep?-Ev?'404'?>?access2.log
grep?'.'?access1.log|grep?-Ev?'(404|/photo/|/css/)'?>?access2.log
grep?'.'?access1.log|grep?-E?'404'?>?access2.log
输出:
[root@localhost?test]#?grep?“.”access1.log|grep?-Ev?“404”?>?access2.log
说明:上面3句命令前面两句是在当前目录下对access1.log文件进行查找,找到那些不包含404的行,把它们放到access2.log中,后面去掉’v’,即是把有404的行放入access2.log
规则文件>
规则文件>
范本样式>
范本样式>
动作>
动作>
显示行数>
显示行数>
显示行数>
显示行数>
显示行数>
显示行数>
显示行数>
linux grep命令详解
Linux grep命令用于查找文件里符合条件的字符串或正则表达式。
grep指令用于查找内容包含指定的范本样式的文件,如果发现某文件的内容符合所指定的范本样式,预设 grep
指令会把含有范本样式的那一列显示出来。若不指定任何文件名称,或是所给予的文件名为 -,则 grep 指令会从标准输入设备读取数据。
语法:
grep [options] pattern [files]
pattern - 表示要查找的字符串或正则表达式。
files - 表示要查找的文件名,可以同时查找多个文件,如果省略files参数,则默认从标准输入中读取数据。
常用选项:
-i:忽略大小写进行匹配
-v:反向查找,只打印不匹配的行
-n:显示匹配行的行号
-r:递归查找子目录中的文件
-l:只打印匹配的文件名
-c:只打印匹配的行数
更多参数:
-a或--text:不要忽略二进制的数据
-A
或--after-context=
:除了显示符合范本样式的那一列之外,并显示该行之后的内容。
-b或--byte-offset:在显示符合样式的那一行之前,标示出该行第一个字符的编号。
-B
或--before-context=
:除了显示符合样式的那一行之外,并显示该行之前的内容。
-c或--count:计算符合样式的列数。
-C
或--context=
或-
:除了显示符合样式的那一行之外,并显示该行之前后的内容。
-d
或--directories=
:当指定要查找的是目录而非文件时,必须使用这项参数,否则grep指令将回报信息并停止动作。
-e
或--regexp=
:指定字符串做为查找文件内容的样式。
-E或--extended-regexp:将样式为延伸的正则表达式来使用。
-f
或--file=
:指定规则文件,其内容含有一个或多个规则样式,让grep查找符合规则条件的文件内容,格式为每行一个规则样式。
-F或--fixed-regexp:将样式视为固定字符串的列表。
参数有很多,就不一一介绍了,希望大家在学习工作的过程中慢慢认识它们。
grep命令作为Linux文本处理三剑客的一员,另外两个是sed和awk。
grep命令的由来可以追溯到UNIX诞生的早期,在UNIX系统中,搜索的模式(patterns)被称为正则表达式(regular expressions),为了要彻底搜索一个文件,有的用户在要搜索的字符串前加上前缀global(全面的),一旦找到相匹配的内容,用户就像将其输出(print)到屏幕上,而将这一系列的操作整合到一起就是global regular expressions print,而这也就是grep命令的全称。
grep命令能够在一个或多个文件中,搜索某一特定的字符模式(也就是正则表达式),此模式可以是单一的字符、字符串、单词或句子。
正则表达式是描述一组字符串的一个模式,正则表达式的构成模仿了数学表达式,通过使用操作符将较小的表达式组合成一个新的表达式。正则表达式可以是一些纯文本文字,也可以是用来产生模式的一些特殊字符。为了进一步定义一个搜索模式,grep 命令支持如表 1 所示的这几种正则表达式的元字符(也就是通配符)。
grep命令的基本格式如下:
[root@localhost ~]# grep [选项] 模式 文件名
这里的模式,要么是字符(串),要么是正则表达式。
grep命令常用选项及含义:
-c:仅列出文件中包含模式的行数。
-i:忽略模式中的字母大小写。
-l:列出带有匹配行的文件名。
-n:在每一行的最前面列出行号。
-v:列出没有匹配模式的行。
-w:把表达式当做一个完整的单字符来搜寻,忽略那些部分匹配的行。
注意,如果是搜索多个文件,grep命令的搜索结果只显示文件中发现匹配模式的文件名;而如果搜索单个文件,grep命令的结果将显示每一个包含匹配模式的行。
简介
grep (global search regular expression(RE) and print out the line,全面搜索正则表达式并把行打印出来)是一种强大的文本搜索工具,它能使用正则表达式搜索文本,并把匹配的行打印出来。
Unix的grep家族包括grep、egrep和fgrep。egrep和fgrep的命令只跟grep有很小不同。egrep是grep的扩展,支持更多的re元字符, fgrep就是fixed grep或fast grep,它们把所有的字母都看作单词,也就是说,正则表达式中的元字符表示回其自身的字面意义,不再特殊。linux使用GNU版本的grep。它功能更强,可以通过-G、-E、-F命令行选项来使用egrep和fgrep的功能。
grep常用用法
[root@www ~]#grep[-acinv] [--color=auto]'搜寻字符串' filename
选项与参数:-a :将 binary 文件以 text 文件的方式搜寻数据-c :计算找到'搜寻字符串' 的次数-i :忽略大小写的不同,所以大小写视为相同-n :顺便输出行号-v :反向选择,亦即显示出没有'搜寻字符串' 内容的那一行!--color=auto :可以将找到的关键词部分加上颜色的显示喔!
?
将/etc/passwd,有出现 root 的行取出来
# greproot /etc/passwdroot:x:0:0:root:/root:/bin/bash
operator:x:11:0:operator:/root:/sbin/nologin
或# cat/etc/passwd|grep root
root:x:0:0:root:/root:/bin/bash
operator:x:11:0:operator:/root:/sbin/nologin
将/etc/passwd,有出现 root 的行取出来,同时显示这些行在/etc/passwd的行号
#grep-n root /etc/passwd1:root:x:0:0:root:/root:/bin/bash30:operator:x:11:0:operator:/root:/sbin/nologin
?在关键字的显示方面,grep 可以使用 --color=auto 来将关键字部分使用颜色显示。 这可是个很不错的功能啊!但是如果每次使用 grep 都得要自行加上 --color=auto 又显的很麻烦~ 此时那个好用的 alias 就得来处理一下啦!你可以在 ~/.bashrc 内加上这行:『alias grep='grep --color=auto'』再以『 source ~/.bashrc 』来立即生效即可喔! 这样每次运行 grep 他都会自动帮你加上颜色显示啦
将/etc/passwd,将没有出现 root 的行取出来
#grep-v root /etc/passwdroot:x:0:0:root:/root:/bin/bash
operator:x:11:0:operator:/root:/sbin/nologin
将/etc/passwd,将没有出现 root 和nologin的行取出来
#grep-v root /etc/passwd|grep-v nologin
root:x:0:0:root:/root:/bin/bash
operator:x:11:0:operator:/root:/sbin/nologin
用 dmesg 列出核心信息,再以 grep 找出内含 eth 那行,要将捉到的关键字显色,且加上行号来表示:
[root@www ~]# dmesg |grep-n --color=auto'eth'247:eth0: RealTek RTL8139 at0xee846000,00:90:cc:a6:34:84, IRQ10248:eth0: Identified8139chip type'RTL-8139C'294:eth0: link up, 100Mbps, full-duplex, lpa0xC5E1305:eth0: no IPv6 routers present
# 你会发现除了 eth 会有特殊颜色来表示之外,最前面还有行号喔!
在关键字的显示方面,grep 可以使用 --color=auto 来将关键字部分使用颜色显示。 这可是个很不错的功能啊!但是如果每次使用 grep 都得要自行加上 --color=auto 又显的很麻烦~ 此时那个好用的 alias 就得来处理一下啦!你可以在 ~/.bashrc 内加上这行:『alias grep='grep --color=auto'』再以『 source ~/.bashrc 』来立即生效即可喔! 这样每次运行 grep 他都会自动帮你加上颜色显示啦
用 dmesg 列出核心信息,再以 grep 找出内含 eth 那行,在关键字所在行的前两行与后三行也一起捉出来显示
[root@www ~]# dmesg |grep-n -A3 -B2 --color=auto'eth'245-PCI: setting IRQ10as level-triggered246-ACPI: PCI Interrupt0000:00:0e.0[A] -> Link [LNKB] ...247:eth0: RealTek RTL8139 at0xee846000,00:90:cc:a6:34:84, IRQ10248:eth0: Identified8139chip type'RTL-8139C'249-input: PC Speaker as /class/input/input2250-ACPI: PCI Interrupt0000:00:01.4[B] -> Link [LNKB] ...251-hdb: ATAPI 48X DVD-ROM DVD-R-RAM CD-R/RW drive, 2048kB Cache, UDMA(66)
# 如上所示,你会发现关键字 247所在的前两行及248 后三行也都被显示出来!
# 这样可以让你将关键字前后数据捉出来进行分析啦!
根据文件内容递归查找目录
#grep‘energywise’ *? ? ? ? ? #在当前目录搜索带'energywise'行的文件
# grep-r ‘energywise’ *? ? ? ? #在当前目录及其子目录下搜索'energywise'行的文件
# grep-l -r ‘energywise’ *? ? #在当前目录及其子目录下搜索'energywise'行的文件,但是不显示匹配的行,只显示匹配的文件
这几个命令很使用,是查找文件的利器。
grep与正规表达式
?字符类
字符类的搜索:如果我想要搜寻 test 或 taste 这两个单字时,可以发现到,其实她们有共通的 't?st' 存在~这个时候,我可以这样来搜寻:
[root@www ~]#grep-n't[ae]st' regular_express.txt8:I can't finish the test.9:Oh! The soup taste good.
其实 [] 里面不论有几个字节,他都谨代表某『一个』字节, 所以,上面的例子说明了,我需要的字串是『tast』或『test』两个字串而已!
字符类的反向选择 [^] :如果想要搜索到有 oo 的行,但不想要 oo 前面有 g,如下
[root@www ~]#grep-n'[^g]oo' regular_express.txt2:apple is my favorite food.3:Football game is not use feet only.18:google is the best toolsfor search keyword.19:goooooogle yes!
第 2,3 行没有疑问,因为 foo 与 Foo 均可被接受!
但是第 18 行明明有 google 的 goo 啊~别忘记了,因为该行后面出现了 tool 的 too 啊!所以该行也被列出来~ 也就是说, 18 行里面虽然出现了我们所不要的项目 (goo) 但是由於有需要的项目 (too) , 因此,是符合字串搜寻的喔!
至於第 19 行,同样的,因为 goooooogle 里面的 oo 前面可能是 o ,例如: go(ooo)oogle ,所以,这一行也是符合需求的!
字符类的连续:再来,假设我 oo 前面不想要有小写字节,所以,我可以这样写 [^abcd....z]oo , 但是这样似乎不怎么方便,由於小写字节的 ASCII 上编码的顺序是连续的, 因此,我们可以将之简化为底下这样:
[root@www ~]#grep-n'[^a-z]oo' regular_express.txt3:Football game is not use feet only.
也就是说,当我们在一组集合字节中,如果该字节组是连续的,例如大写英文/小写英文/数字等等, 就可以使用[a-z],[A-Z],[0-9]等方式来书写,那么如果我们的要求字串是数字与英文呢? 呵呵!就将他全部写在一起,变成:[a-zA-Z0-9]。
我们要取得有数字的那一行,就这样:
[root@www ~]#grep-n'[0-9]' regular_express.txt5:However, this dress is about $3183 dollars.15:You are the best is mean you are the no.1.
行首与行尾字节 ^ $
行首字符:如果我想要让 the 只在行首列出呢? 这个时候就得要使用定位字节了!我们可以这样做:
[root@www ~]#grep-n'^the' regular_express.txt12:the symbol'*'is represented as start.
此时,就只剩下第 12 行,因为只有第 12 行的行首是 the 开头啊~此外, 如果我想要开头是小写字节的那一行就列出呢?可以这样:
[root@www ~]#grep-n'^[a-z]' regular_express.txt2:apple is my favorite food.4:this dress doesn't fit me.10:motorcycle is cheap than car.12:the symbol'*' is represented as start.18:google is the best toolsfor search keyword.19:goooooogle yes!20:go! go! Let's go.
如果我不想要开头是英文字母,则可以是这样:
[root@www ~]#grep-n'^[^a-zA-Z]' regular_express.txt1:"Open Source" is a good mechanism to develop programs.21:# I am VBird
^ 符号,在字符类符号(括号[])之内与之外是不同的! 在 [] 内代表『反向选择』,在 [] 之外则代表定位在行首的意义!
那如果我想要找出来,行尾结束为小数点 (.) 的那一行:
[root@www ~]#grep-n'\.$' regular_express.txt1:"Open Source" is a good mechanism to develop programs.2:apple is my favorite food.3:Football game is not use feet only.4:this dress doesn't fit me.10:motorcycle is cheap than car.11:This window isclear.12:the symbol'*' is represented as start.15:You are the best is mean you are the no.1.16:The world is the same with"glad".17:I like dog.18:google is the best toolsfor search keyword.20:go! go! Let's go.
特别注意到,因为小数点具有其他意义(底下会介绍),所以必须要使用转义字符(\)来加以解除其特殊意义!
找出空白行:
[root@www ~]#grep-n'^$' regular_express.txt22:
因为只有行首跟行尾 (^$),所以,这样就可以找出空白行啦!
任意一个字节 . 与重复字节 *
这两个符号在正则表达式的意义如下:
. (小数点):代表『一定有一个任意字节』的意思;* (星号):代表『重复前一个字符,0到无穷多次』的意思,为组合形态
假设我需要找出 g??d 的字串,亦即共有四个字节, 起头是 g 而结束是 d ,我可以这样做:
[root@www ~]#grep-n'g..d' regular_express.txt1:"Open Source" is a good mechanism to develop programs.9:Oh! The soup taste good.16:The world is the same with"glad".
因为强调 g 与 d 之间一定要存在两个字节,因此,第 13 行的 god 与第 14 行的 gd 就不会被列出来啦!
如果我想要列出有 oo, ooo, oooo 等等的数据, 也就是说,至少要有两个(含) o 以上,该如何是好?
因为 * 代表的是『重复 0 个或多个前面的 RE 字符』的意义, 因此,『o*』代表的是:『拥有空字节或一个 o 以上的字节』,因此,『 grep -n 'o*' regular_express.txt 』将会把所有的数据都列印出来终端上!
当我们需要『至少两个 o 以上的字串』时,就需要 ooo* ,亦即是:
[root@www ~]#grep-n'ooo*' regular_express.txt1:"Open Source" is a good mechanism to develop programs.2:apple is my favorite food.3:Football game is not use feet only.9:Oh! The soup taste good.18:google is the best toolsfor search keyword.19:goooooogle yes!
如果我想要字串开头与结尾都是 g,但是两个 g 之间仅能存在至少一个 o ,亦即是 gog, goog, gooog.... 等等,那该如何?
[root@www ~]#grep-n'goo*g' regular_express.txt18:google is the best toolsfor search keyword.19:goooooogle yes!
如果我想要找出 g 开头与 g 结尾的行,当中的字符可有可无
[root@www ~]#grep-n'g.*g' regular_express.txt1:"Open Source" is a good mechanism to develop programs.14:The gd software is a libraryfor drafting programs.18:google is the best toolsfor search keyword.19:goooooogle yes!20:go! go! Let's go.
因为是代表 g 开头与 g 结尾,中间任意字节均可接受,所以,第 1, 14, 20 行是可接受的喔! 这个 .* 的 RE 表示任意字符是很常见的.
如果我想要找出『任意数字』的行?因为仅有数字,所以就成为:
[root@www ~]#grep-n'[0-9][0-9]*' regular_express.txt5:However, this dress is about $3183 dollars.15:You are the best is mean you are the no.1.
限定连续 RE 字符范围 {}
我们可以利用 . 与 RE 字符及 * 来配置 0 个到无限多个重复字节, 那如果我想要限制一个范围区间内的重复字节数呢?
举例来说,我想要找出两个到五个 o 的连续字串,该如何作?这时候就得要使用到限定范围的字符 {} 了。 但因为 { 与 } 的符号在 shell 是有特殊意义的,因此, 我们必须要使用字符 ? \ 来让他失去特殊意义才行。 至於 {} 的语法是这样的,假设我要找到两个 o 的字串,可以是:
[root@www ~]#grep-n'o\{2\}' regular_express.txt1:"Open Source" is a good mechanism to develop programs.2:apple is my favorite food.3:Football game is not use feet only.9:Oh! The soup taste good.18:google is the best toolsfor search ke19:goooooogle yes!
假设我们要找出 g 后面接 2 到 5 个 o ,然后再接一个 g 的字串,他会是这样:
[root@www ~]#grep-n'go\{2,5\}g' regular_express.txt18:google is the best toolsforsearch keyword.
如果我想要的是 2 个 o 以上的 goooo....g 呢?除了可以是 gooo*g ,也可以是:
[root@www ~]#grep-n'go\{2,\}g' regular_express.txt18:google is the best toolsfor search keyword.19:goooooogle yes!
扩展grep(grep -E 或者 egrep):
使用扩展grep的主要好处是增加了额外的正则表达式元字符集。
打印所有包含NW或EA的行。如果不是使用egrep,而是grep,将不会有结果查出。
#egrep'NW|EA' testfile? ?
? ? northwest? ? ? NW? ? ? Charles Main? ? ? ? 3.0.98334? ? eastern? ? ? ? EA? ? ? TB Savage? ? ? ? ? 4.4.84520
对于标准grep,如果在扩展元字符前面加\,grep会自动启用扩展选项-E。
#grep'NW\|EA' testfile
northwest? ? ? NW? ? ? Charles Main? ? ? ? 3.0.98334eastern? ? ? ? EA? ? ? TB Savage? ? ? ? ? 4.4.84520
搜索所有包含一个或多个3的行。
#egrep'3+' testfile
# grep-E'3+' testfile
# grep'3\+' testfile? ? ? ?
#这3条命令将会
northwest? ? ? NW? ? ? Charles Main? ? ? ? ? 3.0.98334western? ? ? ? WE? ? ? Sharon Gray? ? ? ? ? 5.3.97523northeast? ? ? NE? ? ? AM Main Jr.? ? ? ? ? 5.1.94313central? ? ? ? CT? ? ? Ann Stephens? ? ? ? ? 5.7.94513
搜索所有包含0个或1个小数点字符的行。
#egrep'2\.?[0-9]' testfile
# grep-E'2\.?[0-9]' testfile
# grep'2\.\?[0-9]' testfile
#首先含有2字符,其后紧跟着0个或1个点,后面再是0和9之间的数字。
western? ? ? ? WE? ? ? Sharon Gray? ? ? ? ? 5.3.97523southwest? ? ? SW? ? ? Lewis Dalsass? ? ? ? 2.7.8218eastern? ? ? ? EA? ? ? TB Savage? ? ? ? ? ? 4.4.84520
搜索一个或者多个连续的no的行。
#egrep'(no)+' testfile
# grep-E'(no)+' testfile
# grep'\(no\)\+' testfile? #3个命令返回相同结果,
northwest? ? ? NW? ? ? Charles Main? ? ? ? 3.0.98334northeast? ? ? NE? ? ? AM Main Jr.? ? ? ? 5.1.94313north? ? ? ? ? NO? ? ? Margot Weber? ? ? ? 4.5.8959
不使用正则表达式
fgrep 查询速度比grep命令快,但是不够灵活:它只能找固定的文本,而不是规则表达式。
如果你想在一个文件或者输出中找到包含星号字符的行
fgrep? '*' /etc/profile
for i in /etc/profile.d/*.sh ; do
或
grep -F '*' /etc/profile
for i in /etc/profile.d/*.sh ; do
规则文件>
规则文件>
范本样式>
范本样式>
动作>
动作>
显示行数>
显示行数>
显示行数>
显示行数>
显示行数>
显示行数>
显示行数>
Linux 中 Grep 命令的常见示例,很全面
Grep 是一个强大的 UNIX 命令,可让您在文件内容中搜索各种参数。当您进行故障排除或调试时,它特别有用。
grep 命令有大量的选项和用例。您可能永远不需要或使用所有这些。但是,您最终会在大多数情况下使用少数几个 grep 命令。
本文列出了最常见的 grep 命令和快速示例:
命令示例:
描述 :不区分大小写的搜索
命令示例:
描述 :匹配后显示 n 行
命令示例:
描述 :在匹配前显示 n 行
命令示例:
描述 :在匹配前后显示 n 行
命令示例:
描述 :显示不匹配的行
命令示例:
描述 :计算匹配行数
命令示例:
描述 :仅显示文件名
命令示例:
描述 :匹配确切的单词
命令示例:
描述 :匹配正则表达式模式
命令示例:
描述 :搜索二进制文件
命令示例:
描述 :递归搜索目录
您可能已经知道要在文件中搜索特定文本或模式,您必须像这样使用 grep:
让我们看看 grep 命令的几个常见用例。
默认情况下,使用 grep 进行的搜索区分大小写,-i您可以使用以下选项忽略大小写匹配:
这样,grep 将返回与 和 匹配的Holmes行holmes。
默认情况下,您只会看到匹配的行,但是,当您对某些问题进行故障排除时,在匹配行之前和/或之后查看几行会有所帮助。
您可以使用-A来显示匹配行之后的行。
下面的命令将显示匹配的行以及匹配后的 5 行。
同样,您可以使用该-B选项在匹配行之前显示行。
下面的命令将在匹配行之前显示 5 行以及匹配行。
我最喜欢的是该选项-C,因为它显示了匹配行之前和之后的行。
下面的命令将显示匹配行之前的 5 行、匹配行和 matchine 行之后的 5 行。
您可以使用 grep 显示与给定模式不匹配的所有行。此“反转匹配”与以下-v选项一起使用:
您可以组合-i和-v选项。
-c您可以使用选项获取与模式匹配的行数,而不是显示匹配的行。这是小写的c。
您可以结合-cand-v选项来获取与给定模式不匹配的行数。您当然可以使用不区分大小写的选项-i。
要显示匹配行的行号,您可以使用该-n选项。
您可以对反向搜索执行相同的操作。
您可以提供多个文件供 grep 搜索。
这可能有效,但更实际的示例是搜索特定类型的文件。例如,如果您只想在 shell 脚本中查找字符串(以 .sh 结尾的文件),您可以使用:
您可以使用 grep option执行递归搜索-r。它将在当前目录及其子目录中的所有文件中搜索给定的模式。
默认情况下,grep 显示匹配的行。如果您对多个文件运行了搜索,并且只想查看哪些文件包含该字符串,则可以使用该-l选项。
假设您想查看哪些 Markdown 文件包含“手册”一词,您可以使用:
默认情况下,grep 将显示包含给定字符串的所有行。你可能并不总是想要那个。如果您正在搜索单词“done”,它还会显示包含“doner”或“abandoned”字样的行。
要使 grep 仅搜索完整的单词,您可以使用以下选项-w:
这样,如果您搜索单词“done”,它只会显示包含“done”的行,而不是“doner”或“abandoned”。
您可以使用正则表达式模式为您的搜索提供超级动力。有一个允许使用正则表达式模式的专用选项-e和-E一个允许使用扩展正则表达式模式的选项。
您可以在同一个 grep 搜索中搜索多个模式。如果要查看包含一种模式或另一种模式的行,可以使用 OR 运算符|。
您可以将多个模式与 OR 运算符一起使用。
AND 运算符没有特定选项。为此,您可以多次使用 grep 和管道重定向。
Grep 默认忽略二进制文件。-a您可以使用该选项使其在二进制文件中搜索,就好像它是文本文件一样。
ps-ef grepshell这个指令又是在干嘛?
用于查看当前正在运行的进程。ps命令将某个进程显示出来grep命令是查找中间的|是管道命令,是指ps命令与grep同时执行。用于shell指令输出结果查找时,本质是长字符串中字串的查找和匹配,且需去除grep查找串时,引入的字段。
grep简析
grep (global search regular expression(RE) and print out the line,全面搜索正则表达式并把行打印出来)是一种强大的文本搜索工具,它能使用正则表达式搜索文本,并把匹配的行打印出来。
Unix的grep家族包括grep、egrep和fgrep。egrep和fgrep的命令只跟grep有很小不同。egrep是grep的扩展,支持更多的re元字符, fgrep就是fixed grep或fast grep,它们把所有的字母都看作单词,也就是说,正则表达式中的元字符表示回其自身的字面意义,不再特殊。linux使用GNU版本的grep。它功能更强,可以通过-G、-E、-F命令行选项来使用egrep和fgrep的功能。
grep的工作方式是这样的,它在一个或多个文件中搜索字符串模板。如果模板包括空格,则必须被引用,模板后的所有字符串被看作文件名。搜索的结果被送到标准输出,不影响原文件内容。grep可用于shell脚本,因为grep通过返回一个状态值来说明搜索的状态,如果模板搜索成功,则返回0,如果搜索不成功,则返回1,如果搜索的文件不存在,则返回2。我们利用这些返回值就可进行一些自动化的文本处理工作。
使用实例:
.grep 搜索字符串
命令格式:
grep string filename
寻找字串的方法很多,比如说我想找所有以M开头的行.此时必须引进pattern的观
念.以下是一些简单的例子,以及说明:
1、查找指定进程
命令:ps -ef|grep java
2、查找指定进程个数
命令:ps -ef|grep -c java
或ps -ef|grep java -c
3、从文件中读取关键词进行搜索,默认是显示的是行
例:通过管道过滤ls -l输出的内容,只显示以a开头的行。
例:显示所有以d开头的文件中包含test的行。
$ grep \'test\' d*
例:输出以hat结尾的行内容
$ cat test.txt |grep hat$
例:显示在aa,bb,cc文件中匹配test的行。
$ grep \'test\' aa bb cc
例:显示所有包含每个字符串至少有5个连续小写字符的字符串的行。
在一组集合字节中,如果该字节组是连续的,例如大写英文/小写英文/数字等等,就可以使用[a-z],[A-Z],[0-9]等方式来书写,那么如果我们的要求字串是数字与英文呢?就将他全部写在一起,变成:[a-zA-Z0-9]。
例:显示包含ed或者at字符的内容行
cat test.txt |grep -E "ed|at"
例:如果west被匹配,则es就被存储到内存中,并标记为1,然后搜索任意个字符(. ),这些字符后面紧跟着另外一个es(1),找到就显示该行。如果用egrep或grep -E,就不用""号进行转义,直接写成'w(es)t. 1'就可以了。
$ grep \'w(es)t.*1\' aa
例:显示当前目录下面以.txt 结尾的文件中的所有包含每个字符串至少有7个连续小写字符的字符串的行
grep '[a-z]\{7\}' *.txt
例:查询IP地址、邮箱、手机号
这里用到了-o和-P命令
man grep查看
也就是说-o,只显示匹配行中匹配正则表达式的那部分,-P,作为Perl正则匹配
192.168.0.1
abc@163.com
匹配ABC类IP地址即 1.0.0.1---223.255.255.254
grep -oP "([0-9]{1,3}\.){3}[0-9]{1,3}" file.txt
grep -E --color "\<([1-9]|[1-9][0-9]|1[0-9][0-9]|2[0-1][0-9]|22[0-3])\.([0-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-5])\.([0-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-5])\.([1-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-4])\>" file.txt
邮箱是任意长度数字字母@任意长度数字字母
命令(邮箱): grep -oP "[a-zA-Z0-9_-]+@[a-zA-Z0-9_-]+(\.[a-zA-Z0-9_-]+)+" file.txt
手机号码是1[3|4|5|8]后面接9位数字的
命令(手机号): grep -E "\<1[3|4|5|8][0-9]{9}\>" file.txt
例:任意一个字节 . 与重复字节 *
. (小数点):代表『一定有一个任意字节』的意思;
例:限定连续 RE 字符范围 {}
利用 . 与 RE 字符及 * 来配置 0 个到无限多个重复字节
打算找出两个到五个 o 的连续字串,该如何作?这时候就得要使用到限定范围的字符 {} 了。 但因为 { 与 } 的符号在 shell 是有特殊意义的,因此, 我们必须要使用字符 \ 来让他失去特殊意义才行。
grep 用法
我们可以使用grep命令在文本中查找指定的字符串,可以把grep理解成字符查找工具。
默认情况下,grep是区分大小写的,使用 -i 选项搜索时忽略大小写。
如果我们想确定zabbix用户在passwd文件的第一行,使用-n选项,显示文本所在行号。
如果想知道文件中有多少行包含了指定字符串,使用-c选项可只统计符号条件的行,而不打印出来。
如果我们只想看到被匹配的关键字,而不是把关键字所在的整行都打印出来,使用-o选项,但是需要注意,-o选项会把每个匹配到的关键字都单独显示在一行中进行输出。
显示关键字附件的信息 -A after -B before -C content
如果我们需求精确匹配,就是搜索的关键字作为一个独立的单词存在,而不是包含在某个字符串中,使用-w选项,这时候nologin就没有被匹配到。
如果想取反,就是查找不包含指定字符串的行,使用-v选项。
如果想同时匹配多个目标,使用-e选项,他们之间是“或”的关系。
如果只是想利用grep判断文本中是否包含某个字符串,你只关心有没有匹配到,而不想输出,可以使用-q选项,开启静默模式。
掌握以上用法,基础的就够了,等学习了“正则表达式”,再回来结合一起发挥威力。
-i:在搜索的时候忽略大小写
-n:显示结果所在行号
-c:统计匹配到的行数,注意,是匹配到的总行数,不是匹配到的次数
-o:只显示符合条件的字符串,但是不整行显示,每个符合条件的字符串单独显示一行
-v:输出不带关键字的行(反向查询,反向匹配)
-w:匹配整个单词,如果是字符串中包含这个单词,则不作匹配
-Ax:在输出的时候包含结果所在行之后的指定行数,这里指之后的x行,A:after
-Bx:在输出的时候包含结果所在行之前的指定行数,这里指之前的x行,B:before
-Cx:在输出的时候包含结果所在行之前和之后的指定行数,这里指之前和之后的x行,C:context
-e:实现多个选项的匹配,逻辑or关系
-q:静默模式,不输出任何信息,当我们只关心有没有匹配到,却不关心匹配到什么内容时,我们可以使用此命令,然后,使用”echo $?”查看是否匹配到,0表示匹配到,1表示没有匹配到。
-P:表示使用兼容perl的正则引擎。
-E:使用扩展正则表达式,而不是基本正则表达式,在使用”-E”选项时,相当于使用egrep。
字符类 [ ] 括号内的仅匹配其中一个字符
如果我想要搜寻 test 或 taste 这两个单字时,可以发现到,其实她们有共通的 't?st'
字符类的反向选择 [^]
连续字符 [a-zA-Z0-9]
匹配行首 ^
结合[]时要注意^的位置
匹配行尾 $
我们来看 . 和 * 在正则中的含义
. 表示任意一个字符
星号*表示重复他前面的字符0次到无穷多次
限定范围的字符{} ,但因为 { 与 } 的符号在 shell 是有特殊意义的,因此, 我们必须要使用字符 \ 来让他失去特殊意义才行。
使用扩展grep -E
fgrep 查询速度比grep命令快,但是不够灵活:它只能找固定的文本,而不是规则表达式。
在文本中找出包含#的行
shell grep 的结果只取第一行
用head命令
grep *.*|head -n 1
或
grep *.*|head -1
可以使用head -1 命令来只取grep到的数据的第一行。
例如一个文本文档a.txt内容是:
北京是我们的首都
北京天安门坐落在中华人民共和国首都北京市的中心
我在北京天安门广场吃炸鸡
使用命令 cat a.txt |grep 北京 | head -n 1 可以只取到第一行的数据北京。
扩展资料
Linux中head命令详解:
head命令与tail命令用法相似,head命令用于查看文档的开始指定数量的字符块,默认显示文档的前 10 行,如果给定的文件不止一个,则在显示的每个文件前面加一个文件名标题。
1、grep命令用法格式
head 【参数】【文件】
2、命令选项
-c, --bytes=[-]K k,显示文档开始的前k个字节,-k,不显示文档结尾的最后 k 个字节
-n, --lines=[-]K k,显示文档开始的前k行,-k,不显示文档结尾的最后 k 行
-q, --quiet, --silent 不显示包含给定文件名的文件头
-v, --verbose 总是显示包含给定文件名的文件头
--help 显示此帮助信息并退出
--version 显示版本信息并退出
3、实例
#显示前5行
head -n 5 head.txt
#显示前5个字节
head -c 5 head.txt