就linux三剑客简单归纳: 1:awk 习题1:用 awk 中查看服务器连接状态并汇总 netstat -an|awk ‘/^tcp/{++s[$NF]}END{for(a in s)print a,s[a]}‘ ESTABLISHED 1 LISTEN 20 习题2:统计 web 日志访问流量,要求输出访问次数,请求页面或图片,每个请求的总大小, 总访问流量的大小汇总 awk ‘{a[$7]+=$10;++b[$7];total+=$10}END{for(x in a)print b[x],x,a[x]|"sort -rn";print "total size is :"total}‘ /app/log/access_log total size is :172230 21 /icons/poweredby.png 83076 14 / 70546 8 /icons/apache_pb.gif 18608 awk基本用法:awk –F [:” ”] ‘BEGIN{事件}{事件}END{事件}’ 它里面可以用到if,for,数组等类c的语法,其中数组下标除了可以是数字外还可以是字符串,这就大大增强了它的文本统计能力。在awk里变量可以不用先定义,可以直接用,初始值为0。 关于逗号的用法: Awk和sed里都可以用,用法为awk ‘/A/,/B/ {事件}END{事件}’ filename 匹配所有符合从字符A到第一个字符B的内容并后面事件处理 Sed –n ‘/A/,/B/p’ filename 匹配所有符合从字符A到第一个字符B的内容并输出到屏幕 2:sed 常用参数: -I 直接修改文档读取的内容,不在屏幕上输出 -n 当选项-n和命令p同时出现时,sed 可打印选定的内容 -r Sed 使用扩展正则 3:grep 常用参数: -I 忽略字符大小写的差别 -w 精确查找指定字符串,找到了就返回字符所在的那一行 -o 查找指定字符,仅返回查找的内容,一般加E配合,查找正则表达式 -E 选项使用扩展正则表达式 练习: 在下面文本内容里统计device{}里的key的数量,其他地方的key不算。假如filename为case.log: key is a linuxer. device: { oo key key key no sql this is log niu niu } key device: { key key no sql this is log niu niu } key key device: { key key no sql this is log niu niu } device: { key key no sql this is log niu niu } Key 个人解答方法: 1: awk ‘/^device :{/,/}/ {for(i=1;i<=NF;i++) if($i~/oldboy/) ++count;} END{print count}‘ case.log 解释:先匹配所有符合device开头且每次匹配到第一个}的内容,再在每行的每个字段进行匹配key,最后输出key的num值。 2: Sed –n ‘/device :{/,/}/p’ case.log | tr “ ” “\n”| grep –w “key”| wc -l 解释:先用sed进行匹配device里的所有含key的行,在用tr把空格换成换行,再用grep去匹配key的行(每行一个字符段),最后用wc –l统计行的数量及为key的num值。 3: Sed –n ‘/device :{/,/}/p’ case.log | awk –F “ ” ‘{for(i=0;i<=NF;i++) if($i~/key/) ++count} END{print count}’ sort 命令对 File 参数指定的文件中的行排序,并将结果写到标准输出。如果 File 参数指定多个文件,那么 sort 命令将这些文件连接起来,并当作一个文件进行排序。 常用参数: -n :使用『纯数字』进行排序(默认是以文字型态来排序的); -r :反向排序; -t :分隔符,默认是用 [tab] 键来分隔; -k :以那个区间 (field) 来进行排序的意思 sort 是默认以第一个数据来排序,而且默认是以字符串形式来排序,默认从小到大顺序。 cat /etc/passwd | sort -t ‘:‘ -k 3 第三栏来排序,小到大 uniq命令可以去除排序过的文件中的重复行,因此uniq经常和sort合用。也就是说,为了使uniq起作用,所有的重复行必须是相邻的。 常用参数: -i :忽略大小写字符的不同 -c :进行计数 -u :只显示唯一的行 -d :仅显示存在重复的行 cut命令可以从一个文本文件或者文本流中提取文本列。 常用参数: -d :后面接分隔字符。与 -f 一起使用; -f :依据 -d 的分隔字符将一段信息分割成为数段,用 -f 取出第几段的意思; echo $PATH | cut -d ‘:‘ -f 5 找出第五个路径 echo $PATH | cut -d ‘:‘ -f 1-3,5 找出第一到第三个路径 echo $PATH | cut -d ‘:‘ -f 3- 找出第三到最后一个路径 wc命令统计文件里面有多少行,多少单词,多少字符。 常用参数: -l :仅列出行; -w :仅列出多少字(英文单字); -m :多少字符;
时间: 2024-10-07 06:13:39