文本处理命令--wc、sed

一、wc

wc命令的功能为统计指定文件中的字节数、字数、行数,并将统计结果显示输出。

测试文件内容:

(my_python_env)[[email protected] ~]# cat test
hnlinux
peida.cnblogs.com
ubuntu
ubuntu linux
redhat
Redhat
linuxmint

1.1最基本的用法

(my_python_env)[[email protected] ~]# wc test
 7  8 70 test

其中7代表行数

8是单词书,一个单词被定义为由空格、制表符或者换行符分割的字符串

70是字节数

1.2-l计算行数

(my_python_env)[[email protected] ~]# wc -l test
7 test

1.3-w计算单词数

(my_python_env)[[email protected] ~]# wc -w test
8 test

1.4-c计算字节数

(my_python_env)[[email protected] ~]# wc -c test
70 test

1.5-L打印最长行的长度

(my_python_env)[[email protected] ~]# wc -L test
17 test

1.6用wc命令怎么做到只打印统计数字不打印文件名?

使用管道可以做到,这在shell脚本中特别有用

(my_python_env)[[email protected] ~]# cat test | wc -l
7

二、sed

sed 是一种在线编辑器,它一次处理一行内容。处理时,把当前处理的行存储在临时缓冲区中,称为“模式空间”(pattern space),接着用sed命令处理缓冲区中的内容,处理完成后,把缓冲区的内容送往屏幕。接着处理下一行,这样不断重复,直到文件末尾。文件内容并没有 改变,除非你使用重定向存储输出。Sed主要用来自动编辑一个或多个文件;简化对文件的反复操作;编写转换程序等。

2.1sed的使用参数

[[email protected] ~]# sed [-nefr] [动作]
选项与参数:
-n :使用安静(silent)模式。在一般 sed 的用法中,所有来自 STDIN 的数据一般都会被列出到终端上。但如果加上 -n 参数后,则只有经过sed 特殊处理的那一行(或者动作)才会被列出来。
-e :直接在命令列模式上进行 sed 的动作编辑;
-f :直接将 sed 的动作写在一个文件内, -f filename 则可以运行 filename 内的 sed 动作;
-r :sed 的动作支持的是延伸型正规表示法的语法。(默认是基础正规表示法语法)
-i :直接修改读取的文件内容,而不是输出到终端。

动作说明: [n1[,n2]]function
n1, n2 :不见得会存在,一般代表『选择进行动作的行数』,举例来说,如果我的动作是需要在 10 到 20 行之间进行的,则『 10,20[动作行为] 』

function:
a :新增, a 的后面可以接字串,而这些字串会在新的一行出现(目前的下一行)~
c :取代, c 的后面可以接字串,这些字串可以取代 n1,n2 之间的行!
d :删除,因为是删除啊,所以 d 后面通常不接任何咚咚;
i :插入, i 的后面可以接字串,而这些字串会在新的一行出现(目前的上一行);
p :列印,亦即将某个选择的数据印出。通常 p 会与参数 sed -n 一起运行~
s :取代,可以直接进行取代的工作哩!通常这个 s 的动作可以搭配正规表示法!例如 1,20s/old/new/g 就是啦!

2.2d删除

将/etc/passwd的内容列出并且列出行号,同时,将2~5行删除

(my_python_env)[[email protected] ~]# nl /etc/passwd | sed ‘2,5d‘
     1    root:x:0:0:root:/root:/bin/bash
     6    sync:x:5:0:sync:/sbin:/bin/sync
     7    shutdown:x:6:0:shutdown:/sbin:/sbin/shutdown
     8    halt:x:7:0:halt:/sbin:/sbin/halt
     9    mail:x:8:12:mail:/var/spool/mail:/sbin/nologin

注意sed后面接的动作需要使用单引号

只删除第2行

(my_python_env)[[email protected] ~]# nl /etc/passwd | sed ‘2d‘
     1    root:x:0:0:root:/root:/bin/bash
     3    daemon:x:2:2:daemon:/sbin:/sbin/nologin
     4    adm:x:3:4:adm:/var/adm:/sbin/nologin
     5    lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin

删除第3行到最后一行

(my_python_env)[[email protected] ~]# nl /etc/passwd | sed ‘3,$d‘
     1    root:x:0:0:root:/root:/bin/bash
     2    bin:x:1:1:bin:/bin:/sbin/nologin

2.3a和i选项的增加

在/etc/passwd第三行增加一行

(my_python_env)[[email protected] ~]# nl /etc/passwd | sed ‘2a this is a extend row‘
     1    root:x:0:0:root:/root:/bin/bash
     2    bin:x:1:1:bin:/bin:/sbin/nologin
this is a extend row
     3    daemon:x:2:2:daemon:/sbin:/sbin/nologin
     4    adm:x:3:4:adm:/var/adm:/sbin/nologin

上面的需求还可以使用-i选项来实现

(my_python_env)[[email protected] ~]# nl /etc/passwd | sed ‘3i this is a extend row‘
     1    root:x:0:0:root:/root:/bin/bash
     2    bin:x:1:1:bin:/bin:/sbin/nologin
this is a extend row
     3    daemon:x:2:2:daemon:/sbin:/sbin/nologin
     4    adm:x:3:4:adm:/var/adm:/sbin/nologin

2.4-c选项的替换

将2~5行的内容替换掉

(my_python_env)[[email protected] ~]# nl /etc/passwd | sed ‘2,5c 2-5 rows‘
     1    root:x:0:0:root:/root:/bin/bash
2-5 rows
     6    sync:x:5:0:sync:/sbin:/bin/sync
     7    shutdown:x:6:0:shutdown:/sbin:/sbin/shutdown

2.5-n和-p

仅列出文件的5-7行

(my_python_env)[[email protected] ~]# nl /etc/passwd | sed -n ‘5,7p‘
     5    lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin
     6    sync:x:5:0:sync:/sbin:/bin/sync
     7    shutdown:x:6:0:shutdown:/sbin:/sbin/shutdown

2.6数据搜寻

搜索有root关键字的行

(my_python_env)[[email protected] ~]# nl /etc/passwd | sed -n ‘/root/p‘
     1    root:x:0:0:root:/root:/bin/bash
    11    operator:x:11:0:operator:/root:/sbin/nologin

搜索有root关键字的行,并删除

(my_python_env)[[email protected] ~]# nl /etc/passwd | sed  ‘/root/d‘
     2    bin:x:1:1:bin:/bin:/sbin/nologin
     3    daemon:x:2:2:daemon:/sbin:/sbin/nologin
     4    adm:x:3:4:adm:/var/adm:/sbin/nologin
     5    lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin

数据搜寻+执行命令

搜索/etc/passwd,找到root对应的行,执行后面花括号中的一组命令,每个命令之间用分号分隔,这里把bash替换为blueshell,再输出这行:

(my_python_env)[[email protected] ~]# nl /etc/passwd | sed -n ‘/root/{s/bash/blueshell/;p}‘
     1    root:x:0:0:root:/root:/bin/blueshell
    11    operator:x:11:0:operator:/root:/sbin/nologin

如果只替换/etc/passwd的第一个bash关键字为blueshell,就退出

(my_python_env)[[email protected] ~]# nl /etc/passwd | sed -n ‘/root/{s/bash/blueshell/;p;q}‘
     1    root:x:0:0:root:/root:/bin/blueshell

最后的q是退出

2.7数据搜寻与替换

除了整行的处理模式之外, sed 还可以用行为单位进行部分数据的搜寻并取代。基本上 sed 的搜寻与替代的与 vi 相当的类似!他有点像这样:

sed ‘s/要被取代的字串/新的字串/g‘

(my_python_env)[[email protected] ~]# /sbin/ifconfig eth0 | grep ‘inet addr‘ | sed ‘s/^.*addr://g‘
192.168.223.129  Bcast:192.168.223.255  Mask:255.255.255.0

接下来则是删除后续的部分,亦即: 192.168.1.100 Bcast:192.168.1.255 Mask:255.255.255.0

(my_python_env)[[email protected] ~]#  /sbin/ifconfig eth0 | grep ‘inet addr‘ | sed ‘s/^.*addr://g‘ | sed ‘s/Bcast.*$//g‘
192.168.223.129 

2.8多点编辑

一条sed命令,删除/etc/passwd第三行到末尾的数据,并把bash替换为blueshell

(my_python_env)[[email protected] ~]# nl /etc/passwd | sed -e ‘3,$d‘ -e ‘s/bash/blueshell/‘
     1    root:x:0:0:root:/root:/bin/blueshell
     2    bin:x:1:1:bin:/bin:/sbin/nologin

-e表示多点编辑,第一个编辑命令删除/etc/passwd第三行到末尾的数据,第二条命令搜索bash替换为blueshell。

时间: 2024-11-08 18:13:45

文本处理命令--wc、sed的相关文章

Linux 文本查看命令之sed

Stream Editor 流编辑器 做行处理的 默认不直接编辑原文件,在内存中进行处理(但是会整篇处理),临时存放的空间叫做pattern space(模式空间).如果可以被关键字匹配,然后就进行编辑(编辑完成后,可以将新的内容放入hold space,保持空间),如果没有被关键字匹配就默认输出到标准输出. -n选项不输出模式空间中的内容至屏幕,默认情况下,不论模式空间的内容是否匹配关键字都会输出至屏幕. -e script 默认只能一次处理一个脚本,-e 之后可以跟多个脚本,一个-e对应一个

文本统计命令——wc

wc的作用:显示每一个文件的行数(line).单词数(word)和字节数(byte) 选项: -l:显示行数 -w:显示单词数 -c:显示字节数 示例: [[email protected] ~]# wc /etc/issue  3  9 47 /etc/issue [[email protected] ~]# [[email protected] ~]# wc -l /etc/issue 3 /etc/issue [[email protected] ~]# wc -w /etc/issue

linux学习之路及文本查看和文本处理命令

这一篇主要介绍几个常用的文本查看命令和文本处理命令. 首先介绍文本查看命令 cat:用于连接文件并显示 说明:当只有一个文件时,则用于查看文件内容:当有多个文件时,cat命令会将这些文件连接起来,在一起显示出来 语法格式:cat [option] FILE... -n:显示内容的时候把行号显示出来 -E:显示每一行的结束符$符(默认不显示) tac:也是用于显示文件内容,只不过他是将文件的内容倒过来显示,与cat相反 -n:显示行号 -E:显示每一行结尾的结束符$ 分屏操作命令 more与les

文本处理命令- cat more less cut wc sort uniq

文本处理命令 cat more less cut wc sort uniq 1.cat  cat主要功能:1.一次显示整个文件. cat filename2.从键盘创建一个文件. cat > filename   (只能创建新文件,不能编辑已有文件). 1 [[email protected] ~]$ cat > test.txt 2 this is a test for cat command.^[[D 3 a 4 b 5 cc 6 de 其中^[[D是向左的箭头,本想回退一格编辑,但很可惜

Linux基础之文本处理命令(wc,cut,sort,uniq,diff,patch)

我相信大家在使用Linux过程中总会遇到想要提取某些自己需要的信息的情况,比如如下这四种情况: 1.找出ifconfig命令结果中eno16777728的IPv4地址 2.查出分区空间使用率的最大百分比值 3.查出/tmp的权限,以数字方式显示 这个时候,我们使用命令当然也可以查看,不过还需要自己通过眼睛去过滤不需要的信息,多费劲.如何让自己更轻松的看到自己想看到自己想看的信息呢?今天的文本处理命令能满足我们的简单需求. wc 此wc非彼WC,在这里wc是word count的简写 wc - p

文本处理命令:cut,sort,wc,uniq

文本处理命令:  cut,sort,wc,uniq   cut 选取一段信息中的某一段,处理的信息以"行"为单位. 语法:cut  OPTION... [FILE]... 参数: –d '分割符' –f #    按字符分割,显示第#段 #,#,#: 1,3,5 显示第1 ,3,5段信息 #-#:2-4 显示第2到第四段信息 –c #   以字符的单位取出固定字符区间     多用于排列整齐的信息处理 #-  显示第#个字符之后的值 #-# 显示选定区间的值 示例 [email pro

文本处理三剑客之 Sed ——一般编辑命令

sed简介 sed (stream editor for filtering and transforming text) 是Linux上的文本处理三剑客之一,另外两个是grep和awk. sed又称行编辑器,每次读取并处理一行文本. 工作原理 1.sed命令开始执行后 2.先从文本中读取第一行,放在模式空间 (pattern space)中 3.判断这行文本是否符合指定模式,符合则进行编辑,然后把结果输出到标准输出. 4.不符合的话默认也会输出到标准输出.除非特别指定不输出不符合的结果行. 5

文本处理三剑客之sed

文本处理三剑客之sed sed概述 sed使用示例 sed的高级应用 sed概述 sed, 作为文本三剑客之一,其定位就是一个编辑器, 而且sed是一个流式编辑器(stream editor),其主要功能是过滤和转换文本. sed - stream editor for filtering and transforming text 作为一个强大的文本处理功能,sed 自然能够配合正则表达式,另外,所谓流编辑器,sed 是逐行地读取文本,在文本行中应用指定的命令,且默认输出到stdout; se

Linux文本处理命令笔记汇总

目录管理: ls.cd.pwd.mkdir.rmdir/tree 文件管理 touch.stat.file.rm.mv.nano 日期时间: date.clock.hwclock.ca 查看文本: cat.tac.more.less.less.head.tail cat: 连接并显示 -n -E 分屏显示: more: 向前翻 less: head: 查看前n行 tail: 查看后n行 n默认是10行 tail -f : 查看文件尾部,不退出,等待显示后续追加至此文件的新内容: 文本处理: cu