Linux常用文本处理小小小工具

一、常用文本处理工具命令

cat命令:

  cat [OPTION]... [FILE]...
        -A, --show-all 等价于 -vET    
        -b, --number-nonblank 对非空输出行编号
        -e 等价于 -vE
        -E, --show-ends 在每行结束处显示 $
        -n, --number 对输出的所有行编号
        -s, --squeeze-blank 不输出多行空行
        -t 与-vT等价
        -T, --show-tabs将跳字符显示为^I
        -u (被忽略)
        -v, --show-nonprinting 使用^和M-引用,除了LFD和TAB 之外
        --help 显示此帮助信息并离开

cut命令:

cut OPTION... [FILE]...
        -d DELIMITER: 指明分隔符,默认tab
        -f FILEDS: #: 第#个字段#,#[,#]:离散的多个字段,例如1,3,6
        #-#:连续的多个字段, 例如1-6 混合使用:1-3,7
        -c 按字符切割 --output-delimiter=STRING指定输出分隔符
        显示文件或STDIN数据的指定列
        cut -d: -f1 /etc/passwd cat /etc/passwd | cut -d: -f7
        cut -c2-5 /usr/share/dict/words

sort命令:

sort命令:
  sort [OPTION]... [FILE]...
  sort [OPTION]... --files0-from=F
   选项:
	-n:数值排序
	-r:逆序排序 
	-t:根据字段分隔符排序 
	-k:指定字段进行排序  
	-u:去除重复的行
	-f:不区分大小写


uniq命令:

uniq命令:报告或忽略相同的行
uniq - report or omit repeated lines
     选项:
	-d:只显示重复的行 
	-D:显示所有重复的行
	-c:只显示重复的次数


wc命令:

wc - print newline, word, and byte counts for each file
  wc [OPTION]... [FILE]...
  wc [OPTION]... --files0-from=F
    选项:
    	-l:显示行号 
    	-c:显示字符数
    	-w:显示单词个数 
    	-L:显示最长的一行包含多少个字符 
    	-m:显示字符数

tr命令:

 tr [OPTION]... SET1 [SET2]
	选项:
	-c 用字符串1中字符集的补集替换此字符集,要求字符集为ASCII。
	-d 删除字符串1中所有输入字符。
	-s 删除所有重复出现字符序列,只保留第一个;即将重复出现字符串压缩为一个字符串。

history命令:

选项:
    	-c:清空命令历史
    	-d:删除指定行 
    	-w:保存命令至历史文件中

tail命令:

选项:
    -n #:显示后N行
    -f:输出追加数据到屏幕 
   tail -n 0 -f /var/log/messages &  #只显示追加的数据  取消后天执行则 ~]#fg1即可

head命令:

选项:
    -n #:显示前n行
    -c:指定获取前#字节

more命名:

more [options] file [...]
    more file 本命令不支持想前翻页

less命令:

 less - opposite of more
     less命令支持前后翻页,及其其他匹配方式

paste命令:

paste [OPTION]... [FILE]...
    -d 分隔符:指定分隔符,默认用TAB
    -s : 所有行合成一行显示
    paste f1 f2
    paste  -s f1 f2
[email protected] ~]# paste /etc/fstab /etc/issue
	\S
#	Kernel \r on an \m
# /etc/fstab
# Created by anaconda on Tue Jul 19 14:39:24 2016
#
# Accessible filesystems, by reference, are maintained under ‘/dev/disk‘
# See man pages fstab(5), findfs(8), mount(8) and/or blkid(8) for more info
#
UUID=f83c52ce-5740-4f02-bb87-6e190360dc30 /                       xfs     defaults  0 0
UUID=c98144e4-d1b4-45b1-bb22-3112420ea487 /boot                   xfs     defaults  0 0
UUID=dbf5c483-133e-4888-bbb1-a9622d83a930 swap                    swap    defaults  0 0
#END
[[email protected] ~]#
时间: 2024-08-01 10:47:00

Linux常用文本处理小小小工具的相关文章

linux常用文本编辑器nano/vi/vim

linux下有很多文本编辑器,其中系统(不管哪个分支)都会自带nano和vi这两个最基本的编辑器.vim相当于vi的升级版.这里我们依次来讲解这几个编辑器的用法. 1.nano 直接在命令行中敲入nano filename即可打开文件或新建文件. 可以看到第一行反白介绍了nano的版本号以及被编辑的文件名称.接下来就是可编辑区域,这里由于nano.txt文件是一个新建文件,内容为空,所以编辑区域没有任何文本文字.再看最后的两行,这是nano下可以使用的一些快捷键,其对应的含义翻译如下: ctrl

几个常用文本处理小工具tr ,wc,cut,sort,uniq用法详解

几个文本处理的小工具:tr ,wc,cut,sort,uniq 1. tr命令可以对来自标准输入的字符进行替换.压缩和删除.它可以将一组字符变成另一组字符,经常用来编写优美的单行命令,作用很强大. 语法:tr 选项  SET1 SET2 -c或--complerment:取代所有不属于第一字符集的字符(就是补集): -d或--delete:删除所有属于第一字符集的字符: -s或--squeeze-repeats:把连续重复的字符以单独一个字符表示: -t或--truncate-set1:先删除第

[Linux] Linux常用文本操作命令整理

简单的总结一下常用的一些实用的Linux文本操作命令,包括wc(统计).cut(切分).sort(排序).uniq(去重).grep(查找).sed(替换.插入.删除).awk(文本分析). 1.统计命令——wc 统计文件里面有多少单词,多少行,多少字符. 1.1 wc语法 # wc [-lwm] 选项与参数: -l :仅列出行: -w :仅列出多少字(英文单字): -m :多少字符: 1.2 wc使用 #wc /etc/passwd 40 45 1719 /etc/passwd 40是行数,4

linux 常用文本操作

cat 连接文件,打印到标准输出设备上 语法介绍 cat [OPTION]... [FILE]...-A --show-all 等价于-vET-b 显示编号去除空行-n 显示编号包括空行-E 显示行结束符-s 连续的多行空白,显示一行-T 显示tab-v 使用 ^ 和 M- 符号,除了 LFD 和 TAB 之外. 使用场景: 显示行号 [[email protected] ~]# cat -n anaconda-ks.cfg 连接查看 [[email protected] ~]# cat -n

linux常用文本编缉命令

strings--读出文件中的所有字符串 sed--文本编缉 类型 命令 命令说明 字符串替换 sed -i 's/str_reg/str_rep/' filename 将文件每一行第一个str_reg字符组替换为str_rep 字符串替换 sed -i 's/str_reg/str_rep/g' filename 将文件每一行所有str_reg字符组替换为str_rep 行删除 sed -i '2d' filename 将文件当前的第二行删除 行删除 sed -i '2,5d' filenam

Linux的文本处理工具浅谈-awk sed grep

Linux的文本处理工具浅谈 awk   老大 [功能说明] 用于文本处理的语言(取行,过滤),支持正则 NR代表行数,$n取某一列,$NF最后一列 NR==20,NR==30 从20行到30行 FS竖着切,列的分隔符 RS横着切,行的分隔符 [语法格式] awk [–F] [“[分隔符]”] [’{print$1,$NF}’] [目标文件] awk 'BEGIN{FS="[列分隔符]+";RS="[行分隔符]+";print "-GEGIN-"

3个常用基于Linux系统命令行WEB网站浏览工具(w3m/Links/Lynx)

一般我们常用的浏览器肯定是基于可视化界面的图文结合的浏览界面效果,比如FireFox.Chrome.Opera等等,但是有些时候折腾和项目 的需要,在Linux环境中需要查看某个页面的文字字符,我们需要简单的浏览网页页面,但是也不需要特别复杂的视频.图片功能. 我们可以采用本地客户端的浏览然后再去校队,但是效率比较低,或者直接在Linux服务器中用wget类似的下载工具到本地,然后再去搜索字符,今 天老左有接触到适合Linux系统环境的WEB网站浏览器工具,常用的有w3m.Links.Lynx三

正则表达式及Linux三大文本处理工具

一.正则表达式 1.匹配字符的类型 [a-z]:小写字母 [A-Z]:大写字母 [a-Z]:小或大写字母 [0-9]:数字 [a-zA-Z0-9]:表示匹配一个为字母或数字的字符 . :匹配1个任意字符,空格除外 [0-f]:16进制数 abc | def:abc或def a (bc | de) f:abcf 或 adef \<:单词头 单词一般以空格或特殊字符做分隔,连续的字符串被当做单词 \>:单词尾 [^表达式]:除小写字母以外的所有字符,如此类推. 2.后跟以下符号控制匹配的数量 此类

Linux下常用的系统性能查看分析工具

Linux中,很多很全面显示系统当前运行状态,负载,I/O等信息的工具,帮助管理员实时了解系统运行动态,以及排除故障. ps命令:显示进程状态,快照方式显示. 进程分为两类:一类是用户通过终端启动的进程,一类是与终端无关的进程,多为守护进程. ps命令支持两种风格的命令:SysV风格 BDS风格.带横线的是SysV风格. ps命令选项:     a  :与终端有关的进程     x  : 与终端无关的进程     u  : 显示是哪个用户启动的       -e : 显示所有进程     -f