Linux 文本去重 之 命令sort 与

 sort [-fbMnrtuk] [file or stdin]
选项与参数:
-f  :忽略大小写的差异,例如 A 与 a 视为编码相同;
-b  :忽略最前面的空格符部分;
-M  :以月份的名字来排序,例如 JAN, DEC 等等的排序方法;
-n  :使用『纯数字』进行排序(默认是以文字型态来排序的);
-r  :反向排序;
-u  :就是 uniq ,相同的数据中,仅出现一行代表;
-t  :分隔符,默认是用 [tab] 键来分隔;
-k  :以那个区间 (field) 来进行排序的意思

sort -u 可以去重
[[email protected] ~]# uniq [-icu]
选项与参数:
-i   :忽略大小写字符的不同;
-c  :进行计数
-u  :只显示唯一的行
 

uniq命令可以去除排序过的文件中的重复行,但是重复行必须是相邻的

所以去重还是推荐sort -u

 

原文地址:https://www.cnblogs.com/cn-coder/p/8216016.html

时间: 2024-08-03 17:50:22

Linux 文本去重 之 命令sort 与的相关文章

Linux文本处理常用命令

1.正则表达式 (1)正则表达式一般用来描述文本模式的特殊用法,由普通字符(例如字符a-z)以及特殊字符(称为元字符,如/.*.?等)组成.  (2)基本元字符集及其含义      ^ :只匹配行首.   如^a 匹配以a开头的行abc,a2e,a12,aaa,......      $ :只匹配行尾.   如^a 匹配以a结尾的行bca,12a,aaa,.......      * :匹配0个或多个此单字符. 如(a)* 匹配 空,a,aa,aaa,....      [] :只匹配[]内字符

1、Linux文本处理基础命令

Liunx文本处理基础命令是运维工程师不可绕过,必须熟悉掌握的关键命令,它们组合起来就像一扇门,是通往文本三剑客(grep,sed,awk)及shell脚本编程的必经之路. 更新至:1.Sort 2.tr 3.cut 4.uniq 5.wc 6.tee 7.paste 1.Sort:    #sort命令主要用于排序,可针对文本文件内容,以行为单位进行排序.        SYNOPSIS:sort [OPTION]... [FILE]...            常用选项:不加选项默认为以AS

[文件]Linux文本处理常用命令总结

转自:https://www.cnblogs.com/sheeva/p/6406285.html 引子 作为一个偏爱windows的程序员,以前做文本处理的时候总是喜欢在windows下用notepad++等图形化工具处理,比如有时需要把linux服务器上一个文件进行一次全局字符串替换这样简单的操作,还得把文件down到本地编辑好再传回去.这两天买了本<鸟哥的Linux私房菜>,终于静下心系统的学习了一下linux下的文本处理,感觉其实没有想象的难,如果早点学会节约下来的大量时间肯定远超过学习

Linux 文本对比 diff 命令详解(整理)

diff 命令详解 1.概述 windows系统下面就有不错的文本对比工具可以使用,例如常用的Beyond Compare,WinMerge都是图形界面的比较工具而且使用非常方便,如果你仅仅是在windows下工作,这些GUI的比较工具绝对是首选.对于在linux环境下工作的人来说,如果每次想看两个文件的区别都要将文件下载到windows环境然后用图形工具进行比较实在是太麻烦了.那么我们必须学会使用linux环境下的比较工具 diff. diff命令在最简单的情况下,比较给定的两个文件的不同.如

linux shell 去重 uniq和sort的区别

sort -u 和 uniq都能起到删除重复信息的功能,那么他们的区别究竟在哪呢?$ cat test              jasonjasonjasonfffffjason 下面分别执行三个命令 1:sort -u test sort -u testfffffjason 2: uniq test $uniq test jasonfffffjason 3: sort test|uniq $sort test |uniq fffffjason 从上面三个命令我们很容易看出他们之间的区别.un

Linux文本处理常用命令-echo

echo命令:功能:显示文字语法:echo [-neE][字符串]说明:echo会将输入的字符串送往标准输出.输出的字符串间以空白字符隔开,并在最后加上换行号.双引号只能识别变量(弱引用):单引号什么都不识别(强引用):反单引号可识别命令及变量-n 不要在最后自动换行-e 若字符串中出现以下字符,则特别加以处理,而不会把他当成一般文字输出:      \a 发出警告声      \b 退格键      \c 最后不加上换行符号      \n 换行且光标移至行首      \r 光标移至行首,但

linux文本处理三剑客命令及用法

grep:文本过滤工具 功能说明: sed :字符流编辑器 功能说明: awk : 原文地址:https://www.cnblogs.com/dongxu2019/p/11567086.html

Linux系列教程(十)——Linux文本编辑器vim

通过前面几篇博客我们终于结束了Linux常用命令的介绍,Linux常用命令主要包括以下: ①.Linux文件和目录处理命令 ②.Linux链接命令和权限管理命令 ③.Linux文件搜索命令 ④.Linux帮助和用户管理命令 ⑤.Linux压缩和解压缩命令 ⑥.Linux网络和关机重启命令 学习命令,我们不需要记住每一条命令的详细语法格式,学完之后我们只需要知道某个命令能干什么.这样我们在实际应用中,遇到需要实现某个功能,我们脑海只要能想起来适用于某个命令就行,至于详细格式我们可以通过查资料.当我

Linux学习日记--基础命令(4)--文本处理,重定向,管道

打开的文件都有一个fd: file descriptor (文件描述符) 标准输入:keyborad, 0        标准输出:monitor, 1        标准错误输出:monitor, 2 I/O重定向:改变标准位置 输出重定向:COMMAND > NEW_POS, COMMAND >> NEW_POS            >:覆盖重定向,目标文件中的原有内容会被清除:            >>: 追加重定向,新内容会追加至目标文件尾部: # set