awk 统计域出现的次数并且排序

[[email protected]_166_163_centos ~]# cat 1
a
a
a
b
b
b
d
e
e
s
x
d
s
s
c
s
d
x
c
s
d
s
x
f
d
d

[[email protected]_166_163_centos ~]# awk ‘{num[$1]++} END{for(k in num)print k,"----",num[k]|"sort -rk 2"}‘ 1
s ---- 6
d ---- 6
x ---- 3
b ---- 3
a ---- 3
e ---- 2
c ---- 2
f ---- 1

[[email protected]_166_163_centos ~]# awk ‘{num[$1]++} END{for(k in num)print k,"----",num[k]|"sort -k 2"}‘ 1
f ---- 1
c ---- 2
e ---- 2
a ---- 3
b ---- 3
x ---- 3
d ---- 6
s ---- 6

[[email protected]_166_163_centos ~]# awk ‘{num[$1]++} END{for(k in num)print k,"----",num[k]|"sort -k 2"}‘ 1 | head -n 3
f ---- 1
c ---- 2
e ---- 2

时间: 2024-10-09 16:27:23

awk 统计域出现的次数并且排序的相关文章

python统计数组元素出现次数以及排序

数组: a = [1, 2, 3, 4, 2, 1, 4, 1, 1] 首先转换为字典,转换为"元素-出现次数"对: b = {} for i in a: b[i] = a.count(i) 实现方式一(冒泡): c = b.items()#转换为列表 for j in range(len(b)): for i in range(len(b)-j-1): if c[i][1] < c[i+1][1]: c[i] ,c[i+1] = c[i+1],c[i] print c 实现方式

python统计apache、nginx访问日志IP访问次数并且排序(显示前20条)

前言:python统计apache.nginx访问日志IP访问次数并且排序(显示前20条).其实用awk+sort等命令可以实现,用awk数组也可以实现,这里只是用python尝试下. apache脚本: ips = {} with open("/root/mail_access_log-20180629") as fh:     for line in fh:         ip = line.split(" ")[0]         if 6 < le

统计字符出现次数并排序(hash)

统计字符出现次数并排序 class Hist(dict): def add(self, item, increment=1): """increase num""" self[item] = increment + self.get(item, 0) def counts(self, reverse=False): """return""" aux = [(self[k], k) for

shell练习(2)--awk统计ip访问量(一条命令)

对下面的1.log 文件进行统计, 要求: 统计出每个IP的访问量有多少? 提示,先awk过滤出ip,然后进行排序,统计重复数. 只用一条命令即可 awk '{STAT[$1]++};END{for(A in STAT) print STAT[A], A}' 1.log|sort -nr|head -10 1.log   的大致格式: 112.111.12.248 - [25/Sep/2013:16:08:31 +0800]formula-x.haotui.com "/seccode.php?u

awk统计

eg: 把当前系统使用率最高的前10个命令的命令名输出, 并统计命令使用的次数. awk  '{comm[$1]++}END{for(i in comm){print i,comm[i]}}' /root/.bash_history | sort -rnk 2 | head 或者 awk '{print $1}' /root/.bash_history  | sort | uniq -c |  sort -nr | head

Excel中COUNTIFS函数统计词频个数出现次数

Excel中COUNTIFS函数统计词频个数出现次数 在Excel中经常需要实现如下需求:在某一列单元格中有不同的词语,有些词语相同,有的不同(如图1所示).需要统计Excel表格中每个词语出现的个数,即相当于统计词频出现次数. 图1. Excel表格统计个数 解决方法:采用COUNTIFS函数. COUNTIFS 函数语法及格式:COUNTIFS(criteria_range1, criteria1, [criteria_range2, criteria2]…)其中,criteria_rang

报表开发技巧之根据点击次数奇偶性排序之数值型

进行排序的时,很多时候我们可能想实现根据点击的次数进行升降序排序,也就是说点击第一次点击标题升序排序,再次点击就降序,以此类推,而不是通过选择升序进行升序排列,选择降序进行降序排列. 示例工具:报表开发工具FineReport 解决思路 由扩展后排序可知,可以根据参数值的不同来决定升序还是降序,这里也可以此思路进行实现,定义一个参数,如果参数值为1的时候,就升序,参数值为0的时候,按照数据列的负数进行升序排序,即数据列降序. 注:该方法只适用于排序数据列数据类型为数字型的字段,如果数据类型为字符

Spark Streaming从Kafka中获取数据,并进行实时单词统计,统计URL出现的次数

1.创建Maven项目 创建的过程参考:http://blog.csdn.net/tototuzuoquan/article/details/74571374 2.启动Kafka A:安装kafka集群:http://blog.csdn.net/tototuzuoquan/article/details/73430874 B:创建topic等:http://blog.csdn.net/tototuzuoquan/article/details/73430874 3.编写Pom文件 <?xml v

08-在字符串中统计子串出现的次数

using System; using System.Collections.Generic; using System.Linq; using System.Text; using System.Text.RegularExpressions; namespace _05在字符串中统计子串出现的次数 { class Program { static void Main(string[] args) { int count = SubstringCount("qhwerzdfrefysasefh