1.题目
原始数据:
17/Apr/2015:09:29:24 +0800 17/Apr/2015:09:30:26 +0800 17/Apr/2015:09:31:56 +0800 18/Apr/2015:09:34:12 +0800 18/Apr/2015:09:35:23 +0800 19/Apr/2015:09:23:34 +0800 19/Apr/2015:09:22:21 +0800 20/Apr/2015:09:45:22 +0800
期望结果:
2015-04-17 09:29:24 +0800 2015-04-17 09:30:26 +0800 2015-04-17 09:31:56 +0800 2015-04-18 09:34:12 +0800 2015-04-18 09:35:23 +0800 2015-04-19 09:23:34 +0800 2015-04-19 09:22:21 +0800 2015-04-20 09:45:22 +0800
2.参考答案
思路:
2.1 答案:
sed -r ‘s#Apr#04#g;s#^([0-9]+)/([0-9]+)/([0-9]+):(.*) (.*$)#\3-\2-\1 \4 \5#g‘ system_date.txt awk -F "[/: ]" ‘{sub("Apr","04");print $3"-"$2"-"$1,$4":"$5":"$6,$7}‘ system_date.txt awk ‘BEGIN{FIELDWIDTHS="2 1 3 1 4 1 8 1 5"}{print $5"-04-"$1,$7,$NF}‘ system_date.txt
2.2 演示:
[[email protected] awkfile]# sed -r ‘s#Apr#04#g;s#^([0-9]+)/([0-9]+)/([0-9]+):(.*) (.*$)#\3-\2-\1 \4 \5#g‘ system_date.txt 2015-04-17 09:29:24 +0800 2015-04-17 09:30:26 +0800 2015-04-17 09:31:56 +0800 2015-04-18 09:34:12 +0800 2015-04-18 09:35:23 +0800 2015-04-19 09:23:34 +0800 2015-04-19 09:22:21 +0800 2015-04-20 09:45:22 +0800 [[email protected] awkfile]# awk -F "[/: ]" ‘{sub("Apr","04");print $3"-"$2"-"$1,$4":"$5":"$6,$7}‘ system_date.txt 2015-04-17 09:29:24 +0800 2015-04-17 09:30:26 +0800 2015-04-17 09:31:56 +0800 2015-04-18 09:34:12 +0800 2015-04-18 09:35:23 +0800 2015-04-19 09:23:34 +0800 2015-04-19 09:22:21 +0800 2015-04-20 09:45:22 +0800 [[email protected] awkfile]# awk ‘BEGIN{FIELDWIDTHS="2 1 3 1 4 1 8 1 5"}{print $5"-04-"$1,$7,$NF}‘ system_date.txt 2015-04-17 09:29:24 +0800 2015-04-17 09:30:26 +0800 2015-04-17 09:31:56 +0800 2015-04-18 09:34:12 +0800 2015-04-18 09:35:23 +0800 2015-04-19 09:23:34 +0800 2015-04-19 09:22:21 +0800 2015-04-20 09:45:22 +0800
2.3 详细说明:
2.3.1 方法一:sed替换
[[email protected] awkfile]# sed -r ‘s#Apr#04#g;s#^([0-9]+)/([0-9]+)/([0-9]+):(.*) (.*$)#\3-\2-\1 \4 \5#g‘ system_date.txt 2015-04-17 09:29:24 +0800 2015-04-17 09:30:26 +0800 2015-04-17 09:31:56 +0800 2015-04-18 09:34:12 +0800 2015-04-18 09:35:23 +0800 2015-04-19 09:23:34 +0800 2015-04-19 09:22:21 +0800 2015-04-20 09:45:22 +0800
这一个sed命令分为两个部分:
第一部分-把Apr替换为04
s#Apr#04#g
这一步完成后,文件的内容为17/04/2015:09:29:24 +0800
第二部分-进行匹配s#^([0-9]+)/([0-9]+)/([0-9]+):(.*) (.*$)#\3-\2-\1 \4 \5#g
图1-1 详细解析正则表达式匹到的内容
2.3.2 方法二:awk替换
[[email protected] awkfile]# awk -F "[/: ]" ‘{sub(/Apr/,"04");print $3"-"$2"-"$1,$4":"$5":"$6,$7}‘ system_date.txt 2015-04-17 09:29:24 +0800 2015-04-17 09:30:26 +0800 2015-04-17 09:31:56 +0800 2015-04-18 09:34:12 +0800 2015-04-18 09:35:23 +0800 2015-04-19 09:23:34 +0800 2015-04-19 09:22:21 +0800 2015-04-20 09:45:22 +0800
第一个里程碑-指定分隔符
awk -F "[/: ]"
表示以/(斜线)或:冒号或空格为分隔符(菜刀)
第一列($1) | 第二列($2) | 第三列($3) | 第四列($4) | 第五列($5) | 第六列($6) | 第七列($7/$NF) |
17 | Apr | 2015 | 09 | 29 | 24 | +0800 |
第二个里程碑-把Apr替换为04
sub(/Apr/,”04”)
这里使用gsub也可以。第三个里程碑-显示出来并变化位置
[[email protected] awkfile]# awk -F "[/: ]" ‘{sub(/Apr/,"04");print $1,$2,$3,$4,$5,$6,$7}‘ system_date.txt 17 04 2015 09 29 24 +0800 17 04 2015 09 30 26 +0800 17 04 2015 09 31 56 +0800 18 04 2015 09 34 12 +0800 18 04 2015 09 35 23 +0800 19 04 2015 09 23 34 +0800 19 04 2015 09 22 21 +0800 20 04 2015 09 45 22 +0800上面的结果已经很接近我们想要的了。
接下来就是变化位置,得到我们想要的结果。[[email protected] awkfile]# awk -F "[/: ]" ‘{sub(/Apr/,"04");print $3"-"$2"-"$1,$4":"$5":"$6,$7}‘ system_date.txt 2015-04-17 09:29:24 +0800 2015-04-17 09:30:26 +0800 2015-04-17 09:31:56 +0800 2015-04-18 09:34:12 +0800 2015-04-18 09:35:23 +0800 2015-04-19 09:23:34 +0800 2015-04-19 09:22:21 +0800 2015-04-20 09:45:22 +0800
2.3.2 方法三:内置变量-技巧
[[email protected] awkfile]# awk ‘BEGIN{FIELDWIDTHS="2 1 3 1 4 1 8 1 5"}{print $5"-04-"$1,$7,$NF}‘ system_date.txt 2015-04-17 09:29:24 +0800 2015-04-17 09:30:26 +0800 2015-04-17 09:31:56 +0800 2015-04-18 09:34:12 +0800 2015-04-18 09:35:23 +0800 2015-04-19 09:23:34 +0800 2015-04-19 09:22:21 +0800 2015-04-20 09:45:22 +0800
说明:
这个方法唯一要说明的就是FIELDWIDTHS这个内置变量,注意结尾有S哟。
示例1-1 举个例子
[[email protected] ~]# echo "20160121" 20160121
我想把20160121变为2016-01-21
[[email protected] ~]# echo "20160421" 20160421 [[email protected] ~]# echo "20160421"|awk ‘BEGIN{FIELDWIDTHS="4 2 2"}{print $1"-"$2"-"$3}‘ 2016-04-21
FIELDWIDTHS这个内置变量可以规定,每一列的长度,每一列有多少个字符或文本。
内置变量的定义一般放在BEGIN模式里面。
FIELDWIDTHS=”4 2 2” 这个定义表示,在一行中,分为3列,第一列4个符号,第二列2个符号,第三列2个符号。
所以第一列的内容是2016,第二列的内容是04,第三列的内容是21.最后组合一下就是我们想要的结果。
[[email protected] awkfile]# awk ‘BEGIN{FIELDWIDTHS="2 1 3 1 4 1 8 1 5"}{print $5"-04-"$1,$7,$NF}‘ system_date.txt 2015-04-17 09:29:24 +0800 2015-04-17 09:30:26 +0800 2015-04-17 09:31:56 +0800 2015-04-18 09:34:12 +0800 2015-04-18 09:35:23 +0800 2015-04-19 09:23:34 +0800 2015-04-19 09:22:21 +0800 2015-04-20 09:45:22 +0800
3.统计信息
今天是每日一题陪伴大家的第52天,期待你的进步。
对于题目和答案的任何疑问,请在博客评论区留言。
往期题目索引
http://lidao.blog.51cto.com/3388056/1914205
【老鸟分享】Linux命令行终端提示符多种实用技巧!
https://mp.weixin.qq.com/s/g-bX6WVjJubv3ShY7jqs0Q
时间: 2024-10-19 12:07:18