wc命令输出的是行数字数和字节数,字节数是byte,是用于计量存储的一种单位,常见的计量单位包括Kb,Mb,Gb,字符和字节换算还要看是什么编码,常见的有ascii码,utf-8编码和unicode编码,编码不同,换算不同。
ASCII码:一个英文字母占一个字节的空间,一个中文汉字占两个字节的空间。
UTF-8编码:一个英文字符等于一个字节,一个中文等于三个字节。
Unicode编码:一个英文等于两个字节,一个中文(含繁体)等于两个字节。
符号:英文标点占一个字节,中文标点占两个字节。
[[email protected] ~]#echo $LANG
en_US.UTF-8
#显示当前用的什么语系和编码,英文UTF-8编码,1个英文字符等于1个字节,1个中文等于3个字节,注意空格是1个字符,每一行还有1个换行符
[[email protected] ~]#cat test1
你好 cn
[[email protected] ~]#wc test1
1 2 10 test1
#test1是1行,2个字,字节数是3(中文)+3(中文)+1(空格)+2(英文)+1(换行符)=10
[[email protected] ~]#cat test2
123456nihao
123456nihao
[[email protected] ~]#wc test2
2 2 24 test2
#test2是2行,2个字,字节数是11+1(换行符)+11+1(换行符)=24
原文地址:http://blog.51cto.com/13655621/2088351
时间: 2024-10-05 10:07:13