版权所有。如需转载,请保留作者及出处信息:http://blog.csdn.net/jmppok/article/details/38121115
在网络网络传输过程中,最关心的就是传输效率问题。而提高传输效率最有效的方法就是对传输的数据进行压缩。但压缩数据也要耗费一定的时间,是不是压缩后一定能提高效率呢?该如何选择合适的压缩算法呢?请看本文的具体分析。
1.数据传输时间
假设数据大小为D (MB)
网络带宽为 N (MBps) -------------注意这里是MBps,而不是通常说的Mbps, 1MBps = 10Mbps, 1000Mbps=100MBps.
那么数据传输时间T1 = D/N
2.压缩后的数据传输时间
假设压缩算法压缩率为 R ------------------ 即压缩后数据大小为D*R
压缩速度为 Vc MB/S
解压缩速度为 Vd MB/S
那么压缩后的数据传输时间 T2 = D/Vc + D*R/N + D/Vd = D/N * ( R + N/Vc + N/Vd)
3.分析
对比:
T1 = D/N
T2 = D/N*(R+N/Vc+N/vd)
发现:
如果R + N/Vc + N/Vd < 1,则压缩后传输要更快,否则压缩后传输反而更慢。
也就是压缩后传输能否更快是和压缩算法的 “压缩率”,“压缩/解压缩速度” 以及当前“带宽”相关
压缩率越小,压缩/解压缩越快,带宽越小,压缩后传输越能提高效率。而在带宽不变得情况下,压缩率越小,压缩/解压缩越快 越好。
而由于压缩率和压缩/解压缩速度成指数型反比(压缩率提高一点点,压缩/解压缩速度就大幅降低),所以在选用压缩算法时:
最好选择压缩/解压缩速度快的算法,而不必太关注压缩率(当然也不能完全不压缩)
4.常用压缩算法对比
这是来自网上一个常用压缩算法压缩比,压缩/解压缩速度对比图:
来源:http://blog.csdn.net/zhangskd/article/details/17009111
压缩率R为 图中的 1/Ratio。
那么带入到上面公式:
LZ4:1/2.084 + N/422 + N/1820 = 0.48 + N*0.0029 也就是说在带宽N<179MBps的情况下,采用LZ4压缩能提高传输效率。
zlib:1/3.099 + N/21 + N/300 = 0.32 + N*0.051 也就是说在带宽N<13.3Mbps的情况下,采用zlib压缩才能提高传输效率,如果带宽够高,就不要压缩了,否则会更慢
5.总结
一般客户端访问服务器,需进行压缩。 (目前客户端到服务器的带宽还是比较低的)
服务器间传输,可以不压缩,或者用LZ4压缩。 (服务器间的带宽一般是1000bps,即100MBps)
在带宽 N<3.3MBps的情况下, 使用zlib要比LZ4更快。
0-3.3MBps zlib压缩传输最快,lz4压缩传输次之,普通传输最慢
3.3 - 13.3MBps lz4压缩传输最快,zlib压缩传输次之,普通传输最慢
13.3-179MBps lz4压缩传输最快,普通传输次之,zlib压缩传输 反而更慢
大于179MBps 普通传输就可以,因为网络传输速度 远远高于压缩及解压缩速度了
是否需要对网络传输数据进行压缩?如何选择压缩算法?