当虚拟机资源达到峰值
今天说一下虚拟机的几种峰值以及对物理机和物理机上其他虚拟机的影响。
目前运维一个上万节点的私有云平台,说下目前常见的虚拟机峰值出现的几种现象
举例机型:4核CPU+10G内存+100G磁盘
1:内存达到峰值
(如果是物理机,到达峰值一般都直接宕机或者卡的命令都快敲不出来了,但虚拟机多少还是有外溢的,好在一般做母机的机型内存都很大,作为母机,一定不要在内存上吝啬)
2:CPU达到峰值
(一些大的编译是可以把CPU跑到很高的,一台服务器正常有两颗或者一颗CPU,最多也就二十多个核心,当其中的几个核心达到峰值,对物理机以及其他的虚拟机是有影响的,编译机达到峰值也很容易宕机,所以我们一般推荐高编译的环境使用物理机。尤其是一些低版本的系统,比如suse10 32bit,宕机频率相当高)
3:I/O达到峰值
(I/O不像内存或者CPU有固定的量和峰值,但却是影响最大的。如果说一台虚拟机的CPU跑满对同母机的其他虚拟机有影响的话,那么一台虚拟机高I/O对其他虚拟机是致命的,其他虚拟机的表现就是登陆或者输入命令都超慢,一个ls可能都要很久才能显示出来,好在这种情况还不是特别多,毕竟我们的是开发测试环境。)
4:流量达到峰值
(昨天刚遇到一次,稀奇的很,等下在下面给大家聊一下)
总结一下:同母机的虚拟机是会互相影响的,正常的开发机问题不大,用虚拟机做编译还是要多考虑一下。不适合高I/O的操作。如果你的虚拟机异常的卡顿,除了检查本机环境,母机环境也要排查一下的。
故障说明:今天一台AWS--->KVM环境的虚拟机告警,提示上联端口流量堵塞,经查,是该物理机上的另一台虚拟机刚上了一台测试系统在测试,流量彪到了800多M。
故障背景:这台物理机上有4台虚拟机,物理机的网卡就是1G的,1台到了800多M,其他机器再跑点,基本也就满了。业务测试完成后,打算用这台虚拟机做服务器,流量只会更高。
这总情况不是很好解决,推荐让业务去做负载均衡了
不好解决的原因:
1:机房服务器一把用超5类网线或者6类网线连接交换机,很少直接用光口的,6类网线的理论值也就1000M左右
2:如果服务器换万兆网卡,如果要停机,势必影响母机上的其他业务。