如何进行平台优化?
1、管理层面:资源统一管理、复用,制定规范(代码规范、文档规范、SOP操作规范),业务解耦,完善监控,职责分明,问题追踪,定期会议总结,机房冗余
2、业务层面:技术解决性能问题
2.1寻找平台短板
压力测试定位系统短板:QPS、TPS、响应时延等数据,关注系统的CPU、内存、IO、网络,对比这些环节对整体性能的影响,确定性能问题是系统哪一部分造成的,然后针对性的在系统中逐个优化。
压力测试工具:JMeter、 LoadRunner 、Siege 、TCPCopy、PageSpeed、YSlow等
2.2常见优化:
基础优化:加大基础设施投入如服务器、网络带宽、cdn加速等
前端优化:合并请求次数、压缩传输文件、浏览器缓存
后端优化:分布式缓存、异步操作、集群(数据库集群及库表散列、业务集群)、读写分离、 静动态资源分离 、数据库优化、代码优化
负载均衡引入:链路负载均衡(DNS解析) 、CPU,IO负载均衡、软件负载均衡(HA)、硬件负载均衡(F5)
平台容量规划?
SLA 表
SLA等级 | 一年内宕机时间 |
90% | 36天12小时 |
99% | 87天36小时 |
99.9% | 8小时45分钟36秒 |
99.99% | 52分钟33秒 |
99.999% | 5分钟15秒 |
99.9999% | 32秒 |
如一级产品线的SLA可能是99.999%,二级产品线可能是99.99%,为保障产品线的稳定,各产品线项目制定关键绩效指标,即KPI(Key Performance Indicator)。
根据SLA标准(服务等级协议)结合性能测试方案
一级产品线跨机房热备,业务拆分,集群化,存储化,缓存
二级产品机房热备,业务拆分,集群化,存储化,缓存
三级产品,冷备
性能测试方案:据历史业务高峰or业务设想结合服务等级规则,制定容量规划方案
平台系统架构设计?
监控、报警标准化,CDN,跨机房专线,数据在线、离线分析
根据SLA标准
一级,二级产品:负载均衡,业务无状态,数据热备,数据库分库分表,可扩展数据存储
一级产品:读写分离,引入高性能物理设备(ssd,flash),引入缓存机制,动静态分离
三级产品:单点冷备
参考:
http://www.itdadao.com/articles/c15a616780p0.html
https://yq.aliyun.com/articles/66589
http://www.puaseo.com/youhua/fangan/85.html
《大型网站服务器容量规划》