web数据存储

数据的存储必然是任何网站必须经历的事，我们可以将数据存放在不同地方，数据库、文件、内存、程序本身、cookie，session中都可以，但是只要需要持久化保留的数据，那么最终肯定还是落在磁盘之上的，我们的磁盘可以格式化成各种类型的文件系统，也可以由应用程序直接调用裸盘

一.存储类型

块存储，顾名思义，就是一个单纯的块设备，上面不包含文件系统，一般我们新买的磁盘挂载到服务器上，叫/dev/sdb这种就是一个块存储，比如iscsi，共享过来你发现他直接挂载挂不了，提示要先格式化，因为它是一个裸设备，你可以将他格式化成任意的文件系统来挂载使用，就是送给你一块硬盘的意思

文件存储就是格式化了块设备，现在我们一般使用xfs格式了，以前是ext4，，比如最常用的nfs，它的体现是共享过来我们可以直接挂载卸载，但是上面的文件系统是共享者那面格好的，你不能更改，就是送给你一个目录的意思

对象存储大多就是分布式的了，它是为了解决块存储不容易共享文件存储不够快而出现的，如果对象存储提供了fuse，那么对象存储也可以方便的挂载使用，这也是glusterfs的优势，否则的话就是根据元数据去访问对应数据的，ceph遵循restfulapi 模式，你需要访问对应的uri

二.存储连接方式

DAS存储（直连式存储Direct-Attached Storage），直接连接在服务器上的存储，第一反应就是磁盘喽

NAS存储（网络接入存储Network-Attached Storage），通过网络来创建的存储，sab，nfs就是

SAN存储（存储区域网络Storage Area Network），通过专门的光纤连接给服务器使用的存储，多于大型应用或数据库系统，缺点是成本高，很高….

所以随着业务的不断增长，使用分布式文件系统是我们无法逃避的过称

分布式文件系统现在有很多了，推荐大家学习使用ceph跟glusterfs，glusterfs可以用于生产，ceph是现在一个叼叼的分布式文件系统，他集成了块存储，文件存储，对象存储三种方式，与openstack可以很好的结合，底层是一个对象存储库，本质意义上还是一个对象存储

三.数据库相关

提到数据库，大家的第一反应都是，性能瓶颈，慢慢慢，不敢出事，出事了就可以辞职了，要是有DBA是多么美好的事情

数据库内存储数据的架构有如下几种：

一台mysql拯救世界。这种做法一般就在于企业最初期、测试环境使用，因为出事了也无伤大雅
一主一从，高可用。读写都是主库，然后同步到从库，主库出问题了手动切换到从库，好处是最简单，也保证了数据的备份，现在使用的人很多；缺点是你需要手动切换，中间还是会有延迟，而且还需要人为参与的延迟，要是他跑去上厕所或者手机关机那真是bi了poi了，再就是压力都在主库，读写同步都需要
一主一从，读写分离。写主库，同步到从库，读数据读从库的，但是必须毫无延迟的还是读主库，相比于上一种减少了大部分读压力；缺点在于需要开发人员的配合，因为只有他知道哪些数据可以延迟哪些不能延迟，还需要多记ip，开发人员不配合那真是bi了poi了
一主多从，读写分离，读压力更加分散，因为一般读数据的频率远大于写；缺点是各个从节点都需要从主同步数据，从节点越多，需要完全同步完成的时间越长
一主多从，负载均衡。使用lvs为读从节点做集群，写只写主节点，好处是原本代码中控制的读ip统一交给了lvs处理，只需要有两个ip一个读从ip一个写主ip；缺点跟之前还是一样的，主依然需要同步给每个从