Cassandra的数据存储结构

　　Cassandra 的数据模型是基于列族（Column Family）的四维或五维模型。它借鉴了 Amazon 的 Dynamo 和 Google‘s Big Table 的数据结构和功能特点，采用Memtable的方式进行存储。在 Cassandra 写入数据之前，需要先记录日志 ( Commitlog)，然后数据开始写入到 Column Family 对应的 Memtable 中，Memtable 是一种按照 key 排序数据的内存结构，在满足一定条件时，再把 Memtable 的数据批量的刷新到磁盘上，存储为 SSTable 。

1. Cassandra 的数据模型图：

2.Cassandra 的数据模型的基本概念：

　　Cluster：Cassandra 的节点实例，它可以包含多个Keyspace。
　　Keyspace:：用于存放 ColumnFamily 的容器，相当于关系数据库中的 Schema 或 database。

　　ColumnFamily:：用于存放 Column 的容器，类似关系数据库中的 table 的概念。

　　SuperColumn:：它是一个特列殊的 Column, 它的 Value 值可以包函多个Column。

　　Column:：Cassandra 的最基本单位。由name , value , timestamp组成。

3.Cassandra中数据存放规则

　　data：存储真正的数据文件，既后面的SStable文件，可以指定多个目录。

　　commitlog：存储未写入SSTable中的数据（在每次写入之前先放入日志文件）。

　　cache：存储系统中的缓存数据（在服务重启的时候从这个目录中加载缓存数据）。

4.Cassandra的特点如下：

　　1.灵活的schema：不需要象数据库一样预先设计schema，增加或者删除字段非常方便（on the fly）。

　　2.支持range查询：可以对Key进行范围查询。

　　3.高可用，可扩展：单点故障不影响集群服务，可线性扩展。

5.Cassandra内部数据的排序

　　有一点需要明确，我们使用Cassandra的时候，数据在写入的时候就已经排好顺序了。在某一个Key内的所有Column都是按照它的Name来排序的。我们可以在storage-conf.xml文件中指定排序的类型。目前Cassandra提供的排序类型有：BytesType, UTF8Type，LexicalUUIDType, TimeUUIDType, AsciiType，和LongType。Cassandra的排序功能是允许我们自己实现的，只要你继承org.apache.cassandra.db.marshal.IType就可以了。

本文参考：http://www.ibm.com/developerworks/cn/opensource/os-cn-cassandra/

　　　　　http://www.cnblogs.com/ggzwtj/archive/2011/07/21/2113350.html

　　　　　http://database.51cto.com/art/201005/202153.htm

感谢以上文章作者的风险和分享。

时间： 2024-08-24 15:37:09

Cassandra的数据存储结构

Cassandra的数据存储结构的相关文章

solr中文搜索倒排索引和数据存储结构

HBase介绍(2)---数据存储结构

数据结构所涉及的数据存储结构类型

mysql之innodb存储引擎---数据存储结构

读书笔记-MySQL运维内参07-InnoDB数据存储结构

PCB NOSQL MongoDb MI流程指示数据存储结构

Scrapy系列教程（2）------Item（结构化数据存储结构）

SQLServer的数据存储结构01文件与文件组82m

Influxdb数据存储