cassandra的一些概念

分区器Partitioners

在集群内,根据设置的副本数,决定数据如何分发,允许跨机房

具体看

http://teddymaef.github.io/learncassandra/cn/replication/partitioners.html
http://blog.csdn.net/limingjian/article/details/8944572

数据的副本数replica

通过cql命令CREATE KEYSPACE,在建立keyspace的时候设置

一致性策略

既然数据有了跨机房的可能性,还有多个副本的情况,那么数据如何保持一致,你读写的时候,结果就会有很多种,这个就需要一致性策略来解决通过cql命令CONSISTENCY设置

具体看

http://teddymaef.github.io/learncassandra/cn/replication/turnable_consistency.html

num_tokens

token是cassandra用来做数据的hash分配的时候用到的东西;之前是需要用工具为每个节点算当前的token是多少;
现在cassandra多了虚拟节点的概念,用了num_tokens参数,动态增加和删除节点,就不需要自己去重新分配节点的token了

一些概念

data center和node区别
Cluster:逻辑上的集群的概念,包含多个Node,有可能跨数据中心。
DataCenter :数据中心,可以理解为是一个机房,包含多个Rack
Rack : 机架,机架上包含多个Node
Node : 可以理解为机器,每个Node上都需要标示出这个Node是属于哪个DC和RAC上,如cassandra的cassandra-topology.properties这个配置文件中存有Cassandra Node IP=Data Center:Rack的记录用于设置。

推荐几个学习的连接

http://blog.csdn.net/earthhour/article/category/1346151
http://teddymaef.github.io/learncassandra/cn/replication/replication_strategies.html
时间: 2024-10-13 15:44:10

cassandra的一些概念的相关文章

Cassandra存储time series类型数据时的内部数据结构?

因为我一直想用Cassandra来存储我们的数字电表中的数据,按照之前的文章(getting-started-time-series-data-modeling)的介绍,Cassandra真的和适合用于存储time series类型的数据,那么我就想要弄清楚,对于下面这张表 CREATE TABLE temperature ( weatherstation_id text, event_time timestamp, temperature text, PRIMARY KEY (weathers

[原创]Cassandra的基本数据模型之自底向上

一 简介 对于那些习惯了关系型数据库的人来说,学习Cassandra有一定的困难.Cassandra有很多新的术语,与关系型DB中的术语既类似但本质上又不相同.这里我们主要从两个角度来学习Cassandra的数据模型:自底向上和自顶向下. 二 自底向上理解Cassandra的数据模型 Cassandra被归类于NoSQL数据库,其根本原因在于它的设计不像关系型DB那样需要预告定义属性列.Cassandra是按列进行存储的,通常我们可以想像为以下这种模型: 但是使用这种数据模型来存储数据之后,如果

实战-Cassandra之账号权限管理

密码认证器 默认的认证器是 org.apache.cassandra.auth.AllowAllAuthenticator.如果想要求客户端提供凭证,Cassandra提供另一种选择  org.apache.cassandra.auth.PasswordAuthenticatot 配置认证器 默认登录cqlsh不需要密码,修改cassandra.yaml 修改 # authenticator: AllowAllAuthenticator authenticator: PasswordAuthen

我凭借这份pdf拿下了蚂蚁金服、字节跳动、小米等大厂的offer

关于程序员,除了做项目来提高自身的技术之外,还有一种提升自己的专业技能就是:多!看!书! 小编整理出一篇Java进阶架构师之路的核心知识,同时也是面试时面试官必问的知识点,篇章也是包括了很多知识点,其中包括了有基础知识.Java集合.JVM.多线程并发.spring原理.微服务.Netty 与RPC .Kafka.日记.设计模式.Java算法.数据库.Zookeeper.分布式缓存.数据结构等等 由于pdf文档里的细节内容实在过多所以只编辑了部分知识点的章节粗略的介绍下,每个章节小节点里面都有更

cassandra的schema version, gossip_generation 和host id

这是cassandra里面很重要的三个值; schema version是cassandra cluster里每个node的schema版本,什么叫版本呢?因为cassandra是无中心化的,所以你很难知道所有的node上的schema是否是一致的.你不可能每次把所有的schema都拿了去比较一次.这样很不高效.所以cassandra里就有了schema version这个概念.每次执行DDL操作的时候,都会新生成一个新的schema version, 当这个DDL操作复制到其他node的时候,

数据库系统0T1(0):基础概念

数据库,简单来说可视为电子化的文件柜--存储电子文件的处所,用户可以对文件中的数据运行新增.截取.更新.删除等操作. 数据库存储的基本对象是数据,数据可以是数字.文字.图片.音频.视频等等. 数据库的基本特征 数据按一定的数据模型组织.描述和储存 可为各种用户共享 冗余度较小 数据独立性较高,与应用程序互不依赖 易扩展 类型 关系数据库:MySQL.SQL Server.Oracle等 非关系型数据库(NoSQL):BigTable(Google)Cassandra.MongoDB等 键值(ke

第五十一课 NoSQL基础概念及MongoDB应用、数据库分配概念

NoSQL基础概念及MongoDB MongoDB基础应用 MongoDB索引及复制集 数据库分片的概念及Mongodb  sharding的实现 一.NoSQL基础概念 NoSQL(Not Only SQL),是一种技术流派,非关系型数据库:适合用在大数据领域,各种nosql有各自的查询语句,这也是nosql的缺点之一. 大数据(BigDate)也称海量数据是一个模糊的概念,像Google.百度收集大量数据,分析现在.预测未来:这些数据通过某些特定的特征和算法得出某些预测的结果,这些数据为大数

Cassandra的数据存储结构

Cassandra 的数据模型是基于列族(Column Family)的四维或五维模型.它借鉴了 Amazon 的 Dynamo 和 Google's Big Table 的数据结构和功能特点,采用Memtable的方式进行存储.在 Cassandra 写入数据之前,需要先记录日志 ( Commitlog),然后数据开始写入到 Column Family 对应的 Memtable 中,Memtable 是一种按照 key 排序数据的内存结构,在满足一定条件时,再把 Memtable 的数据批量的

Mac os下cassandra数据库的安装与使用

关于安装cassandra数据库,其实在apache官网上有详细的介绍:http://wiki.apache.org/cassandra/GettingStarted.当然,为了方便不愿看英文的同学,下面也大概介绍一下: 预备工作:确认自己的mac安装有jdk(最新的mac系统应该都安有jdk,所以问题应该不大,java -version即可验证是否系统是否安装了jdk) 1.首先到apache官网上下载cassandra最新版本,当然最新稳定版本为Apache Cassandra2.1.10