Cassandra安装及其简单试用

官方主页:
http://cassandra.apache.org/

简介:
The Apache Cassandra Project develops a highly scalable second-generation distributed database, bringing together Dynamo‘s fully distributed design and Bigtable‘s ColumnFamily-based data model. 
Cassandra was open sourced by Facebook in 2008, and is now developed by Apache committers and contributors from many companies.

Apache Cassandra是一套开源分布式NoSQL数据库系统。它最初由Facebook开发,用于储存收件箱等简单格式数据,集Google BigTable的数据模型与Amazon Dynamo的完全分布式的架构于一身。Facebook于2008将 Cassandra 开源,此后,由于Cassandra良好的可扩放性,被Digg、Twitter等知名Web 2.0网站所采纳,成为了一种流行的分布式结构化数据存储方案。
架构
Cassandra使用了Google BigTable的数据模型,与面向行的传统的关系型数据库不同,这是一种面向列的数据库,列被组织成为列族(Column Family),在数据库中增加一列非常方便。对于搜索和一般的结构化数据存储,这个结构足够丰富和有效。
Cassandra的系统架构与Dynamo一脉相承,是基于O(1)DHT(分布式哈希表)的完全P2P架构,与传统的基于Sharding的数据库集群相比,Cassandra可以几乎无缝地加入或删除节点,非常适于对于节点规模变化比较快的应用场景。
Cassandra的数据会写入多个节点,来保证数据的可靠性,在一致性、可用性和网络分区耐受能力(CAP)的折衷问题上,Cassandra比较灵活,用户在读取时可以指定要求所有副本一致(高一致性)、读到一个副本即可(高可用性)或是通过选举来确认多数副本一致即可(折衷)。这样,Cassandra可以适用于有节点、网络失效,以及多数据中心的场景。
特性
和其他数据库比较,Cassandra有三个突出特点:
模式灵活 :使用Cassandra,像文档存储,你不必提前解决记录中的字段。你可以在系统运行时随意的添加或移除字段。这是一个惊人的效率提升,特别是在大型部署上。 
真正的可扩展性 :Cassandra是纯粹意义上的水平扩展。为给集群添加更多容量,可以指向另一台电脑。你不必重启任何进程,改变应用查询,或手动迁移任何数据。 
多数据中心识别 :你可以调整你的节点布局来避免某一个数据中心起火,一个备用的数据中心将至少有每条记录的完全复制。 
一些使Cassandra提高竞争力的其他功能:
范围查询 :如果你不喜欢全部的键值查询,则可以设置键的范围来查询。 
列表数据结构 :在混合模式可以将超级列添加到5维。对于每个用户的索引,这是非常方便的。 
分布式写操作 :有可以在任何地方任何时间集中读或写任何数据。并且不会有任何单点失败。
参考:
http://zh.wikipedia.org/zh/Cassandra

在CentOS 5.5上安装:
Cassandra requires the most stable version of Java 1.6 you can deploy. For Sun‘s jvm, this means at least u19; u21 is better.

解压安装包
tar zxvf apache-cassandra-0.7.0-bin.tar.gz  
创建cassandra默认需要的目录
mkdir -p /data/logs/cassandra
ln -s /data/logs/cassandra /var/log/cassandra
ln -s /data/logs/cassandra /var/lib/cassandra
ln -s /root/apache-cassandra-0.7.0 /usr/local/cassandra
cd /usr/local/cassandra

启动:
bin/cassandra -f

使用命令行连接本地服务:
bin/cassandra-cli --host localhost
在命令行模式执行:
(1)可理解为创建一个数据库
create keyspace Cassandra_Test;
use Cassandra_Test;
(2)可理解为创建一个表
create column family Users with comparator=UTF8Type and default_validation_class=UTF8Type;
(3)插入数据
set Users[author][nick_name] = ‘preftest‘;
set Users[author][age] = long(31);
(4)查询数据
get Users[author];
count Users[‘author‘];
list Users;

使用Python客户端
安装所需的库:
easy_install pycassa
easy_install thrift05 
注意,安装thrift05时如果提示找不到python.h文件,则需要先装python-dev:
yum install python-devel

编写Python脚本连接Cassandra:
import pycassa
pool=pycassa.connect(‘Cassandra_Test‘,[‘localhost:9160‘])
col_fam=pycassa.ColumnFamily(pool,‘Users‘)
col_fam.insert(‘tester‘,{‘nick_name‘:‘performance‘,‘age‘:‘31‘})
print col_fam.get(‘author‘)
print col_fam.get_count(‘tester‘)

参考:
http://pycassa.github.com/pycassa/tutorial.html

做集群请参考:
Get Started:
http://wiki.apache.org/cassandra/GettingStarted

## 添加新节点后,两控制台都能智能感应
INFO 15:52:20,128 Node /10.20.223.111 is now part of the cluster
INFO 15:52:21,137 Started hinted handoff for endpoint /10.20.223.111
INFO 15:52:21,138 InetAddress /10.20.223.111 is now UP
INFO 15:52:21,139 Finished hinted handoff of 0 rows to endpoint /10.20.223.111
# 节点故障时的感应
INFO 15:59:37,046 error writing to /10.20.223.111
INFO 15:59:42,051 InetAddress /10.20.223.111 is now dead.
# 节点恢复时的感应
INFO 16:00:19,430 Node /10.20.223.111 has restarted, now UP again
INFO 16:00:19,430 Started hinted handoff for endpoint /10.20.223.111
INFO 16:00:19,431 Node /10.20.223.111 state jump to normal
INFO 16:00:19,431 Finished hinted handoff of 0 rows to endpoint /10.20.223.111

参考:
http://hi.baidu.com/higkoo/blog/item/e5e1cd34d278fba4d1a2d3d7.html

时间: 2024-10-14 03:14:49

Cassandra安装及其简单试用的相关文章

TFS 2010 让安装更简单,也让VSS成为历史

一转眼VS 2010 RC(Release Candidate)版本号已经公布一月多了,RTM(Release To Manufacturer)版本号也快妥了,已经进入了最后的倒计时,仅仅等4月12号公布了.TFS 2010也将一起正式公布,相对于2005和2008,2010将是具有里程碑意义的一个版本号,就像它总设计师Brian Harry在以下的Channel 9採訪中所描写叙述的:“TFS 2005是TFS 1.0版,2008则是1.5,而2010则是2.0版”. Brian Harry:

google proto buffer安装和简单示例

google proto buffer安装和简单示例 1.安装 下载google proto buff. 解压下载的包,并且阅读README.txt,根据里面的指引进行安装. $ ./configure $ make $ make check $ make install 没有意外的话,前面三步应该都能顺利完成,第四步的时候,需要root权限.我采用的默认的路径,所以,仅仅用root权限,还是安装不了,要自己先在/usr/local下新建一个lib的目录,然后执行make install,这样,

python requests的安装与简单运用

requests是Python的一个HTTP客户端库,跟urllib,urllib2类似,那为什么要用requests而不用urllib2呢?官方文档中是这样说明的: python的标准库urllib2提供了大部分需要的HTTP功能,但是API太逆天了,一个简单的功能就需要一大堆代码. 我也看了下requests的文档,确实很简单,适合我这种懒人.下面就是一些简单指南. 插播个好消息!刚看到requests有了中文翻译版,建议英文不好的看看,内容也比我的博客好多了,具体链接是:http://cn

saltstack安装和简单配置(一)

saltstack 安装和简单配置 在安装前,写了好多废话,都被我删除了,下面就开始搞吧. 环境: master:10.70.36.110 minion:10.70.36.103 一.安装: 现在centos下的yum源内有最新的salt-master源码包,安装的话,直接     yum -y install salt-master   #服务端         yum -y install salt-minion   #客户端 要使用yum安装,必须配置好epel源,可参考:        

Redis安装及简单测试

题目链接:11645 - Bits 题意:给定一个数字n,要求0-n的二进制形式下,连续11的个数. 思路:和 UVA 11038 这题类似,枚举中间,然后处理两边的情况. 不过本题最大的答案会超过longlong,要用高精度,不过借鉴http://www.cnblogs.com/TO-Asia/p/3214706.html这个人的方法,直接用两个数字来保存一个数字,这样能保存到2个longlong的长度,就足够存放这题的答案了. 代码: #include <stdio.h> #include

memcache的windows下的安装和简单使用

原文:memcache的windows下的安装和简单使用 memcache是为了解决网站访问量大,数据库压力倍增的解决方案之一,由于其简单实用,很多站点现在都在使用memcache,但是memcache缺点之一却是缺少安全性验证,所以一般而言我们都会把一些访问量大,但是不需要验证的数据放在这里,需要用的时候来这里取,就给数据库减少了很多的负担.一般而言设定个更新时间就好了,1个小时左右更新一次. windows下安装和测试memcache最为方便,Linux只是需要相应的编译包就行了,需要包括m

puppet yum安装配置,简单证书维护

Puppet学习之puppet的安装和配置 一.Puppet简介 Puppet基于ruby语言开发的自动化系统配置工具,可以C/S模式或独立运行,支持对所有UNIX及类UNIX系统的配置管理,最新版本也开始支持对Windows操作系统有限的一些管理.Puppet适用于服务器管的整个过程 ,比如初始安装.配置更新以及系统下线. 二.Puppet的安装 Puppet的安装方式支持源码安装.yum安装以及ruby的gem安装.官网推荐使用yum来安装puppet,方面以后的升级.管理.维护.Cento

&lt;转载&gt; FreeNAS的安装和简单配置 http://freenas.cn/?p=342

前些日子在公司搭了一个模拟生产环境的平台.由于是测试环境,资源有限只能使用虚拟机实现,所以存储这块就想到了使用FreeNAS.很早以前玩儿过几次,当时是生产环境需要上存储设备,经过对比还是选择的更可靠的NetApp的存储设备.目前FreeNAS最新版本到了0.7.3514,下载地址是 http://www.freenas.cn/?page_id=9 .借用FreeNAS官方网站对它的描述:FreeNAS是一套免费的NAS服务器,它能将一部普通PC变成网络存储服务器.该软件基于FreeBSD,Sa

Linux libusb 安装及简单使用

Linux libusb 安装及简单使用 一.参考文档: 1. libusb1 fails do_configure task with “udev support requested but libudev not installed” http://stackoverflow.com/questions/23712859/libusb1-fails-do-configure-task-with-udev-support-requested-but-libudev-not-ins 2. lib