VoltDB内存数据库的十大FAQ

1. VoltDB是什么?

->VoltDB是一家新型关系型分布式内存数据库管理系统,以解决OLTP为初衷,正在不断增加处理OLAP,提供BI的功能。VoltDB与传统数据库(如DB2,Oracle,MySQL等)最大的不同点就是,VoltDB把全部数据放在内存里,并且可以scale out,运行在一个集群上,集群上的每个节点都可以执行部分数据处理任务。

VoltDB官网:http://voltdb.com/

2. VoltDB支持SQL吗?支持Transaction吗?

-> VoltDB支持大多数SQL语句,目前还在不断增加对SQL的支持。VoltDB的单个SQL语句和Stored procedure都支持Transaction的所有ACID属性,是一个完完全全的支持事务处理的系统。这点与key-value等系统等是有很大区别的。

VoltDB还支持JDBC,ODBC(soon)等接口,客户端也支持语言C#,C++,Erlang,Go,Java,JSON,Node.js,PHP,Python,Ruby等。

3. VoltDB适用于什么类型的应用?

->大数据领域可以分两类:a)数据总量大,b)单个数据元小,但数据产生快,有大量高并发。VoltDB主要是来解决Big Data下面Fast Data的问题,同时也在增加处理大数据量的能力。因此,VoltDB更加适合OLTP类型的应用,可以有效提高数据库高并发下的系统吞吐量,常见的应用有几类:a)需要实时交互的大型多人在线游戏,b)在线广告业务,c)移动电信通讯业务,d)银行或股票交易系统,e)在线商城(如淘宝,京东等),f)网络实时监控或传感器应用等

换句话讲,任何需要strong consistency的高并发业务,都是VoltDB最擅长的。同时实时交互的BI和OLAP也是VoltDB很不错的领域。当然如果你的数据规模是PB以上级别的OLAP话,就目前而言,那还是选择基于Hadoop的分析系统比较合适。

4. VoltDB数据库性是用什么语言写的?

VoltDB使用的语言大致分两种,底层引擎是C/C++,上层的SQL语义处理,并发管理,分布式集群等任务都是Java。另外,还有些工具使用Python,JS等做的。

底层Engine的任务包括:数据存储,内存管理及SQL具体执行的数据处理

5. VoltDB数据库性能到底怎么样?

VoltDB的吞吐量很高,尤其是单位节点的吞吐量,应该是市面上数据库系统最高的了。单台家用笔记本上,也能跑出7,8万TPS(transactions per second)。根据不同的笔记本性能,吞吐量也略有差别。

这里推荐两篇关于VoltDB性能的文章:

a)http://www.csdn.net/article/2013-04-11/2814850-877000-tps-with-erlang-and-voltdb :这是一家游戏公司Eonblast
Corporation的CEO自己用Erlang客户端测VoltDB性能的博文,文中测试吞吐量的结果为:87.7万的TPS,完成了350万的QPS。

b)http://voltdb.com/blog/voltdb-in-memory-database-achieves-best-in-class-results-running-in-the-cloud-on-the-ycsb-benchmark-3/:文中对比了YCSB
benchmark在云端的测量数据,结论是:VoltDB系统吞吐量可以根据集群的节点数线性增长,Workload B用12个节点跑出72.4万的TPS。要知道12年的MySQL和Cassandra在相似的机器上才跑出不到18万的TPS,现在的VoltDB跑Key-Value的应用,性能是当时他们的4倍之多。

C)https://www.sgi.com/pdfs/4238.pdf:SGI公司对VoltDB性能做了测试:10个节点能跑出120万的TPS,30个节点跑出了337万的TPS。

6. VoltDB是内存数据库,数据会不会容易丢失?如何实现高可用性?

数据库中数据的安全,一定是最为关键的问题。作为内存数据库,VoltDB有很多种科技手段来保证数据的可靠性。VoltDB已有不上金融领域的商业应用,这已经证明了内存数据库VoltDB在数据可靠性上是没问题的。

K-safety:VoltDB的数据是分区的,设定K-safety(即同步的分区拷贝数量)参数,可以确保整个集群的稳定性。如果K设置为1,每个分区都在集群内有一个拷贝,如果有一台机器当机了,整个VoltDB集群可以正常运行。

Snapshot(快照):用户可以根据应用设置snapshot的周期,VoltDB可以对数据做snapshot,然后将其写入Disk,数据就永久性的存在了。如果意外当机,VoltDB可以根据磁盘上已有的snapshot文件,进行数据恢复操作。恢复数据速度很快,我自己测试的60多G的数据,完成恢复需要2分钟左右。

Command Logging(命令日志):这个功能是VoltDB特有的,和Snapshot一起使用,记录了保存两次snapshot之间所有写(write)操作的日志,是为了确保不会有任何transaction丢失。读操作(read)不改变数据,所以不被记录。

Database Replication:这个是传统数据库已经有的功能了,就是在另一个地方,做一个完全一摸一样的数据拷贝,如果主集群不工作了(如集体断电),立刻讲服务切换到附属集群上去,通常附属集群要设立在一个物理范围上不同的地区。

以上内容有免费的网上学习视频,会英语的同学强烈推荐:http://voltdb.com/resources/volt-university/tutorials/section-1-6/

7. VoltDB是分布式数据库,有哪些特点?

VoltDB分布式内存数据库的性能,没两台机器之间不共享任何内存和数据,可以完全看做独立的两台机器,而只是用网络连接在一起。VoltDB的性能可以线性增长,支持动态添加节点,节点自动恢复等功能。

动态添加节点:不同业务可能会有自己的高峰期,打个比方,如果不满足现在3台机器的性能(吞吐量),可以动态增加节点,提高数据库服务器处理的性能。

节点自动恢复:如果集群中一台机器当机,K-safety参数设置大于或等于1,VoltDB依然可以正常运行。之后,等该机器维修好之后(当然也可换一台新机器),可以动态再添加到集群当中来。

8. 谁在使用VoltDB?VoltDB的客户有哪些?

VoltDB的客户数量在400多个,合作伙伴也有30个左右,其中包括惠普HP,雅虎这样的大型IT公司。业务范围也大多是之前提到的VoltDB比较擅长的领域,涉及fast data和高并发的应用。具体情况可以参考链接:

http://voltdb.com/about/customers/

http://voltdb.com/partners/voltdb-partners/

9. VoltDB是否开源?有哪些资料参考和学习?

VoltDB有开源版本,免费试用。同时也有商业版,包含有更多功能。下载需要到官网亲自下载,例如数据恢复,command logging等功能是需要需要商业版的,商业版本有30天免费试用的。如果你是开发人员,希望研读源代码或者为VoltDB做贡献,GitHub的Wiki页面上也有如何设置Java eclipse,进行开发。

开源版本下载地址:https://github.com/VoltDB/voltdb/releases

开源代码在GitHub上:https://github.com/VoltDB/voltdb

VoltDB免费在线视频学习课程(会英文的同学,强烈推荐学习):http://voltdb.com/resources/volt-university/tutorials/

VoltDB的JIRA系统:https://issues.voltdb.com/

VoltDB的社区论坛:https://forum.voltdb.com/

VoltDB的支持邮箱:有任何疑问都可以发到此邮箱 [email protected]

10. VoltDB商业版本费用如何?

具体的收费规则,我不是很清楚,但我可以确定,一定比传统大型数据库Oracle,SQL Server,DB2啥的便宜好多,比起SAP HANA也要便宜好多好多。

具体情况可以发邮件到[email protected]询问,一定有人会回复相关问题。

如果你又其他相关问题,这里没有涵盖到,也可以留言讨论。

VoltDB内存数据库的十大FAQ

时间: 2025-01-13 03:50:41

VoltDB内存数据库的十大FAQ的相关文章

Spring常犯的十大错误,你踩过吗?

1.错误一:太过关注底层 我们正在解决这个常见错误,是因为 "非我所创" 综合症在软件开发领域很是常见.症状包括经常重写一些常见的代码,很多开发人员都有这种症状. 虽然理解特定库的内部结构及其实现,在很大程度上是好的并且很有必要的(也可以是一个很好的学习过程),但作为软件工程师,不断地处理相同的底层实现细节对个人的开发生涯是有害的. 像 Spring 这种抽象框架的存在是有原因的,它将你从重复地手工劳作中解放出来,并允许你专注于更高层次的细节 -- 领域对象和业务逻辑. 因此,接受抽象

2017黑科技趋势最具看点的十大新品

腾讯数码讯(Human)作为一年一度的全球消费电子市场风向标,今年同样在拉斯维加斯举办的CES 2017消费电子展,依然吸引了一大批全球各个领域的厂商参展,从科技巨头到初创小团队.从传统汽车厂商再到家电企业,似乎所有能与科技沾边的公司都希望能在CES 2017上好好展示一次自己的风采. 其实每年的CES都有一些明星产品给我们留下深刻的印象,今年的也不例外.而这些明星产品不仅仅只是单单一款产品,更是代表了各自行业在进入到2017年之后的一个发展趋势和方向.而就将这样的变化能否成为未来的主流.或只是

留声机十大品牌丨“凯撒宾尼/KASA.BENE”发展历史

KASA.BENE/凯撒.宾尼,成立于2012年,其中国大陆运营公司为深圳市玛斯特恩科技有限公司,此公司于2000年就开始生产经营HIFI高保真音响类产品,在国内音频行业中属于老牌企业!2012年与香港凯撒宾尼国际有限公司合资注册了"KASA.BENE/凯撒.宾尼"品牌,并开始中国大陆地区的运营.2015年9月,"KASA.BENE/凯撒.宾尼"与德国 Canzler Wrede 投资公司展开了技术.资源.资金等方面的合作.在此期间"KASA.BENE/凯

2017留声机十大品牌最新排名

通过2017广州家具展了解,随着中国经济的快速发展,居民消费水准的不断提升,中国高端古典家居市场面临巨大的市场机会.留声机是古典家居中的必备饰品,尤其是近两年,留声机又逐渐出现在人们的视野当中.现在大家都喜欢向品牌靠拢,那么留声机十大品牌的排名情况自然是非常受关注的,下面我们来了解一下相关情况吧. 留声机十大品牌第一名:凯撒宾尼/KASA.BENE(中国优质名牌产品,中国家居饰品行业十大品牌,Qiff金奖) "凯撒宾尼/KASA.BENE"品牌系列产品多以实木为主,加以纯手工打磨制作而

留声机品牌哪个好?2017留声机十大品牌最新排名

通过2017广州家具展了解,随着中国经济的快速发展,居民消费水准的不断提升,中国高端古典家居市场面临巨大的市场机会.留声机是古典家居中的必备饰品,尤其是近两年,留声机又逐渐出现在人们的视野当中.现在大家都喜欢向品牌靠拢,那么留声机十大品牌的排名情况自然是非常受关注的,下面我们来了解一下相关情况吧. 留声机十大品牌第一名:凯撒宾尼/KASA.BENE(中国优质名牌产品,中国家居饰品行业十大品牌,Qiff金奖) Canzler Wrede Investment Company 香港凯撒宾尼国际有限公

让数据库飞起来 十大DB2优化技巧

DB2是IBM出口的一系列关系型数据库管理系统,分别在不同的操作系统平台上服务.下文中将为大家讲解DB2十大优化技巧. 为了帮助DB2 DBA 避免性能灾难并获得高性能,我为我们的客户.用户和 DB2 专家同行总结了一套故障诊断流程.以下详细说明在 Unix.Windows 和 OS/2 环境下使用 DB2 UDB 的电子商务OLTP 应用程序的10 条最重要的性能改善技巧,希望下文中涉及到的内容对大家能够有所帮助. 一. 监视开关 确保已经打开监视开关.如果它们没有打开,您将无法获取您需要的性

数据挖掘十大经典算法

一. C4.5  C4.5算法是机器学习算法中的一种分类决策树算法,其核心算法是ID3 算法.   C4.5算法继承了ID3算法的优点,并在以下几方面对ID3算法进行了改进: 1) 用信息增益率来选择属性,克服了用信息增益选择属性时偏向选择取值多的属性的不足: 2) 在树构造过程中进行剪枝: 3) 能够完成对连续属性的离散化处理: 4) 能够对不完整数据进行处理. C4.5算法有如下优点:产生的分类规则易于理解,准确率较高.其缺点是:在构造树的过程中,需要对数据集进行多次的顺序扫描和排序,因而导

刘沐真:游戏化十大元素

把游戏中的智慧和法则,运用在现实世界,这就是游戏化.正确的游戏化运用,可以使孩子从玩家转变成学霸,让新兴的创始人,具备别人看不透的核心竞争力,让玩游戏的人,娱乐的同时,其他维度也变得更强... 目前市面上的游戏化书籍,基本都是学院派理论,实操性非常差,莫风老师向你保证,只要你掌握以下游戏化十大元素,你对游戏化的运用将超过任何一个“专家” 1.核心玩法 理解了核心玩法,你的游戏化之路就成功了一半. 一款游戏好不好玩,成败往往就是核心玩法.在游戏世界,仙剑的核心玩法就是45度角战斗,超级玛丽就是跳跃

论大数据的十大局限

“忽如一夜春风来,千树万树梨花开”,似乎在一夜之间,大数据就红遍了南北半球,,大数据被神化得无处不在,无所不包,无所不能.这里面有认识上的原因,也有故意忽悠的成份.笔者以为,越是在热得发烫的时候,越是需要有人在旁边吹吹冷风.在这里谈大数据的十大局限性,并非要否定其价值.相反,只有我们充分认识了大数据的特点和优劣势,才能更加有效地对其进行采集.加工.应用,充分挖掘和发挥其价值.         1.数据噪声:与生俱来的不和谐 大数据之所以为大数据,首先是因为其数据体量巨大.然而,在这海量的数据中,