Druid对比Cassandra

不是Cassandra专家, 如果描绘有错误, 请通过邮件列表或者其他方式告知, 我们会修正。

Druid对扫描和聚合做了很大程度的优化, 不用提前计算就支持任意的向下钻取, 还可以实时摄入流式数据并实时查询这些进入的数据. Cassandra是很好的名值对数据仓库, 相对于纯粹的key-value数据仓库可以让你做跟多的感兴趣的事情。它的使用方法和druid不同, druid经常为一次查询扫描数以十亿的记录。

还有, Druid是完全的读一致性的。 Druid将数据分成叫做segment的不变数据块。所有的副本和原始数据是一个视图, 不用太担心数据同步。 这个折中使Druid没有写和更新语义。 Cassandra 和亚马逊的Dynamo相似, 最终一致性的数据模型。 可以随时写, 但是需要一定的时间才能副本更新(当达到一致的过程中, 是有读取操作的). Cassandra偏向可用性和伸缩性,牺牲了一致性。

时间: 2024-10-06 21:03:56

Druid对比Cassandra的相关文章

对比Cassandra、 Mongodb、CouchDB、Redis、Riak、 Membase、Neo4j、HBase

转自:http://www.cnblogs.com/alephsoul-alephsoul/archive/2013/04/26/3044630.html 导读:Kristóf Kovács 是一位软件架构师和咨询顾问,他最近发布了一片对比各种类型nosql数据库的文章.文章由敏捷翻译 – 唐尤华编译.如需转载,请参见文后声明. 虽然SQL数据库是非常有用的工具,但经历了15年的一支独秀之后垄断即将被打破.这只是时间问题:被迫使用关系数据库,但最终发现不能适应需求的情况不胜枚举. 但是NoSQL

Druid对比Redshift

Redshift 内部使用了亚马逊取得了授权的ParAccel 实时注入数据 抛开可能的性能不同, 有功能性的不同 Druid 适合分析大数据量的流式数据, 也能够实时加载和聚合数据一般来讲, 传统的数据仓库包括列式存储只摄入批量数据, 没有对流式数据做优化 Druid 是只读分析型数据仓库 Druid支持写语句, 但是数据是不变的, 也不支持join. ParAccel 是完全数据库, 支持SQL语法包括join, insert, update 分发数据 Druid的数据分发的单位是segme

Druid对比Elasticsearch

我们不是Elasticsearch的专家, 如果描绘有误, 请通过邮件列表或者其他途径告知我们. Elasticsearch 是基于Apache Lucene搜索服务器.  提供了对无模式文档的全文检索, 提供了存取未加工的事件记录功能.Elasticsearch也提供了分析和聚合功能. 据用户证明, 数据注入和数据聚合需要比druid大得多的资源. Druid 支持OLAP数据流程. Druid在低成本的情况下做了优化以达到高性能(快速的聚合和注入数据), 支持很大范围的分析操作. Druid

Druid对比Hadoop

Hadoop 向世界证明, 花费很少的钱实现典型的解决方案, 将数据保存在一般的商用机器的数据仓库里是可行的. 当人们将自己的数据保存在Hadoop, 他们发现两个问题        他们能够用一种相当灵活的方式查询数据来解答任何问题.    这个查询花费很多时间 第一次运行Hadoop, 每个人都会感到高兴. 后面使用Hadoop进行交互性查询后, 他们意识到Hadoop只优化了吞吐量, 没有优化延时. Druid完全是Hadoop的一个补充. Hadoop精于存储和查询的大量的低价值个体数据

Druid对比Vertica

怎么比较Druid和Vertica? Vertica 类似与之前介绍的ParAccel/Redshift(Druid-vs-Redshift). 不是实时注入数据: 提供SQL的全部语法支持 另外一个很大不同是: Vertica 不适用index, 尝试利用run-length encoding和其他的压缩技术和产生不同排序的实体化副本投射系统(最大化利用run-length encoding) 不太清除Vertica如何分发和复制数据, 所以很难说两者有什么不同

Druid缓存

连接Oracle数据库,打开PSCache,在其他的数据库连接池都会存在内存占用过多的问题,Druid是唯一解决这个问题的连接池. oracle数据库下PreparedStatementCache内存问题解决方案: Oracle支持游标,一个PreparedStatement对应服务器一个游标,如果PreparedStatement被缓存起来重复执行,PreparedStatement没有被关闭,服务器端的游标就不会被关闭,性能提高非常显著.在类似SELECT * FROM T WHERE ID

[转载] 360分布式存储系统Bada的设计和应用

原文: http://mp.weixin.qq.com/s?__biz=MzAwMDU1MTE1OQ==&mid=208931479&idx=1&sn=1dc6ea4fa28a3fb527a6204a9a5c23b1&key=c76941211a49ab5849fe180925fd9816350457f931e54a80feca07c081bffea5828ae0bbb2b1f7be41501db7dea48977&ascene=0&uin=Mjk1ODMy

【大数据】大数据-实时统计分析-方案选型

大数据-实时统计分析-方案选型 image2017-10-27_11-10-53.png (1067×738) elasticsearch-head Elasticsearch-sql client spark streaming reload_百度搜索 基于spark streaming的网管系统告警过滤算法的设计与实现 - 其它论文 - 道客巴巴 scala - Spark Streaming into HBase with filtering logic - Stack Overflow

【Spark】SparkStreaming-流处理-规则动态更新-解决方案

SparkStreaming-流处理-规则动态更新-解决方案 image2017-10-27_11-10-53.png (1067×738) elasticsearch-head Elasticsearch-sql client spark streaming reload_百度搜索 基于spark streaming的网管系统告警过滤算法的设计与实现 - 其它论文 - 道客巴巴 scala - Spark Streaming into HBase with filtering logic -