据日前的一则大数据工具使用情况调查,我们知道了Java程序猿最喜欢用的大数据工具。
问题:他们最近一年最喜欢用什么工具或者是框架?
受访者可以选择列表中的选项或者列出自己的,本文主要关心的是大数据工具。上一篇Java调查包括下列内容:
开发语言
Web框架
应用服务器
数据库工具
SQL数据
大数据
开发工具
云供应商
现在,来看看维基百科上对大数据的定义:
大数据,广义上来说是一组量很大很复杂的数据集合,在这种情况下传统的数据处理方式将不再适用。
对于一般情况来说传统的SQL数据库足够用。再另外一些场景下,传统的数据库能够承载的数据库量级有限,并且现在有了越来越多的工具可供使用。关键取决于场景。
现在让我们来讨论不同的非SQL工具来存储/处理数据 - NoSQL数据库、内存缓存、全文搜索引擎、实时流媒体、图形数据库等。
大数据-调查结果
MongoDB-一种非常流行的、跨平台、面向document的数据库。
Elasticsearch-专为云计算设计的分布式REST风格的搜索引擎。
Cassandra-一个开源的分布式数据库管理系统。最初是Facebook设计和开发的,部署在大量商用服务器上来处理大量的数据。高可用,无单点故障。
Redis-开源的(BSD)内存数据结构存储、内存库、缓存、消息代理。
Hazelcast-基于Java开发的内存数据网格。
EHCache-广泛使用的开源Java分布式缓存、J2ee、轻量级容器。
Hadoop-用java开发的开源分布式大数据框架,用来处理非常大规模数据,hadoop是集群化部署。
Solr-使用java开发的开源企业级搜索平台。最初归属在Apache Lucene项目中。
Spark-ASF中最活跃的项目,是一个开源的集群化计算框架。
Memcached–通用分布式缓存系统。
Apache Hive-在Hadoop支持类SQL封装,将SQL语句变成mr程序来执行。
Apache Kafka–高吞吐量、分布式、消息发布-订阅系统,最早是Linkin开发的。
Akka–Java开发的用来建造高并发,基于jvm弹性消息驱动的应用。
Hbase-根据Google的BigTable论文开发的开源分布式非关系型数据库。开发语言是Java,用HDFS作为底层存储。
Neo4j–用Java实现的开源图形数据库。
CouchBase–面向Document的开源分布式NoSQL数据库,并且针对交互应用做过优化。
Apache Storm–开源分布式实时计算系统。
CouchDB–使用json来存储数据的开放源码面向文档的NoSQL数据库。
Oracle Coherence–内存数据网格解决方案,使企业通过提供快速访问热数据来预测关键任务应用的规模。
Titan–可扩展的图形数据库,针对集群存储和查询数千亿的图形数据做过优化。
亚马逊 DynamoDB – 一个快速、灵活NoSQL数据库,能够应对所有规模应用程序的需求,包括持久化、毫秒级延迟。
Amazon Kinesis–AWS上的实时数据计算平台。
Datomic–提供完整事务支持,云计算,分布式的数据库,开发语言用Clojure。
近期精彩活动(直接点击查看):
福利 · 阅读 | 免费申请读大数据新书 第8期
END
版权声明:
转载文章均来自公开网络,仅供学习使用,不会用于任何商业用途,如果出处有误或侵犯到原作者权益,请与我们联系删除或授权事宜,联系邮箱:[email protected]。转载大数据公众号文章请注明原文链接和作者,否则产生的任何版权纠纷与大数据无关。
大数据
为大家提供与大数据相关的最新技术和资讯。
长按指纹 > 识别图中二维码 > 添加关注
近期精彩文章:
160523 凯文·凯利:大数据时代没有旁观者
160519 史上最全的大数据分析和制作工具
160515 深解读:什么是数据科学?如何把数据变成产品?
160511 一篇文看懂Hadoop:风雨十年,未来何去何从
160510 全球20个最佳大数据可视化工具,高级PPTers的法宝
160508 揭秘47万微信群和2亿微信用户背后的数字规律
160503 一篇对大数据深度思考的文章,让你认识并读懂大数据
160428 2016年,文本分析、情感分析和社交分析的10大趋势
160423 10年内,这三大领域将被人工智能和大数据重塑
160412 爬取QQ空间3000万用户,玩玩大数据分析
160331 华为内部狂转好文,有关大数据,看这一篇就够了!
160303 大数据的误区:数据统计≠大数据
160106 用户画像全解析 | 都在说用户画像,你真的了解透了吗?
160102 自拍有风险!大数据在用什么姿势“出卖”你?
151219 2016年大数据发展七大趋势
151109 大数据告诉你,电商会把假货发给谁?
151007 十张图看懂未来的大数据世界
150928 大数据研究常用软件工具与应用场景
150812 中国互联网公司最新最全阵亡名单,涉及16个领域千余企业!附死因和反思!\
http://blog.ifeng.com/article/44838347.html
http://shiyou.huangye88.com/xinxi/80291498.html
http://shiyou.huangye88.com/xinxi/80302335.html
http://shiyou.huangye88.com/xinxi/80306282.html
http://blog.itpub.net/30065054/viewspace-2106144/
http://blog.sina.com.cn/s/blog_7362e71e0102wgqf.html
http://blog.sina.com.cn/s/blog_7362e71e0102wgqg.html
http://blog.sina.com.cn/s/blog_7362e71e0102wgqi.html
http://shiyou.huangye88.com/xinxi/80495721.html
http://shiyou.huangye88.com/xinxi/80496364.html
http://shiyou.huangye88.com/xinxi/80496902.html
http://site.leshou.com/s/26795210.html
http://site.leshou.com/s/26796177.html
http://site.leshou.com/s/26796368.html
https://club.1688.com/article/60893273.html
https://club.1688.com/article/60893347.html
http://www.docin.com/p-1598403791.html
http://www.docin.com/p-1598414686.html
http://www.docin.com/p-1598414688.html