hadoop 3.0.0-alpha1

与2.x之间的变化

1.Java的版本由最低java7变化java8

2.HDFS支持纠删码(Erasure Coding)

与副本相比纠删码是一种更节省空间的数据持久化存储方法。标准编码(比如Reed-Solomon(10,4))会有
1.4 倍的空间开销；然而HDFS副本则会有3倍的空间开销。因为纠删码额外开销主要是在重建和执行远程读，它传统用于存储冷数据，即不经常访问的数据。当部署这个新特性时用户应该考虑纠删码的网络和CPU 开销。更多关于HDFS的纠删码可以参见http://hadoop.apache.org/docs/r3.0.0-alpha1/hadoop-project-dist/hadoop-hdfs/HDFSErasureCoding.html

3.YARN Timeline Service v.2

　　本版本引入了Yarn时间抽服务v.2，主要用于解决2大挑战：改善时间轴服务的可伸缩性和可靠性，通过引入流和聚合增强可用性。

　　YARN Timeline Service v.2 alpha 1可以让用户和开发者测试以及反馈，以便使得它可以替换现在的Timeline Service v.1.x。请在测试环境中使用。更多关于YARN Timeline Service v.2的知识请参见http://hadoop.apache.org/docs/r3.0.0-alpha1/hadoop-yarn/hadoop-yarn-site/TimelineServiceV2.html

4.Shell脚本重写

Hadoop的Shell脚本被重写解决了之前很多长期存在的bug，并且引入了一些新的特性。绝大部分都保持兼容性，不过仍有些变化可能使得现有的安装不能正常运行。不兼容的改变可以参见HADOOP-9902。更多内容请参见Unix Shell Guide文档。即使你是资深用户，也建议看下这个文档，因为其描述了许多新的功能，特别是与可扩展性有关的功能。

5.MapReduce任务级本地优化

MapReduce添加了Map输出collector的本地实现。对于shuffle密集型的作业来说，这将会有30%以上的性能提升。更多内容请参见MAPREDUCE-2841

时间： 2024-10-07 18:14:16

hadoop 3.0.0-alpha1

hadoop 3.0.0-alpha1的相关文章

hadoop 3.0.0 alpha1 分布式搭建

hadoop 3.0.0 alpha1 伪分布式搭建

Hadoop 2.2.0 常见问题之：Ubuntu 64环境下“Unable to load native-hadoop library for your platform”问题”

Hadoop 2.6.0 重要特性之 Docker Container Executor (DCE)

hadoop 2.6.0 安装过程

安装hadoop 2.2.0

Hadoop 2.4.0新特性介绍

Hadoop 2.6.0 HA高可用集群配置详解

Centos 6.5 X64 环境下编译 hadoop 2.6.0 --已验证

linux编译64bitHadoop (eg: ubuntu14.04 and hadoop 2.3.0)