前期已经完成了hadoop全分布模式的部署和运行,近期想更进一步的了解hadoop原理,基于hadoop2.X的书籍最好的莫过于《hadoop权威指南(第四版)》,很可惜作者年初才刚写完,没来得及翻译,只好看英文版了,书中的要点重点在接下来的一段时间我会依次翻译出来(全部翻译不太现实,没那么多时间精力,将近900页呢),如果有翻译不妥的地方,还请大家指出来,共同进步,谢谢!
今天是个开头,就先翻译一下文中前言和序的要点
1.Foreword
1) Wesplit off the distributed computing part of Nutch, naming it Hadoop.
我们把Nutch项目中有关分布式计算的部分分离出来,命名为hadoop。
2) Initially,Tom specialized in making Hadoop run well on Amazon’s EC2 and S3 services.Thenhe moved on to tackle a wide variety of problems, including improving theMapReduce APIs, enhancing the website, and devising an object
serializationframework.
首先,Tom专门研究如何顺利的在Amazon的EC2和 S3服务上运行hadoop。然后他把注意力转移到了处理包括改善MapReduce的API,优化网站,以及设计一个序列化框架等多种问题上。
2. Preface
1) Ifthere’s a common theme, it is about raising the level of abstraction — tocreate building blocks for programmers who have lots of data to store andanalyze, and who don’t have the time, the skill, or the inclination to becomedistributed
systems experts to build the infrastructure to handle it.
如果存在一个共同主题,那就是关于提升抽象概念层次,为那些需要存储和分析大量数据,但是又没有时间,没有技术,也没有兴趣成为分布式系统专家的程序员构建基本模块。
注:下次翻译第一部分第一章meet hadoop的要点,有点多,需假以时日