大数据读书汇

第六届中国云计算大会(大数据读书汇)

读书汇介绍

第六届中国云计算大会2014年5月20-23日在北京国家会议中心拉开帷幕。本次大会立足实践,以国际化的视野,帮助与会者了解全球云计算技术的发展趋势;从应用出发,探讨交通、医疗、教育、金融、制造、数字娱乐等行业领域的实践经验;并通过技术专场、产品发布和培训课程等方式,深度剖析云计算大数据的核心技术。

今年会议主要议题依旧是大数据。本次盛会中,我们打造一场云计算下的大数据读书汇。为此我们会随此文推出一周的赠书活动,给更多的参会者提供便利条件。赠书品类在读书汇中选择。欢迎大家参与。

参与方式:扫二维码(见文章末)关注微信公众号,并在本贴下方写出你对大数据的展望或者任写读书汇内任意一本书的短评即可。

**注:以上参与者直接说出你比较想拥有的图书,方便我们直接给您邮寄。**

奖品设置:图书限量15本,只送给真诚的朋友们!只要你评论够真诚,够有阅读价值,我们就会选择您

起止日期:即日起——2014年5月28日24时止

温馨提示:每个ID仅有一次获赠机会,每人仅限一本书哦





国内外知名数据分析专家、行业领袖联袂推荐!

  • 《驾驭大数据》主要介绍了如何驾驭大数据浪潮,并详细地介绍了什么是大数据,大数据为什么重要,以及如何应用大数据。本书还从具体实用的角度,介绍了用于分析和操作大数据的工具、技术和方法;以及人才和企业文化的角度,介绍了如何使分析专家、分析团队以及所需的分析原则更加高效,如何通过分析创新中心使得分析更加有创造力,以及如何改变分析文化。


目前市场上唯一一本讲述Pig平台的图书

  • 《Pig编程指南》不仅为初学者讲解ApachePig的基础知识,同时也向有一定使用经验的高级用户介绍更加综合全面的Pig重要特性,如PigLatin脚本语言、控制台shell交互命令以及用于对Pig进行拓展的用户自定义函数(UDF)等。当读者有大数据处理需求时,《Pig编程指南》提供了如何更高效地使用Pig来完成需求的方法。


Hadoop系统的数据库管理员必备图书

  • 《Hive编程指南》是一本ApacheHive的编程指南,旨在介绍如何使用Hive的SQL方法——HiveQL来汇总、查询和分析存储在Hadoop分布式文件系统上的大数据集合。《Hive编程指南》通过大量的实例,首先介绍如何在用户环境下安装和配置Hive,并对Hadoop和MapReduce进行详尽阐述,最终演示Hive如何在Hadoop生态系统进行工作。


一本可以作为Hadoop使用说明书的操作指南

  • 《Hadoop技术详解》全书将从计划、安装、配置Hadoop系统开始讲起,一直深入到系统调试、维护等方面的知识,向读者展示了Hadoop生产运行环境的详细情况。同时,《Hadoop技术详解/“十二五”国家重点图书出版规划项目》并不只是简述所有的操作工序,而是突出示范了关键部署中的关键操作。


快速解决诸多Hadoop相关技术问题的实用技术手册

  • 《Hadoop实战手册》共包括3个部分,第一部分为基础篇,主要介绍Hadoop数据导入导出、HDFS的概述、Pig与Hive的使用、ETL和简单的数据处理,还介绍了MapReduce的调试方式;第二部分为数据分析高级篇,主要介绍高级聚合、大数据分析等技巧;第三部分为系统管理篇,主要介绍Hadoop的部署的各种模式、添加新节点、退役节点、快速恢复、MapReduce调优等。


HBase内部机制的技术书    权威的HBase开发指南

  • 《HBase权威指南》探讨了如何通过使用与HBase高度集成的Hadoop将HBase的可伸缩性变得简单;把大型数据集分布到相对廉价的商业服务器集群中;使用本地Java客户端,或者通过提供了REST、Avro和Thrift应用编程接口的网关服务器来访问HBase;了解HBase架构的细节,包括存储格式、预写日志、后台进程等;在HBase中集成MapReduce框架;了解如何调节集群、设计模式、拷贝表、导入批量数据和删除节点等。


Apache HBase项目管理委员会主席Michael Stack作序推荐!

  • 《HBase实战》是一本基于经验提炼而成的指南,它教给读者如何运用HBase设计、搭建及运行大数据应用系统。全书共分为4个部分。前两个部分分别介绍了分布式系统和大规模数据处理的发展历史,讲解HBase的基本原理模式设计以及如何使用HBase的高级特性;第三部分通过真实的应用和代码示例以及支持这些实践技巧的理论知识,进一步探索HBase的一些实用技术;第四部分讲解如何把原型开发系统升级为羽翼丰满的生产系统。


《高效能程序员的修炼》姊妹篇,挖掘程序员职业生涯中的痛点

  • 知名博主和程序员Jeff Atwood力作;《程序员的修炼》包含了Coding Horror博客中的精华文章。全书分为8章,涵盖了时间管理、编程方法、Web设计、测试 、用户需求、互联网、游戏编程以及技术阅读等方面的话题。作者选取的话题,无一不是程序员职业生涯中的痛点。很多文章在博客和网络上的点击率和回帖率居高不下。?


深度探讨编程语言选择、代码中的哲学和Google工作文化

  • 《程序员的呐喊》涉及编程语言文化、代码方法学、Google公司文化等热点话题。对IT界的各种现象、技术、趋势等,作者都在本书中表达了自己独特犀利的观点。比如Java真的是一门优秀的面向对象语言吗?重构真的那么美好吗?强弱类型语言到底哪个更好?敏捷真的靠谱吗?程序员要不要懂数学等。另外,他还谈到了很多大公司的理念,比如亚马逊做平台为什么那么成功等。最后,《程序员的呐喊》还收录了他写的Google面试攻略,这篇文章可以说为无数应试者点亮了明灯。


  • 大数据读书汇,布布扣,bubuko.com

    时间: 2024-08-10 00:06:11

    大数据读书汇的相关文章

    实战大数据读书笔记

    首先说下对这本书的感觉,虽然这貌似是第一本讲述大数据项目案列(基于微博的股票市场预测系统,技术内容的海量视频检索系统,基于HDFSd的云文件系统)的书籍,但是书上面的代码很少,图书馆和网上都没有源码可供下载,甚至电子书都还要买....可能就是因为刚出来吧 再说下HBase的系统架构 http://img.blog.csdn.net/20160506093443453 支撑层的HDFS对于HBase而言是不可或缺的,HBase本身不会存储数据,表中的数据都需以文件的形式持久化到分布式文件系统中,.

    大数据读书笔记(1)

    1. 数据分片与路由 抽象模型为两级映射关系,第一级映射是key-partition映射,第二级映射是partition-machine映射. 数据分片有哈希分片和范围分片: 哈希分片只支持点查询,如cassandra,voltmort,membase: 范围分片支持范围查询,google的bigtable 和ms的azure: 同时支持两种的yahoo的pnuts. 2.哈希分片时进行数据分片的常见手段,其中最常见的3中哈希分片方式分表是:轮询.虚拟桶.一致哈希方法 2.1 轮询也称哈希取模方

    大数据读书笔记(2)-流式计算

    早期和当前的"流式计算"系统分别称为"连续查询处理类"和"可扩展数据流平台类"计算系统. 流式计算系统的特点: 1)低延迟 2)极佳的系统容错性 3)极强的系统扩展能力 4)灵活强大的应用逻辑表达能力 目前典型的流式计算系统: S4,storm,millwheel,samza,d-stream,hadoop online,mupd8等. 其中storm和millwheel是各方面比较突出的. 流式计算系统架构: 常见的流式计算系统架构分为两种:主

    《大数据时代》读书笔记

    大数据开启了一次重大的时代转型.就像望远镜让我们能够感受宇宙,显微镜让我们能够 观测微生物一样,大数据正在改变我们的生活以及理解世界的方式,成为新发明和新服务的源 泉,而更多的改变正蓄势待发-- 大数据的精髓在于我们分析信息时的三个转变,这些转变将改变我们理解和组建社会的方法. 第一个转变就是,在大数据时代,我们可以分析更多的数据,有时候甚至可以处理和第一个转变就是,在大数据时代,我们可以分析更多的数据,有时候甚至可以处理和 某个特别现象相关的所有数据,而不再依赖于随机采样. 某个特别现象相关的

    移动大数据时代最IN编程语言必读书单

    移动大数据时代最IN编程语言必读书单 这是一个快速更迭,快鱼吃慢鱼的时代.从IT 时代演变成 DT 时代,再到现在的智能时代.急速革新的各种新技术.新工具.新平台,需要程序员掌握良好的编程思想和学习方法,不断学习新技术.补充新知识,才能努力跟上时代的步伐,找到自我实现的际遇.读书依然是我们获取知识的最方便和有效的途径之一.既要读经典,也要读新书,前者让你沉淀,发现正确的方法,后者让你紧跟前沿,掌握最新的技术.可你是不是担心,不能找到真正值得读的新书而浪费时间?在此,我们汇总了当下最In的编程语言

    智能大数据SMART准则(读书笔记)

    引言部分 1.智能渔业 将微型传感器安置到鱼身上,用意追踪任何特定时间的鱼群位置,并运用声呐探测鱼群密度以及何时何地撒网 2.智能运动 英式橄榄球队员都有一个GPS追踪系统,使得假脸人员能够知道每一个队员的情况 3.智能保健 类似Ginger.io等云服务以及可以通过消费则手机中安装的应用,检测患者的身体情况.Proteus公司制作的一款尺寸只有一粒沙大小的"可吞服"传感器,可以追踪患者服药的时间和方式 4.智能家居 来生长谈了 5.智能恋爱 通过大数据分析,得到模型,再通过模型对所有

    《大数据时代的历史机遇》读书心得

    作者:易仔阿克    时间:2014-08-06 博文标题:<大数据时代的历史机遇>读书心得 大数据资产价值评估模型:规模.颗粒度.多维度.关联性.活性.前四个侧重从空间角度,最后一个侧重在时间角度.规模是指数据的多少,数据量当然是越大越好.颗粒度只是数据的粒度,当然是数据粒度越细越好,粒度越细越便于分析.多维度是指数据视角多少,当然是维度越多越好,这样便于从多个视角查看.关联性是指属于与其它数据的关系,关联越多越好,越能够发现规律.活性是指数据的更新频率,数据活性越大,越能够实时地反映事物的

    《大数据日知录:架构与算法》读书笔记(多图)

    第二次读这本书,这次是精读,画了思维导图.书很好,完整的知识结构和由浅入深的介绍,非常全面以至于知识点都梳理了三天. 作为导论式的总览,对大数据领域有了个总体的认识,接下来可以更针对性地加强和实践. 总体上比较侧重基础理论和分布式系统的介绍,数据清洗.实时与离线融合的实践.数据分析以及将各系统串联打通方面还需要另外补课.

    读书笔记 - 《大数据》

    书确实是好书,可惜先看了<数据之颠>,不然会更震撼.两本书的主要内容有部分一致,都是在说美国对数据的收集和使用,以及其中的种种故事,最后引申出大数据时代,侧重的是以政府为着眼点.这个视角其实蛮独特,因为政府的投资追求的并不是直接的商务回报,所以需要更多的外部推动力,这本书也可以算是做了很大贡献吧.整体来说,看完了这本书对于大数据多了解了一个侧面,但是又多了不少疑惑,现在的大数据在商业层面到底该怎么获取到正收益呢?这真是个问题.