大数据学习文章

ZooKeeper:

ZooKeeper浅析:http://www.cnblogs.com/sharpxiajun/archive/2013/06/02/3113923.html

HDFS:

MapReduce程序的工作过程: http://www.aboutyun.com/thread-15494-1-2.html

HDFS小文件处理解决方案总结:http://www.aboutyun.com/thread-14227-1-1.html

Hadoop 学习总结之一:HDFS简介:http://www.cnblogs.com/forfuture1978/archive/2010/03/14/1685351.html

MapReduce

hadoop杂记-为什么会有Map-reduce v2 (Yarn):http://www.cnblogs.com/LeftNotEasy/archive/2012/02/18/why-yarn.html

YARN : Architecture of Next Generation Apache Hadoop MapReduceFramework:http://blog.csdn.net/colorant/article/details/9146201

MapReduce程序的工作过程: http://www.aboutyun.com/thread-15494-1-2.html

Hadoop核心架构HDFS+MapReduce+Hbase+Hive内部机理详解:http://blog.csdn.net/yczws1/article/details/19178265

hadoop学习WordCount+Block+Split+Shuffle+Map+Reduce技术详解:http://blog.csdn.net/yczws1/article/details/21899007

MapReduce调度与执行原理系列文章

一、MapReduce调度与执行原理之作业提交

二、MapReduce调度与执行原理之作业初始化

三、MapReduce调度与执行原理之任务调度

四、MapReduce调度与执行原理之任务调度(续)

JobTracker作业启动过程分析:http://blog.csdn.net/androidlushangderen/article/details/41356521

Hadoop集群作业调度算法

浅析 Hadoop 中的数据倾斜:http://my.oschina.net/leejun2005/blog/100922

Hadoop源码解析之: TextInputFormat如何处理跨split的行:http://blog.csdn.net/bluishglc/article/details/9380087

hive:

hive基本操作:http://www.aboutyun.com/thread-6867-1-1.html

hive组件和执行过程:http://blog.csdn.net/lifuxiangcaohui/article/details/40262021

大数据时代的技术hive介绍:http://www.cnblogs.com/sharpxiajun/archive/2013/06/02/3114180.html

Hive体系结构:http://blog.csdn.net/lifuxiangcaohui/article/details/40615843

深入浅出数据仓库中SQL性能优化之Hive篇

HIVE Group by、join、distinct等实现原理

HBase:
Hadoop核心架构Hbase:http://blog.csdn.net/yczws1/article/details/19178265

HBase系统入门--整体介绍

Hbase写数据,存数据,读数据的详细过程

Hbase rowkey设计一

HBase的rowkey设计(含实例)

LSM树由来、设计思想以及应用到HBase的索引

HBase在搜狐内容推荐引擎系统中的应用

Hbase建模

Hbase和Oracle的对比

关于HFile的存储结构梳理以及快速定位rowkey

HBase二级索引方案总结

Solr:

Lucene学习总结之一:全文检索的基本原理

Solr学习和总结(线下1)

solr学习2

Solr使用

基于Solr的HBase多条件查询测试

ElasticSearch:

ElasticSearch学习1

ES学习2

ElasticSearch使用代码

修改ES分片规则

Redis:

NoSQL and Redis

redis集群配置

15天玩转redis(mark,redis学习系列)

Kafka:

快速理解Kafka分布式消息队列框架

Kafka可靠性的思考

Kafka 之 入门

Kafka深度解析

flume-kafka-storm日志处理经验

【采集层】Kafka 与 Flume 如何选择

Flume1.5.0入门:安装、部署、及flume的案例

Storm:

Storm快速理解

从Storm和Spark 学习流式实时分布式计算的设计

分布式与集群的区别

 

时间: 2024-10-23 08:27:56

大数据学习文章的相关文章

揭秘java大数据学习路线图

很多的同学在学习JavaEE的路上都过得的是坎坷,可以说是夜以继日的敲代码在学习,却发现自己是事倍功半,有的时候遇到一个bug真的很难受,无限互联java大数据培训专家为大家整理了一篇很值得大家去借鉴的学习路线图文章,希望大家在学习的路上一能帆风顺! 一.Java的核心 这就是学习Java的基础,掌握程度的深与浅甚至直接影响后面的整个学习进程. Java的核心主要包括了几个部分: 一. java大数据学习路线图 1.初级的有语法基础.面向对象思想. 学习任何一门语言语法都是必须的,因为Java的

史上最全“大数据”学习资源整理

史上最全"大数据"学习资源整理 当前,整个互联网正在从IT时代向DT时代演进,大数据技术也正在助力企业和公众敲开DT世界大门.当今"大数据"一词的重点其实已经不仅在于数据规模的定义,它更代表着信息技术发展进入了一个新的时代,代表着爆炸性的数据信息给传统的计算技术和信息技术带来的技术挑战和困难,代表着大数据处理所需的新的技术和方法,也代表着大数据分析和应用所带来的新发明.新服务和新的发展机遇. 为了帮助大家更好深入了解大数据,云栖社区组织翻译了GitHub Aweso

大数据学习-1 在阿里云上集成6台云服务器

一.为什么要大数据学习? 这是一个大数据的时代,一个企业只有掌握了大数据才能把握住市场的命脉,一个人掌握了大数据就可以比较轻松的向机器学习.人工智能等方向发展.所以我们有必要去掌握大数据的技术同时也关注大数据的发展趋势,不能裹足不前. 二.关于本专题的学习 作为一个普通本科大学生,在校的大数据学习比较的"水",普通大学嘛,大家都懂.在一个就是编程实战方向上的东西本来就该靠自学,而不是靠别人去教.我觉得大数据的学习是一个缓慢的过程,需要半年的时间去学习.我想在大二结束差不多就可以完成大数

大数据学习的思维原理(机器懂人原理篇)

我们在上一篇文章中给大家介绍了很多大数据学习的思维原理,对于这些思维原理都是需要大家掌握的,在这篇文章中我们给大家讲解一下机器懂人原理,希望这篇文章能够给大家带来帮助. 首先我们给大家说说什么是机器懂人原理,机器懂人原理就是由人懂机器转变为机器更懂人.这里说的不是让人更懂机器,而是让机器更懂人,或者说是能够在使用者很笨的情况下,仍然可以使用机器.甚至不是让人懂环境,而是让我们的环境来懂我们,环境来适应人,某种程度上自然环境不能这样讲,但是在数字化环境中已经是这样的一个趋势,就是我们所在的生活世界

大数据学习的思维原理(电子商务智能原理)

我们在前面的文章中给大家介绍了很多的大数据学习思维原理,这些内容对于大数据的学习都是很有帮助的,其实大数据的学习思维还是有很多的,我们在这篇文章给大家介绍一下电子商务智能原理. 电子商务智能原理就是大数据改变了电子商务模式,让电子商务更智能.商务智能,大数据时代重新获得定义.而现在,传统企业进入互联网,在掌握了"大数据"技术应用途径之后,会发现有一种豁然开朗的感觉,这些能够给我们带来很多的体验.而大数据时代不是说我们这个时代除了大数据什么都没有,哪怕是在互联网和IT领域,它也不是一切,

大数据学习的流程方案

大数据成为了当下发展的一种趋势,很多人去追求大数据的学习,但是苦于无从下手,今天编者根据自己的经验系统总结一下大数据学习的方略: 第一步:感性认识,找准思路 (1)看一些大数据发展及应用,了解市场形势 (2)阅读大数据相关书籍,了解知识架构 对上面基本知识有一个了解过程之后,明确自己的思路,就可以进入下一步学习; 第二步:理论学习,扎实基础 大数据平台学习路径:   预备课程 1. 大数据平台Linux基础 2. 大数据平台Java基础 3. 大数据平台Python基础   基础课程 1.  大

大数据学习一般都学什么

大数据已经成为发展的趋势,大数据的培训学习也就应运而生,可是大数据具体学习什么内容呢,众说纷纭: 那么大数据学习到底应该掌握哪些知识呢,笔者根据自己的经验总结如下: 学习要根据自身情况来定,如果你是零基础,那就必须先从基础java开始学起(大数据支持很多开发语言,但企业用的最多的还是JAVA),接下来学习数据结构.linux系统操作.关系型数据库,夯实基础之后,再进入大数据的学习,具体可以按照如下体系: 第一阶段 CORE JAVA (加**的需重点熟练掌握,其他掌握) Java基础** 数据类

大数据学习线路图

近期开始大数据的学习,在学习之前给给自己定义了一个大数据学习路线 大数据技术学习路线指南 一.Hadoop入门,了解什么是Hadoop 1.Hadoop产生背景2.Hadoop在大数据.云计算中的位置和关系3.国内外Hadoop应用案例介绍4.国内Hadoop的就业情况分析及课程大纲介绍5.分布式系统概述6.Hadoop生态圈以及各组成部分的简介7.Hadoop核心MapReduce例子说明二.分布式文件系统HDFS,是数据库管理员的基础课程1.分布式文件系统HDFS简介2.HDFS的系统组成介

大数据学习笔记6·社会计算中的大数据(4)

上一篇介绍了LifeSpec项目,这个项目是关于用户理解和用户画像的.这篇是社会计算部分的最后一篇,关于用户连接和图隐私. 用户连接与隐私保护 用户连接与隐私保护有很强的相关性. 上图中,左边有两个网络.对于用户连接,我们的目标是映射这两个网络和连接这些网络中的用户节点.然后,我们就能产生一个更大的网络.这样,用户就能够被连接在一起,我们就可以知道跨网络的用户信息. 但是,如果从隐私的角度来看这个问题,把第一个图看成一个匿名化处理后的图,称其为目标图:把第二张图看成辅助图或者攻击者可获得的信息.