大数据学习贴（1）－环境搭建

最近开始准备系统的把自己所学过的大数据理论知识给落地实践，报了一个培训班。为了督促自己的实践学习，会将自己学习实践过程中的一些内容做一个总结。一方面梳理自己的理论知识，一方面加强理论与实践之间的有效链接。

虚拟机

这个可谓是大数据迈向实践的第一步，首先要在自己的PC上装虚拟机。我用的是VMware 12，虚拟机是装上了，这一步还是比较容易。但是在设置相关虚拟机IP及网关上卡住了。这一块估计今天还得再深入研究一下才能得到较好的答案。

虚拟机的安装，加载,设置是大数据的基础，而这一部分对于自己来说却是完全是新的内容。因为大数据分析基本上都是在服务器端的分析较多，后期势必会在虚拟机上实现远端与近端的链接。对虚拟机的了解，及python基础编程也要有一个大致的了解。

前两天认真的把大数据基础视频看完了，感觉还是没有完全掌握。这两天再多多实践几下，看是否可以跑的起来。毕竟，只有把这些基础的东西装完之后，再跑起来相关的组件才会对整个业务场景理解更深。解决的办法主要有以下几个步骤：

1，重新装一个VMware的客户端，将自己已经加载的虚拟机在上边开起来。

2，对照视频学会相关虚拟机的IP设置。确保网络能通。

3，在主机端CRT软件可以远程监控到相关的虚拟机，确保能进行相关命令加载。

4，加载mapreduce，hadoop组件

截止时间：本周内。

时间： 2024-08-04 05:42:33

大数据学习贴（1）－环境搭建的相关文章

《OD大数据实战》hive环境搭建

一.搭建hadoop环境 <OD大数据实战>hadoop伪分布式环境搭建二.hive环境搭建 1. 准备安装文件下载地址: http://archive.cloudera.com/cdh5/cdh/5/ hive-0.13.1-cdh5.3.6.tar.gz 2. 解压 tar -zxvf hive-0.13.1-cdh5.3.6.tar.gz -C /opt/modules/cdh/ 3. 修改配置 cd /opt/modules/cdh/hive-0.13.1-cdh5.3.6/con

大数据 -- Hadoop集群环境搭建

首先我们来认识一下HDFS, HDFS(Hadoop Distributed File System )Hadoop分布式文件系统.它其实是将一个大文件分成若干块保存在不同服务器的多个节点中.通过联网让用户感觉像是在本地一样查看文件,为了降低文件丢失造成的错误,它会为每个小文件复制多个副本(默认为三个),以此来实现多机器上的多用户分享文件和存储空间. Hadoop主要包含三个模块: HDFS模块:HDFS负责大数据的存储,通过将大文件分块后进行分布式存储方式,突破了服务器硬盘大小的限制,解决了单

大数据测试之hadoop单机环境搭建(超级详细版)

友情提示:本文超级长,请备好瓜子 Hadoop的运行模式单机模式是Hadoop的默认模式,在该模式下无需任何守护进程,所有程序都在单个JVM上运行,该模式主要用于开发和调试mapreduce的应用逻辑: 伪分布式模式下,Hadoop守护进程运行在一台机器上,模拟一个小规模的集群.该模式在单机模式的基础上增加了代码调试的功能,允许你检查NameNode,DataNode,Jobtracker,Tasktracker等模拟节点的运行情况: 单机模式和伪分布式模式均用于开发和调试的目的,真实Hado

大数据学习系列之七 ----- Hadoop+Spark+Zookeeper+HBase+Hive集群搭建图文详解

引言在之前的大数据学习系列中,搭建了Hadoop+Spark+HBase+Hive 环境以及一些测试.其实要说的话,我开始学习大数据的时候,搭建的就是集群,并不是单机模式和伪分布式.至于为什么先写单机的搭建,是因为作为个人学习的话,单机已足以,好吧,说实话是自己的电脑不行,使用虚拟机实在太卡了... 整个的集群搭建是在公司的测试服务搭建的,在搭建的时候遇到各种各样的坑,当然也收获颇多.在成功搭建大数据集群之后,零零散散的做了写笔记,然后重新将这些笔记整理了下来.于是就有了本篇博文. 其实我在搭

大数据学习系列之七 ----- Hadoop+Spark+Zookeeper+HBase+Hive集

引言在之前的大数据学习系列中,搭建了Hadoop+Spark+HBase+Hive 环境以及一些测试.其实要说的话,我开始学习大数据的时候,搭建的就是集群,并不是单机模式和伪分布式.至于为什么先写单机的搭建,是因为作为个人学习的话,单机已足以,好吧,说实话是自己的电脑不行,使用虚拟机实在太卡了... 整个的集群搭建是在公司的测试服务搭建的,在搭建的时候遇到各种各样的坑,当然也收获颇多.在成功搭建大数据集群之后,零零散散的做了写笔记,然后重新将这些笔记整理了下来.于是就有了本篇博文. 其实我在搭

大数据学习系列之四 ----- Hadoop+Hive环境搭建图文详解(单机)

引言在大数据学习系列之一 ----- Hadoop环境搭建(单机) 成功的搭建了Hadoop的环境,在大数据学习系列之二 ----- HBase环境搭建(单机)成功搭建了HBase的环境以及相关使用介绍.本文主要讲解如何搭建Hadoop+Hive的环境. 一.环境准备 1,服务器选择本地虚拟机操作系统:linux CentOS 7 Cpu:2核内存:2G 硬盘:40G 说明:因为使用阿里云服务器每次都要重新配置,而且还要考虑网络传输问题,于是自己在本地便搭建了一个虚拟机,方便文件的传输以

大数据学习系列之六 ----- Hadoop+Spark环境搭建

引言在上一篇中大数据学习系列之五 ----- Hive整合HBase图文详解 : http://www.panchengming.com/2017/12/18/pancm62/ 中使用Hive整合HBase,并且测试成功了.在之前的大数据学习系列之一 ----- Hadoop环境搭建(单机) : http://www.panchengming.com/2017/11/26/pancm55/ 中成功的搭建了Hadoop的环境,本文主要讲的是Hadoop+Spark 的环境.虽然搭建的是单机版,

搭建大数据hadoop完全分布式环境遇到的坑

搭建大数据hadoop完全分布式环境,遇到很多问题,这里记录一部分,以备以后查看. 1.在安装配置完hadoop以后,需要格式化namenode,输入指令:hadoop namenode -format,报错误信息:hadoop: command not found 本文网址:https://www.cnblogs.com/SH170706/p/10312667.html 2. 原文地址:https://www.cnblogs.com/SH170706/p/10312678.html

大数据学习线路图

近期开始大数据的学习,在学习之前给给自己定义了一个大数据学习路线大数据技术学习路线指南一.Hadoop入门,了解什么是Hadoop 1.Hadoop产生背景2.Hadoop在大数据.云计算中的位置和关系3.国内外Hadoop应用案例介绍4.国内Hadoop的就业情况分析及课程大纲介绍5.分布式系统概述6.Hadoop生态圈以及各组成部分的简介7.Hadoop核心MapReduce例子说明二.分布式文件系统HDFS,是数据库管理员的基础课程1.分布式文件系统HDFS简介2.HDFS的系统组成介

大数据学习路线

偶遇大数据学习路线,赶上一次科技革命不容易,追求下,要有所作为! 一.Hadoop入门,了解什么是Hadoop 1.Hadoop产生背景2.Hadoop在大数据.云计算中的位置和关系3.国内外Hadoop应用案例介绍4.国内Hadoop的就业情况分析及课程大纲介绍5.分布式系统概述6.Hadoop生态圈以及各组成部分的简介7.Hadoop核心MapReduce例子说明二.分布式文件系统HDFS,是数据库管理员的基础课程 1.分布式文件系统HDFS简介2.HDFS的系统组成介绍3.HDFS的组成

猜你喜欢

自定义一个处理图片的HttpHandler

有时项目里我们必须将图片进行一定的操作,例如水印,下载等,为了方便和管理我们可以自定义一个HttpHander 来负责这些工作后台: public class ImageHandler : IHtt ...

安装Aptana以及安装jquey 支持的过程

在安装Aptana的时候,如果遇到错误 http://go.appcelerator.com/installer_nodejs_windows.msi 那么需要根据link下载node-v0.10.1 ...

SpringBoot JPA实现增删改查、分页、排序、事务操作等功能

今天给大家介绍一下SpringBoot中JPA的一些常用操作,例如:增删改查.分页.排序.事务操作等功能.下面先来介绍一下JPA中一些常用的查询操作: //And --- 等价于 SQL 中的 and ...

每天专注三件事

原文作者:Jeff Atwood 我曾经在一篇博文中表达过自己对使用To-Do列表来管理待办事项的幻灭. 今天,让我们来尝试简单一点的做法--一次小小的试验.你用什么来跟踪你须要做的事情呢?把它举起来 ...

【VMware虚拟化解决方案】VMware Horizon View Client 各平台配置文档

云桌面用户手册 XXXX部 2014年05月18日文档版本文档名称 XXXX公司云桌面用户手册保密级别商密文档版本编号 1.0 制作人制作日期 2014-04-24 复审人复审日期扩散 ...

UCloud 的安全秘钥

UCloud 的安全秘钥(困难) 1200ms 262144K 每个 UCloud 用户会构造一个由数字序列组成的秘钥,用于对服务器进行各种操作.作为一家安全可信的云计算平台,秘钥的安全性至关重要.因 ...

Java 控制台模拟福彩3D 系统

谁有兴趣可以做一个GUI 界面的; 1 import java.util.*; 2 public class Test4{ 3 // 这个集合存放中奖号码数据: 4 static List<In ...

安卓自带浏览器 position:fixed时图片模糊问题

最近遇到一个问题:给一个div做position:fixed时,div里的图片在小米1s自带浏览器里面图片显示模糊了,而其它浏览器图片都是清楚的(说明:已经是2倍的图片了).代码如下: <div ...

无序数组中位数

(1) 最小堆算法首先将数组的前(n+1)/2个元素建立一个最小堆. 然后,对于下一个元素,和堆顶的元素比较,如果小于等于,丢弃之,接着看下一个元素.如果大于,则用该元素取代堆顶,再调整堆,接着看下 ...

mysql 连接数的最大数

mysql默认最大连接数是100,增加加默认MYSQL连接数的方法有两个方法一:进入MYSQL安装目录打开MYSQL配置文件 my.ini(windows) 或 my.cnf(linux环境)查找 ...

android studio 加载第三方类库

以引入Xutil包为例 1. 将Xutil包导入到module的libs目录下 2. File->project structure 还有一种方法是在libs目录下右键点击Add as libr ...

MinGW下构建Bullet

MinGW下构建Bullet 在Windows的MinGW下构建Bullet,采用其自带的premake4来进行. 操作步骤(使用cmd): 1.设置MinGW的路径 set path=%path%; ...

centos 安装 mysql5.6

先到官网下载 http://www.mysql.com/downloads/ 我是放在/root/download下面的先解压 unzip V47187-01.zip tar zxvf mysql ...

采用jsp页面与java代码分离的方式写一个简单的二维表

前提:在我们做程序时追求的是高内聚,低耦合,但是如果我们把jsp页面的的代码和java的代码都放在了jsp的代码编写中,使java和jsp高耦合这样的话不仅使jsp代码页面显得很复杂,而且也特别让不利 ...

mac OS.NE开发环境搭建

合肥程序员群:49313181. 合肥实名程序员群:128131462 (不愿透露姓名和信息者勿加入,申请备注填写姓名+技术+工作年限) Q Q:408365330 E-Mail:[e ...

常用数据库高可用和分区解决方案(2) — MongoDB篇

MongoDB是当前比较流行的文档型数据库,其拥有易使用.易扩展.功能丰富.性能卓越等特性.MongoDB本身就拥有高可用及分区的解决方案,分别为副本集(Replica Set)和分片(shardin ...

bzoj4571 [Scoi2016]美味

Description 一家餐厅有 n 道菜,编号 1...n ,大家对第 i 道菜的评价值为 ai(1≤i≤n).有 m 位顾客,第 i 位顾客的期望值为 bi,而他的偏好值为 xi .因此,第 ...

jquery动态增加或删除tr和td【实际项目】

难点: (1)动态增加.删除tr和td (2)每天tr和td都有下标,且下标要动态变化, (3)tr和td为什么下标不能随便写,原因是此处需要把所有tr中的数据以list的形式发送到后台对象中,所有每 ...

tcp/ip详解笔记(3)

IP协议: IP是TCP/IP里非常重要的协议,我们发送的TCP UDP ICMP IGMP等数据都要经过IP层的封装后才能进行传输. IP协议提供不可靠的无连接的服务.不可靠表现在:它不保证数据报 ...

SpringMVC使用@Controller注解为什么要配置<mvc:annotation-driven />

自己看了官方文档,也到网上查了下,目前理解如下: <mvc:annotation-driven/>相当于注册了DefaultAnnotationHandlerMapping和Annotat ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.022 s.