Ubuntu 14.10 下安装Spark

Spark 是一种与 Hadoop 相似的开源集群计算环境,不过最近非常火.下面介绍安装步骤.

1 安装scala

  1.1 我选用的是2.11.4,下载地址http://www.scala-lang.org/download/

  1.2 解压到文件夹

tar -xzvf scala-2.11.4.tgz 

  1.3 设置环境变量

sudo nano /etc/profile
export SCALA_HOME=/home/liucc/software/spark/scala-2.11.4
export PATH=$PATH:$SCALA_HOME/bin

  1.4 检查是否安装成功

scala -version

2 安装Spark

  2.1 下载编译好的spark,我是看了这个博主写的http://www.aboutyun.com/thread-8160-1-1.html,我选的是hadoop2.2.0

下载预编译好的Spark, (32位、64都可以)

hadoop1安装包

链接:http://pan.baidu.com/s/1c0kZMLE

密码:d4om

hadoop2安装

链接:http://pan.baidu.com/s/1kT3czFD

密码:elpg

2.2 解压到相应目录

tar -xzvf spark-1.0.0-bin-hadoop2.tgz

  2.3 设置SPARK_HOME

export SPARK_EXAMPLES_JAR=/home/liucc/software/spark/spark-1.0.0/examples/target/scala-2.11.4/spar$
export SPARK_HOME=/home/liucc/software/spark/spark-1.0.0

  备注:SPARK_EXAMPLES_JAR的设置是摘抄自pig2:这一步其实最关键,很不幸的是,官方文档和网上的博客,都没有提及这一点。我是偶然看到了这两篇帖子,Running SparkPi, Null pointer exception when running ./run spark.examples.SparkPi local,才补上了这一步,之前死活都无法运行SparkPi。

  2.4 配置Spark,进入到conf目录下面,配置spark-env.sh文件

cp spark-env.sh.template spark-env.sh
nano spark-env.sh
export JAVA_HOME=/usr/dev/jdk1.7.0_51
export SCALA_HOME=/home/liucc/software/spark/scala-2.11.4

  2.5 至此配置完毕,可以启动试试,进入sprk目录,可以通过 http://centos.host1:8080/ 看到对应界面

sbin/start-master.sh

3 测试,下面在spark上运行第一个例子:与Hadoop交互的WordCount

  3.1 将文件上传到hadoop中

  3.2 进入spark-shell,进入spark根目录

bin/spark-shell

  3.3 输入scala语句,不熟悉的话,可以去学习一下,有个公开课https://class.coursera.org/progfun-005,很不错

val file=sc.textFile("要统计的文件")
val count=file.flatMap(line=>line.split(" ")).map(word=>(word,1)).reduceByKey(_+_)
count.collect()

  如果没错的话会看到结果

  3.4 可以将结果上传到hadoop

count.saveAsTextFile("要保存的目录")

---------------------------------------------------------------------------------------

  完毕,当然,也可以在Eclipse   中用java测试,网上很多了

时间: 2024-08-28 17:49:31

Ubuntu 14.10 下安装Spark的相关文章

Ubuntu 14.10 下安装伪分布式hive-0.14.0

本地独立模式,MySQL作为元数据库 1 安装环境准备 1.1 安装JDK,在安装hadoop时候已经安装了,参考http://www.cnblogs.com/liuchangchun/p/4097286.html 1.2 安装hadoop,参考http://www.cnblogs.com/liuchangchun/p/4097286.html 1.3 安装MySQL数据库,参考http://www.cnblogs.com/liuchangchun/p/4099003.html 1.4 新建hi

Ubuntu 14.10 下安装rabbitvcs-版本控制

在Windows下用惯了TortoiseSVN这只小乌龟,到了Ubuntu下很不习惯命令行的SVN,于是经过一番寻找安装了RabbitVCS这款SVN图形化前端工具(官方网站:http://rabbitvcs.org/),界面和功能可以说几乎和TortoiseSVN一模一样,与Nautilus整合程度很高,右键菜单.文件夹图标等等使用习惯一个都不落下!而且还有Git等功能,这绝对算得上是最佳替代品.至于兔子是是否能够跑得过乌龟,需要大家的检验了~ 废话不多说,开始安装了!在终端输入如下命令添加源

Ubuntu 14.10下安装深度音乐客户端

很多刚从windows系统投靠到ubuntu的机油,在听音乐时不是很舒心.毕竟ubuntu软件中心的很多影音软件都是国外的朋友编写的,所以很多时候国内的朋友用着很不舒服.今天给大家推荐的是国内开发者针对国内用户开发的影音和音乐播放软件. 在网上找到的教程奉上 第一步: 打开终端(怎么打开终端不用解释了吧,不懂的话百度)sudo gedit /etc/apt/sources.list在文件最后面添加deb http://mirror.csclub.uwaterloo.ca/debian-multi

Ubuntu 14.10 下安装navicat

1 下载navicat,网址http://www.navicat.com.cn/download,我下载的是navicat111_premium_cs.tar.gz 2 解压到合适的位置 3 进入解压目录,运行命令,启动navicat ./start_navicat 至此,安装结束,但是我第一次安装,启动发现没反映,重装了一下wine就好了 sudo apt-get install wine 4 其它问题 4.1 如果数据库中文乱码,那么修改下ubuntu的系统编码 locale -a expo

Ubuntu 14.10 下安装SVN

本文主要介绍SVN独立服务器的的安装和简单配置:1.安装(CentOS下yum即可方便的完成安装) # yum install subversion 测试安装是否成功: # svnserve --version 回车显示版本说明安装成功 2.建立版本库 # mkdir /svn_repository 创建svn数据目录(目录可自行制定) # svnadmin create /svn_repository/myfirst myfirst就是版本库的名字,可以改变! 3.配置svn配置文件(为了方便

Ubuntu 14.10 下安装MySQL

1 安装服务器 sudo apt-get install mysql-server 2 安装客户端 sudo apt-get install mysql-clientsudo apt-get install libmysqlclient-dev 安装过程需要设置用户名密码,不要忘记了 3 检查系统中是否有MySQL服务,出现下面的大概就是成功了 netstat -tap|grep mysql tcp 0 0 *:mysql *:* LISTEN 6153/mysqld 4 简单配置 4.1 设置

Ubuntu 14.10 下安装Ambari

安装Nodejs # apt-get update # apt-get install -y python-software-properties software-properties-common # add-apt-repository ppa:chris-lea/node.js # apt-get update # apt-get install nodejs 当然也可以下载官方网站编译好的文件

ubuntu 15.10下安装PyQt5

目标是  http://www.oschina.net/p/pyqt 开源中国 客户端 1 http://pyqt.sourceforge.net/Docs/PyQt5/installation.html#configuring-pyqt5 下载安装  http://www.riverbankcomputing.com/software/pyqt/download5 Error: PyQt5 requires Qt v5.0 or later I want to install PyQt5 on

ubuntu 14.04下安装clang_complete

ubuntu 14.04下安装vim的C++补全插件clang_complete 1.安装clang apt-get install clang 2.安装libclang apt-get install  libclang-dev 3.安装clang_complete插件 git clone https://github.com/Rip-Rip/clang_complete cd clang_complete make install 4.修改.vimrc let g:clang_complet