关于Linux下Spark的配置

1 如果你是用scala,当我没说。这个随意都能搞得定

2 如果你是用python,你可以继续往后看。

因为spark的全量的安装包自己带的hadoop的环境,所以不需要自己去再配一个hadoop。[如果你有的话,则得确保版本兼容之类的时期]

单独解压缩一个spark的包,然后去修改相应的配置文件。[反正我是没有去配yarn的和hadoop的,直接默认,这里面坑太多了]

3 别忘记安装pyspark和py4j,anaconda 直接用pip就好。如果是anaconda用户,记得创建一个python的环境,conda create --name python python=3.6(这个是版本号,自己定义)

4 有了python环境了就可以去spark下面去试用python文件夹下的pyspark了。这个demo有的是,随便搜

5 pycharm也要改东西,这个也搜的到,无非就是PYTHON_PATH和SPARK_HOME之类的。

6 借助os的包:

import findsparkimport osPYSPARK_PYTHON = "/home/promoriarty/anaconda3/bin/python"os.environ["PYSPARK_PYTHON"] = PYSPARK_PYTHONfrom pyspark import SparkConf,SparkContext

conf = SparkConf().setAppName("test").setMaster("local")sc = SparkContext(conf=conf)text = sc.textFile("file:///home/promoriarty/1")text.foreach(print)

反正我是这样把demo跑起来了。。折腾了好久。。

参考:http://blog.csdn.net/huobanjishijian/article/details/52538078 真是谢谢这个老哥了。
时间: 2024-11-13 19:06:52

关于Linux下Spark的配置的相关文章

Linux下Spark框架配置(Python)

简述  Spark是UC Berkeley AMP lab所开源的类Hadoop MapReduce的通用并行框架,Spark,拥有Hadoop MapReduce所具有的优点:但不同于MapReduce的是Job中间输出结果可以保存在内存中,从而不再需要读写HDFS,因此Spark能更好地适用于数据挖掘与机器学习等需要迭代的MapReduce的算法.由于spark带有Python的API,而本人比较专于Python语言.因此在此分享一下我在配置spark的方法以及心得. 配置过程 步骤一: 下

Linux下Redis服务器安装配置

说明:操作系统:CentOS1.安装编译工具yum install wget  make gcc gcc-c++ zlib-devel openssl openssl-devel pcre-devel kernel keyutils  patch perl 2.安装tcl组件包(安装Redis需要tcl支持)cd /usr/local/src #进入软件包存放目录wget  http://downloads.sourceforge.net/tcl/tcl8.6.6-src.tar.gztar 

Linux下PHP安装配置MongoDB数据库连接扩展

说明: 操作系统:CentOS 5.X 64位 MongoDB数据库服务器: IP地址:192.168.21.130 Web服务器: IP地址:192.168.21.127 PHP安装路径:/usr/local/php 实现目的: 安装PHP的MongoDB数据库扩展,通过PHP程序连接MongoDB数据库 具体操作: 一.安装PHP的MongoDB数据库扩展(在Web服务器192.168.21.127上操作) 下载地址:http://pecl.php.net/get/mongo-1.5.1.t

VMware Linux 下 Nginx 安装配置 - nginx.conf 配置 [负载两个 Tomcat] (三)

首先启动Nginx 1. 转到 nginx 目录: /usr/local/nginx; 启动 nginx: /usr/local/nginx/nginx ubuntu 前要加 sudo; 关健配置 http 配置块下,一般设置在 zgip on 下: upstream localhost { #绿色对应 #ip_hash; server localhost:8090; server localhost:8080; } server / { location / { proxy_connect_t

PHP扩展类ZipArchive实现压缩解压Zip文件和文件打包下载 && Linux下的ZipArchive配置开启压缩

PHP ZipArchive 是PHP自带的扩展类,可以轻松实现ZIP文件的压缩和解压,使用前首先要确保PHP ZIP 扩展已经开启,具体开启方法就不说了,不同的平台开启PHP扩增的方法网上都有,如有疑问欢迎交流.这里整理一下常用的示例供参考. 一.解压缩zip文件 ? 1 2 3 4 5 6 7 8 9 10 11 $zip = new ZipArchive;//新建一个ZipArchive的对象 /* 通过ZipArchive的对象处理zip文件 $zip->open这个方法的参数表示处理的

Linux下IP地址配置

ifconfig -a 查看linux下的网卡配置 dhclient dhcp获得IP vi /etc/sysconfig/netwaork-scripts/ifcfg-eth0 IPADDR=192.168.199.200NETMASK=255.255.255.0GATEWAY=192.168.199.1DNS1=192.168.199.1DNS2=223.5.5.5 service network restart ifdown eth0ifup eth0

Linux下SVN服务器安装配置及客户端安装说明

原文地址:http://wenku.baidu.com/link?url=h3dVAMx4azpOXEND5HQEE6nliE8-zc0GSQ03yv4cUs1vXMALXF64UsK7kT7kXm_zf7k6J6EHSszq4ZU_Tyn0JimTKV8SzI9Ac4veaxCG3im Linux 下 SVN 服务器安装配置 第一章 安装 1. 采用源文件编译安装.源文件共两个,为: subversion-1.6.1.tar.gz ( subversion 源文件) subversion-de

Linux下git安装配置

一.Linux下git安装配置 2013-07-28 20:32:10|  分类: 默认分类 |  标签:linux  git  server  |举报|字号 订阅 http://abomby.i.sohu.com/blog/view/168755260.htm http://www.linuxidc.com/Linux/2011-12/48555.htm Git是分布式的版本控制系统,实际上是不需要固定的服务器的,Git与svn的最大区别是,它的使用流程不需要联机,可以先将对代码的修改,评论,

Linux 下configure 参数配置与软件的安装与卸载

Linux环境下的软件安装,并不是一件容易的事情:如果通过源代码编译后在安装,当然事情就更为复杂一些:现在安装各种软件的教程都非常普遍:但万变不离其中,对基础知识的扎实掌握,安装各种软件的问题就迎刃而解了.Configure脚本配置工具就是基础之一,它是autoconf的工具的基本应用. 'configure'脚本有大量的命令行选项.对不同的软件包来说,这些选项可能会有变化,但是许多基本的选项是不会改变的.带上'--help'选项执行'configure'脚本可以看到可用的所有选项.尽管许多选项