在Windows上build Spark

在本机(Windows 8)上安装spark玩一玩,Spark的Quick Start上没有指明具体步骤,自己Build好了之后把步骤记录一下。

  1. 首先,到Spark的官网上下载Spark的压缩包,然后解压缩到本地文件夹。我下的是Spark 1.1.0,目前最新的release,链接spark-1.1.0.tgz
  2. 按照文档上运行bin/spark-shell,会提示找不到所需的jar包,需要重新build生成这个jar包。
  3. 首先确认本机是否已安装Scala和SBT,scala需要2.10.x版本,sbt我用的是0.13,如果没有安装的就从网上下载安装。将sbt的bin添加到windows path环境变量下,确保可以运行。
  4. 到Spark的root目录下,运行sbt package,这会将spark所有依赖的lib下载到本地的ivy repository(sbt默认使用ivy repository)
  5. 第四步成功完成之后,spark依赖的库已经具备,运行sbt assembly,这会将spark依赖的库和spark本身assemble成一个很大的jar包。这步完成后,你会在assembly\target\scala-2.10下找到spark-assembly-1.1.0-hadoop1.0.4.jar, spark-assembly_2.10-1.1.0.jar这两个jar包

上述步骤完成之后,就可以在bin下运行spark-shell,可以成功进入shell,进行操作。

时间: 2024-10-14 01:17:39

在Windows上build Spark的相关文章

在idea中调试spark程序-配置windows上的 spark local模式

spark程序大致有如下运行模式: standalone模式:spark自带的模式 spark on yarn:利用hadoop yarn来做集群的资源管理 local模式:主要在测试的时候使用, 这三个模式先大致了解,目前我用到的就是local和yarn.其中,我们写spark程序,一般在idea上写,若每次都要将程序打包,再上传到集群,再运行,将严重影响我们效率,所以在调试代码的时候,一般用local模式,在windows的idea上直接操作. 环境配置步骤如下:只做简要说明,各个步骤的具体

Windows上安装运行Spark

1.下载Scala: https://www.scala-lang.org/download/ ①注意:必须下载官方要求的JDK版本,并设置JAVA_HOME,否则后面将出现很多麻烦! ②Scala当前最新版本为 2.安装后在cmd中输入scala出现如下提示表示成功 3.下载Spark:http://spark.apache.org/downloads.html 4.进入spark-2.3.3-bin-hadoop2.7\bin,cmd中输入spark-shell ①出现下面错误,表示需要安装

windows上使用mkdocs搭建静态博客

windows上使用mkdocs搭建静态博客 之前尝试过用HEXO搭建静态博客,最近发现有个叫mkdocs的开源项目也是搭建静态博客的好选择,而且它支持markdown格式,下面简要介绍一下mkdocs的环境搭建过程 项目地址:https://github.com/mkdocs/mkdocs 介绍:英文版----http://www.mkdocs.org/ 中文版----http://markdown-docs-zh.readthedocs.io/zh_CN/latest/ 使用环境:win8.

Windows上编译GRPC

Windows上源码编译多数开源软件都很麻烦 编译环境:VS2015(grpc支持2013及以上,2012上没有Nuget,编译起来要费劲的多) 编译GRPC涉及内容 grpc protobuf grpc_protoc_plugin(本文以c++语言为编译目标,因此只涉及grpc_cpp_plugin) zlib grpc代码下载后,执行git submodule update --init初始化依赖的submodule 1. protobuf 参考readme用CMAKE生成工程文件,编译即可

Windows 上安装 Jekyll

Jekyll是一个静态网站生成工具.它允许用户使用HTML.Markdown或Textile来建立静态页面,然后通过模板引擎Liquid(Liquid Templating Engine)来运行. 原文链接:Setup Jekyll on Windows 目前,网上有许多Jekyll的安装方法,大都相似,为了方便更多准备学习Jekyll的人,特翻译如下: 共分为以下几个重要步骤 安装 Ruby 安装 DevKit 安装 Jekyll 安装 Pygments 安装 Python 安装 ‘Easy

在Windows上安装PyCUDA和Theano

最近几个月在学习Deep Learning,刚开始的时候什么条件都不具备.自己从淘宝上面买了一个GT 240,搭建一个GPU环境用于程序的调试.折腾了几个月,以前PyCUDA总是搭建失败,最近几天才尝试成功.为了学习Deep Learning的源代码,自己又搭建了Theano环境.由于时间紧张,自己概略总结如下,以备忘记. 一. 在Windows上安装PyCUDA 1. 安装条件 (1) pytools库 安装PyCUDA还需要pytools库,而pytools库又需要six,appdirs,d

记一次在Windows上搭建React Native Android环境踩过的坑

要说最近技术圈什么比较活跃,我想除了动态加载框架和热修复技术之外,非Facebook的React Native莫属了吧,其实RN对IOS的支持比较早,但是Android似乎难产了,直到9月份才刚开源.距离RN开源也有一段时间了,一直没有去学习,今天兴趣来潮,索性学一把吧. 本文假设你的Windows上安装了Android SDK,并配置好了环境变量. 安装Node.js 从官网https://nodejs.org/en/下载Node.js的windows版,也不知道为什么版本迭代这么快,之前安装

[图]Windows 10 Build 16273版本更新发布:新增可变式字体Bahnschrift

在经历了长达三周的等待之后,微软于今天终于面向Windows Insider项目的Fast通道用户发布了Windows 10 Build 16273版本更新.事实上,微软应该会在两周前就应该发布新版本,但是由于在内部测试过程中出现了某些BUG,从而导致更新推迟. 在经历了漫长的等待之后,微软于今天发布的新版本中并未包含任何新的功能,主要集中在BUG修复和后台性能改进方面.不过在细节方面系统还进行了一些改善,主要包括: My People上尝试全新的emoji 通知: 通过在任务栏上添加全新的Wi

如何实现在Windows上运行Linux程序,附示例代码

如何实现在Windows上运行Linux程序,附示例代码 微软在去年发布了Bash On Windows, 这项技术允许在Windows上运行Linux程序, 我相信已经有很多文章解释过Bash On Windows的原理,而今天的这篇文章将会讲解如何自己实现一个简单的原生Linux程序运行器, 这个运行器在用户层实现, 原理和Bash On Windows不完全一样,比较接近Linux上的Wine. 示例程序完整的代码在github上, 地址是 https://github.com/30324