spark学习（五）

（一）进入spark-shell命令界面（默认使用scala的命令界面）

　1,如果进入了spark安装目录则使用、

　　1，一台机器启动spark：./bin/spark-shell --master <master-url>命令可进入shell界面，master-url参数可为：local[*]使用逻辑CPU多线程启动，local[n]，使用n个CPU线程启动

　　2，集群下启动spark：spark：//主机IP:7077（默认端口）

　　3，在CLASSPATH中添加jar包：./bin/spark-shell --master local[4] --jars code.jar

　　4，退出：(:quit)

　2,Yarn集群模式：

　　yarn-client：客户端电脑不能关，调试阶段

　　yarn-cluster：客户端电脑关了不影响，正常使用阶段

　3,sbt是一款Spark用来对scala编写程序进行打包的工具（没安装成功）

原文地址：https://www.cnblogs.com/lq13035130506/p/12239342.html

时间： 2024-10-29 03:38:04

spark学习（五）的相关文章

Spark学习六：spark streaming

Spark学习六:spark streaming 标签(空格分隔): Spark Spark学习六spark streaming 一概述二企业案例分析三Spark streaming的工作原理四textFileStreaming的应用四企业中的开发方式五总结一,概述一个简单的实例 1,安装nc nc -lk 9999 2,启动应用 ./bin/run-example streaming.NeworkWordCount localhost 9999 二,企业案例分析需求: 实时统计

Spark学习八：spark streaming与flume和kafka集成

Spark学习八:spark streaming与flume和kafka集成标签(空格分隔): Spark Spark学习八spark streaming与flume和kafka集成一Kafka 二flume和kafka的集成三kafka和spark streaming的集成方式一kafka推送四kafka和spark streaming的集成方式一spark streaam主动获取五spark stream的高级应用updateStateByKey实现累加功能六spark stre

Spark学习笔记之SparkRDD

Spark学习笔记之SparkRDD 一. 基本概念 RDD(resilient distributed datasets)弹性分布式数据集. 来自于两方面 ① 内存集合和外部存储系统 ② 通过转换来自于其他RDD,如map,filter等 2.创建操作(creation operation):RDD的创建由SparkContext来负责. 3.转换操作(transformation operation):将一个RDD通过一定操作转换为另一个RDD. 4.控制操作(control o

Spark 学习: spark 原理简述与 shuffle 过程介绍

Spark学习: 简述总结 Spark 是使用 scala 实现的基于内存计算的大数据开源集群计算环境.提供了 java,scala, python,R 等语言的调用接口. Spark学习简述总结引言 1 Hadoop 和 Spark 的关系 Spark 系统架构 1 spark 运行原理 RDD 初识 shuffle 和 stage 性能优化 1 缓存机制和 cache 的意义 2 shuffle 的优化 3 资源参数调优 4 小结本地搭建 Spark 开发环境 1 Spark-Scal

Spark学习四：网站日志分析案例

Spark学习四:网站日志分析案例标签(空格分隔): Spark Spark学习四网站日志分析案例一创建maven工程二创建模板三日志分析案例一,创建maven工程 1,执行maven命令创建工程 mvn archetype:generate -DarchetypeGroupId=org.scala-tools.archetypes -DarchetypeArtifactId=scala-archetype-simple -DremoteRepositories=http://scal

Spark学习三：Spark Schedule以及idea的安装和导入源码

Spark学习三:Spark Schedule以及idea的安装和导入源码标签(空格分隔): Spark Spark学习三Spark Schedule以及idea的安装和导入源码一RDD操作过程中的数据位置二Spark Schedule 三Idea导入spark源码一,RDD操作过程中的数据位置 [hadoop001@xingyunfei001 spark-1.3.0-bin-2.5.0]$ bin/spark-shell --master local[2] val rdd = sc.t

Beaglebone Back学习五（PWM测试）

PWM测试参考链接 1 Enable PWM on BeagleBone with Device Tree overlays 2Using PWM on the Beaglebone Black 3 Beaglebone Coding 101: Buttons and PWM 4 Using PWM outputs 5 beaglebone-black-cpp-PWM 6 Enabling PWM Support in the kernel 7 Beaglebone Back学习五(PWM测试

TweenMax动画库学习(五)

目录 TweenMax动画库学习(一) TweenMax动画库学习(二) TweenMax动画库学习(三) TweenMax动画库学习(四) TweenMax动画库学习(五)

NodeJS学习五之网页显示

我们新建一个Server.js. 然后运行cmd 找到server.js 路径. node server.js 浏览器中输入http://localhost:8888/ 你会发现,网页上出现了 Hello World NodeJS学习五之网页显示,布布扣,bubuko.com

Spark学习七：spark streaming与flume集成

Spark学习七:spark streaming与flume集成标签(空格分隔): Spark 一,启动flume flume-conf.properties文件 agent002.sources = sources002 agent002.channels = channels002 agent002.sinks = sinks002 ## define sources agent002.sources.sources002.type = exec agent002.sources.sour