spark学习二

SparkContext是编写Spark程序用到的第一个类，是Spark的主要入口点，用于连接
Spark集群、创建RDD、累加器和广播变量，是Spark程序的根本。
编写不同类型的Spark程序，使用的SparkContext是不同的
Scala 使用SparkContext
Java 使用JavaSparkContext

开发一个简单的Spark程序：
第一步：创建SparkConf对象，设置Spark应用的配置信息
第二步：创建Spark Context对象
第三步：针对输入源创建一个初始的RDD（数据集），输入源数据分配到不同的区，形成初始的分布式数据集
SparkContext中，用于根据文件类型的输入源常见RDD的方法叫textFile（）方法

今天安装Scala，并学习了Scala语言一些基本的语法，

scala 方法声明格式：def functionName ([参数列表]) : [return type]

例：

object add{
   def addInt( a:Int, b:Int ) : Int = {
      var sum:Int = 0
      sum = a + b

return sum
}
}

Scala的输入语句：val name = StdIn.readLine()

完成了实验二

import scala.io.StdIn
object exercise
  {
   def main(args:Array[String])
  {
      println("请输入n")
      var n:Long=StdIn.readLine().toLong
      var sum=0.0
      var a=1.0
      while(sum<n)
  {
         sum=sum+(a+1)/a
         a=a+1
   }
    println("Sn="+sum)
   }
   }

　　

　　

原文地址：https://www.cnblogs.com/zhang12345/p/12250007.html

时间： 2024-07-31 06:47:00

spark学习二的相关文章

spark 学习(二) RDD及共享变量

声明:本文基于spark的programming guide,并融合自己的相关理解整理而成 Spark应用程序总是包含着一个driver program(驱动程序),它执行着用户的main方法,并且执行大量的并行操作(parallel operations)在集群上. 概述 Spark最主要的抽象就是RDD(resilient distributed dataset) 弹性分布式数据集,RDD 就是分割元素的集合,他被分发在集群的各个节点上,并且能够进行并行操作. RDD的创建有三种方式: H

Spark学习四：网站日志分析案例

Spark学习四:网站日志分析案例标签(空格分隔): Spark Spark学习四网站日志分析案例一创建maven工程二创建模板三日志分析案例一,创建maven工程 1,执行maven命令创建工程 mvn archetype:generate -DarchetypeGroupId=org.scala-tools.archetypes -DarchetypeArtifactId=scala-archetype-simple -DremoteRepositories=http://scal

Spark学习三：Spark Schedule以及idea的安装和导入源码

Spark学习三:Spark Schedule以及idea的安装和导入源码标签(空格分隔): Spark Spark学习三Spark Schedule以及idea的安装和导入源码一RDD操作过程中的数据位置二Spark Schedule 三Idea导入spark源码一,RDD操作过程中的数据位置 [hadoop001@xingyunfei001 spark-1.3.0-bin-2.5.0]$ bin/spark-shell --master local[2] val rdd = sc.t

Spark学习七：spark streaming与flume集成

Spark学习七:spark streaming与flume集成标签(空格分隔): Spark 一,启动flume flume-conf.properties文件 agent002.sources = sources002 agent002.channels = channels002 agent002.sinks = sinks002 ## define sources agent002.sources.sources002.type = exec agent002.sources.sour

Spark学习六：spark streaming

Spark学习六:spark streaming 标签(空格分隔): Spark Spark学习六spark streaming 一概述二企业案例分析三Spark streaming的工作原理四textFileStreaming的应用四企业中的开发方式五总结一,概述一个简单的实例 1,安装nc nc -lk 9999 2,启动应用 ./bin/run-example streaming.NeworkWordCount localhost 9999 二,企业案例分析需求: 实时统计

Spark学习八：spark streaming与flume和kafka集成

Spark学习八:spark streaming与flume和kafka集成标签(空格分隔): Spark Spark学习八spark streaming与flume和kafka集成一Kafka 二flume和kafka的集成三kafka和spark streaming的集成方式一kafka推送四kafka和spark streaming的集成方式一spark streaam主动获取五spark stream的高级应用updateStateByKey实现累加功能六spark stre

Spark学习笔记之SparkRDD

Spark学习笔记之SparkRDD 一. 基本概念 RDD(resilient distributed datasets)弹性分布式数据集. 来自于两方面 ① 内存集合和外部存储系统 ② 通过转换来自于其他RDD,如map,filter等 2.创建操作(creation operation):RDD的创建由SparkContext来负责. 3.转换操作(transformation operation):将一个RDD通过一定操作转换为另一个RDD. 4.控制操作(control o

[Python 学习] 二、在Linux平台上使用Python

这一节,主要介绍在Linux平台上如何使用Python 1. Python安装. 现在大部分的发行版本都是自带Python的,所以可以不用安装.如果要安装的话,可以使用对应的系统安装指令. Fedora系统:先以root登入,运行 yum install python Ubuntu系统:在root组的用户, 运行 sudo apt-get install python 2. 使用的Python的脚本 Linux是一个以文件为单位的系统,那么我们使用的Python是哪一个文件呢? 这个可以通过指令

Spark 学习: spark 原理简述与 shuffle 过程介绍

Spark学习: 简述总结 Spark 是使用 scala 实现的基于内存计算的大数据开源集群计算环境.提供了 java,scala, python,R 等语言的调用接口. Spark学习简述总结引言 1 Hadoop 和 Spark 的关系 Spark 系统架构 1 spark 运行原理 RDD 初识 shuffle 和 stage 性能优化 1 缓存机制和 cache 的意义 2 shuffle 的优化 3 资源参数调优 4 小结本地搭建 Spark 开发环境 1 Spark-Scal

猜你喜欢

Python面向对象程序设计第一弹

类和对象: 定义类: class 类名: 属性方法定义类的对象: 类的对象名=类名() 类的属性:分为公有和私有,类似于c++的private和public,私有变量名前面添加__ 构造函数:在创 ...

STM32初学Keil4编译时出现 Error:Failed to execute 'BIN40/Armcc'

一种是在系统开始--运行里输入cmd,查看armcc状态.详情见推文: http://blog.csdn.net/hicui/article/details/7350805(笔记记录,请勿见怪) 都没 ...

九章算法培训，第一天

第一节课主要讲了SubSet,因为每次开课例子差不多,所以老师对这些题的理解与把握是比较熟悉的, 上课直接手写代码然后直接进行点评,这点是比较赞的关于一些针对面试的东西,就不多说了, 我个人是比较 ...

在Visual Studio中使用Git命令提示符

VS2015自带了Git插件,但有时候我觉得Git控制台命令更方便些. VS中本身不能把Git Bush作为浮动窗集成进来,但我们可以通过Power Shell来使用Git命令. ---------- ...

tableView优化性能

在iOS应用中,UITableView应该是使用率最高的视图之一了.iPod.时钟.日历.备忘录.Mail.天气.照片.电话.短信. Safari.App Store.iTunes.Game Cent ...

UIMenuController在label中的使用

要想在label中使用必须是继承于label的分类 //// MYlabel.m// MenuController//// Created by 张明 on 16/3/8.// Copyri ...

Codeforces 19D(线段树+离散化)

题意:题意很好理解,三种操作: (1)add x y,添加坐标(x,y),(2)del x y,删除坐标(x,y),(3)find x y,找到并输出严格大于(x,y)的坐标里的最小坐标. 题解:因为 ...

Django REST框架 -序列化

建立一个新的环境在我们做任何事情之前,我们将使用virtualenv创建一个新的虚拟环境.这将确保我们的包配置与我们正在开展的任何其他项目保持良好的隔离. virtualenv env source ...

C# t4模版引擎笔记引入外部dll

<#@ assembly name="D:\Documents\Downloads\Util\Util\bin\Debug\Util.dll" #> <#@ im ...

;(function($) { var defaults = { pagecurrent: 1, //当前页码 pagecount:1, //页码总数 first_text: '首页', //首页按钮 ...

（转）WPF中让窗体不显示最大化，最小化，关闭按钮

1.在WPF中如果不想让窗体显示最大化,最小化,以及关闭按钮的话,可以再窗体的属性面板设置将ResizeMode=NoResize时,将不会显示最大化最小化,只有关闭按钮:如下图: 将ResizeM ...

pmd静态代码分析

在正式进入测试之前,进行一定的静态代码分析及code review对代码质量及系统提高是有帮助的,以上为数据证明 Pmd 它是一个基于静态规则集的Java源码分析器,它可以识别出潜在的如下问题:– 可 ...

【Android】15.2 广播

分类:C#.Android.VS2015: 创建日期:2016-02-29 一.简介 Android系统和你自己编写的应用程序都可以通过Indent发送和接收广播信息.广播的内容既可以是自定义的信息, ...

让PC端页面在手机端正常显示，同比缩小

<meta name="apple-mobile-web-app-capable" content="yes"> <meta name=&q ...

设置eclipse编码方式

修改eclipse默认工作空间编码方式.点击“Window->Preferences->General->Workspace->Other”

NS3网络仿真（3）： NetAnim

快乐虾 http://blog.csdn.net/lights_joy/ 欢迎转载,但请保留作者信息在NS3提供的示例first.py中,并没有生成NetAnim所需要的xml文件,本节我们尝试用N ...

HDU ACM 1057 A New Growth Industry 简单模拟

题意:给一个天数N,求20*20方阵内细菌的变化情况.每次变化加上一个d[k],d数组有给定的16个数.k是某个格子它本身加上它上下左右的四个数. 简单模拟题. 分析: #include<ios ...

xtrabackup备份与恢复

一:安装xtrabackup 二:备份:完全备份+二进制日志三:恢复:完全备份+二进制日志四:完全备份+增量备份五:恢复:完全备份 1.1如果遇到如下问题是因为需要依赖包 1.2解决方法 yum ...

mongodb runcommand group使用方法

db.runCommand( { group: { ns:"testc", key:{name:null}, initial:{num:0}, $reduce:function(d ...

史上最全的hadoop

课程主要涉及Hadoop Sqoop.Flume.Avro重要子项目的技术实战课程针对人群 1.本课程适合于有一定java基础知识,对数据库和sql语句有一定了解,熟练使用linux系统的技术人员, ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.023 s.