Eclipse 编写的spark版WordCount运行在spark上

1、代码编写

if (args.length != 3 ){
      println("usage is org.test.WordCount <master> <input> <output>")
      return
    }
    val sc = new SparkContext(args(0), "WordCount",
    System.getenv("SPARK_HOME"), Seq(System.getenv("SPARK_TEST_JAR")))
    val textFile = sc.textFile(args(1))
    val result = textFile.flatMap(line => line.split("\\s+"))
        .map(word => (word, 1)).reduceByKey(_ + _)
    result.saveAsTextFile(args(2))

2、导出jar包，这里我命名为WordCount.jar

3、运行

bin/spark-submit --master spark://master:7077 /home/zkpk/Desktop/WordCount.jar hdfs://master:9000/dedup_in hdfs://master:9000/dedup_out

先记录下，第三部还没执行，抽空试试

时间： 2024-11-05 18:46:39

Eclipse 编写的spark版WordCount运行在spark上的相关文章

spark 卡在spark context，运行出现spark Exception encountered while connecting to the server : javax.security.sasl.SaslException

原因: 使用root用户运行spark代码解决方法:使用非管理员账户运行spark即可 [[email protected] bin]$ ./add-user.sh What type of user do you wish to add? a) Management User (mgmt-users.properties) b) Application User (application-users.properties) (a): b Enter the details of the ne

编写Spark的WordCount程序并提交到集群运行[含scala和java两个版本]

编写Spark的WordCount程序并提交到集群运行[含scala和java两个版本] 1. 开发环境 Jdk 1.7.0_72 Maven 3.2.1 Scala 2.10.6 Spark 1.6.2 Hadoop 2.6.4 IntelliJ IDEA 2016.1.1 2. 创建项目1) 新建Maven项目 2) 在pom文件中导入依赖pom.xml文件内容如下: <?xml version="1.0" encoding="UTF-8"?> &l

eclipse编写scala应用运行在spark集群上

代码 package spark_1 import org.apache.spark.SparkConf import org.apache.spark.SparkContext class WorkCountTest {//自定义函数 def jiSuan(){ //数据文件路径 var loadFile="hdfs://服务器ip:8020/tmp/dataTest/Z"; //初始化sparkContext var conf=new SparkConf(); conf.setAp

wordcount编写和提交集群运行问题解决方案

在win7测试Wordcount遇到的问题,解决过程 hadoop jar /root/wc1.jar cn.itcast.d3.hadoop.mr.WordCount hdfs://itcast:9000/words /out2 执行上面一句话时候报错: Unsupported major.minor version 52.0 这种错误的原因是jdk版本不一样导致的,我的win7是jdk1.8,hadoop是jdk1.7, 解决方案: 修改项目java compiler的方法: 在项目点右键-

[0012] Hadoop 版hello word mapreduce wordcount 运行(二)

目的: 学习Hadoop mapreduce 开发环境eclipse windows下的搭建环境: Winows 7 64 eclipse,直接运行mapreduce 到服务器,结果输出到eclipse Hadoop2.6.4环境准备: Hadoop2.6.4的源码包相关: [0004] Hadoop 版hello word mapreduce wordcount 运行 [0011] windows 下 eclipse 开发 hdfs程序样例 (三) [0008] Windows 7 下

用Eclipse编写运行Java程序

1.选择一个空的文件夹,作为workspace工作空间,用来存放你以后用eclipse写的Java程序. 2.新建java项目:File->new->java project 3.完成创建后,在src上单击鼠标右键 new->class 4.这时候就可以在主窗体编写代码了 5.按run as java application,即可运行. 用Eclipse编写运行Java程序,布布扣,bubuko.com

eclipse编写的java程序在dos环境下运行的写法

一般情况下如果环境变量没有设置好的话,在dos下运行程序会出现错误,一般都是:错误: 找不到或无法加载主类xxxxx.. 但是在环境变量正确的条件下在dos下运行eclipse编写的java程序也会出现上述的错误,通常是因为eclipse下自动加入了包,所以要把平时的: javac XXX.java java XXX.class改一下变为: javac -d . XXX.java java 包名.XXX 如此即可

Win7上Spark WordCount运行过程及异常

WordCount.Scala代码如下: package com.husor.Spark /** * Created by huxiu on 2014/11/26. */ import org.apache.spark.{SparkContext, SparkConf} import org.apache.spark.SparkContext._ object SparkWordCount { def main(args: Array[String]) { println("Test is st

在idea上运行spark的wordcount

1.环境hadoop-2.6.0 spak2.1.1 scala-sdk-2.11.12 2.maven项目创建 3.pom <?xml version="1.0" encoding="UTF-8"?><project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"

猜你喜欢

Beta阶段站立会议-01

组名:金州勇士组长:尹良亮组员:王汉斌.杜月.闫浩楠代码地址: ssh:[email protected]:handsomeman/examm.githttps://git.coding.net ...

Ubuntu下初学ROS时所遇小问题

[1]运行命令$ rospack depends1 beginner_tutorials 时,提示 : [rospack] Error: no such package beginner_tutori ...

2016元旦

2016第一天上午睡觉,下午看了湖南卫视跨年晚会,感觉到年轻真好,这次的跨年好多小鲜肉,又看了2013时候刘德华出息跨年那场,他很敬业和勤奋尽力,值得人敬佩和学习,不过依然透漏出老的气息.一切都会过去 ...

Excel的一点小事

今天策划同学报告程序里的触发器有bug,过去看了下日志,提示数据文档配置有问题.心想问题不大,修改下表格内容就可以了,当我看完数据表后,悲催的一天开始了... 我们项目模板数据使用的是json,但策划 ...

怎么取消 Windows Server 2012 r2 RDP 限制每个用户只能进行一个会话（转）

在 Windows Server 2008 / 2008 R2 上,如果希望多个远程用户使用同一个账号同时访问服务器的 Remote Desktop(RDP),只需通过管理工具-远程桌面下的“远程桌面 ...

官方发反反复复发反反复复反反复复反反复复反反复复

http://gz.58.com/jdyd/jh_%E8%A5%84%E5%9F%8E%E5%8E%BF%E6%89%BE%E5%B0%8F%E5%A7%90%E5%BE%AE%E4%BF%A1%E7 ...

Office 365 身份验证和单一登录部署（3）

1. 部署ADFS 3.0 在此Lab环境中,因为虚机资源紧张,所以将Active Directory Federation Service安装在DC上,如果是企业环境中是将ADFS角色部署在独立 ...

程序基石:C++多态的前提条件

准备知识 C++中多态(polymorphism)有以下三个前提条件: 必须存在一个继承体系结构. 继承体系结构中的一些类必须具有同名的virtual成员函数(virtual关键字) 至少有一个基类类 ...

python列表及for循环要注意的知识点

列表可以嵌套不同的数据类型,如下是在列表中嵌套字典 a = [{"name":'zhouziqi','contact':17806762943},{"name" ...

软件硬件外设系统检测检测

参考:http://www.cnblogs.com/jikexianfeng/p/6077904.html 软件硬件外设系统检测检测: 1 @echo off 2 color 0a 3 title 硬 ...

Spring IoC和DI

概念 IoC:Inversion of Control .控制反转,是一种设计思想.spring中的实现为 IoC容器,分为两个主要的容器系列,一个是实现BeanFactory接口的简单容器系列,另一 ...

Linux题目

1.删除某目录下所有文件,只保留指定文件. 例:假设/abc文件夹下有a1.a2....a10文件,保留a5和a6文件,其他全部删除 [[email protected] abc]# touch a{ ...

python QQ机器人

通过第三方库qqbot来实现,pip install qqbot 直接安装就行脚本直接运行会弹出二维码,手机qq扫码登录即可通过#weather# city 来查询天气预报通过#study# k ...

配置详解,查看链接:http://www.myhack58.com/Article/60/sort096/2015/59453.htm 配置文件: http { #白名单 geo $whiteipli ...

nutch，solr集成在hadoop上

nutch是一个应用程序,在我的这个项目里主要是做爬虫用,爬取后的内容寄存在hdfs上,所以在hdfs结合模块现已结合上去了. solr: 在eclipse新建动态页面项目,删去WebContent的 ...

我看了这一段文字 :充分授权和信任-这一点的关键是"授权"这个词,授权有两个意思:一是给某人权力和权威:二是给予某人更多自信和自尊.有这个问题 : 把权力充分的给予个人,如果个人 ...

生成多sitemap文件

Thinkphp生成多sitemap文件我们知道sitemap对于seo的重要性,很多介绍只生成一个文件sitemap.xml ,但是如果网站内容比较多,就要生成多个sitemap文件,因为搜索引擎 ...

世界十大顶级家族家训

世界十大顶级家族家训,献给那些希望克服贫穷,梦想世代成为政治世家.那些想把子女培养成为受人敬仰的富翁或CEO.那些准备把子女培养成为第二.第三个比尔·盖茨...的父母们. [政治世家:肯尼迪家族教育子 ...

BZOJ 1032 [JSOI2007]祖码Zuma

1032: [JSOI2007]祖码Zuma Time Limit: 10 Sec Memory Limit: 162 MBSubmit: 637 Solved: 318[Submit][Stat ...

php小写金额转大写

public static function amountInWords($num) { if (!is_numeric($num) || empty($num)) return "&quo ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 11 q. 0.021 s.