SparkStreaming入门及例子

看书大概了解了下Streaming的原理，但是木有动过手啊。。。万事开头难啊，一个wordcount 2小时怎么都运行不出结果。是我太蠢了，好了言归正传。

SparkStreaming是一个批处理的流式计算框架，适合处理实时数据与历史数据混合处理的场景（比如，你用streaming将实时数据读入处理，再使用sparkSQL提取历史数据，与之关联处理）。Spark Streaming将数据流以时间片为单位分割形成RDD，使用RDD操作处理每一块数据，没块数据都会生成一个spark JOB进行处理，最终以批处理方式处理每个时间片的数据。（多的就不解释了，百度就好了~）

首先确保你安装了hadoop和spark，在IDEA中也已入来了相应jar包。

写吧- -

新手要注意红框部分，spark官网上给的例子是调用socketFileStream方法，这是通过socket连接远程的，倘若只在本机上测试学习，就用textFileStream读取本地文件路径，没错是路径不是文件，因为sparkStreaming是处理实时数据的，倘若直接指定一个文件，输出后是无法得到结果的。所以新建了个路径，在这里设置了Seconds(20)每20秒读取一次。随后run一下。

启动后，将准备好的文件cp到这个路径下，20秒过后结果就出来了，模拟了下实时数据。结束。

时间： 2024-11-08 02:04:10

SparkStreaming入门及例子的相关文章

Lucene第一个入门学习例子

看Lucene in Action的时候,练习的一个入门例子. 在使用Lucene进行文本内容搜索前,需要先对指定的目录下的文件进行建立索引,代码如下: import java.io.File; import java.io.FileFilter; import java.io.FileReader; import java.io.IOException; import org.apache.lucene.analysis.standard.StandardAnalyzer; import or

kafka入门java例子

1,生产者 import java.util.Properties; import kafka.javaapi.producer.Producer; import kafka.producer.KeyedMessage; import kafka.producer.ProducerConfig; public class TestProducer { public static void main(String[] args) { Properties props = new Propertie

OpenGL ES2.0 入门经典例子

原文链接地址:http://www.raywenderlich.com/3664/opengl-es-2-0-for-iphone-tutorial 免责申明(必读!):本博客提供的所有教程的翻译原稿均来自于互联网,仅供学习交流之用,切勿进行商业传播.同时,转载时不要移除本申明.如产生任何纠纷,均与本博客所有人.发表该翻译稿之人无任何关系.谢谢合作! ps:非常感谢skingTree为我们提供的这篇翻译教程,感谢yy.小狼.北方加入我的教程翻译团队,谢谢你们! 教程截图: OpenGL ES 是

Python In Action:一、入门小例子

Python In Action这本书真是有点猛,一开头就来这么个例子: 1 import wx 2 class MyFrame(wx.Frame): 3 def __init__(self): 4 wx.Frame.__init__(self,None,-1,'My Frame',size=(300,300)) 5 panel=wx.Panel(self,-1) 6 panel.Bind(wx.EVT_MOTION,self.OnMove) 7 wx.StaticText(panel,-1,'

freemarker入门小例子

我用freemarker做了两个小例子,主要的东西是:两个Test文件,一个Animal实体类,一个ftl模板---freemarker的模板,我使用maven做的java工程案例.主要结构内容如下图: 注意:需要导入freemarker的jar包: 1.首先我们先来了解一下freemarker的概念: freeMarker概述: FreeMarker是一个模板引擎,一个基于模板生成文本输出的通用工具,使用纯Java编写: FreeMarker被设计用来生成HTML Web页面,特别是基于MVC

sparkStreaming入门

1.环境 jdk : 1.8 scala : 2.11.7 hadoop:2.7 spark : 2.2.0 2. 开发工具 idea 2017.2 3.maven的pom文件 <dependencies>   <

2. 快速入门-跟着例子走

是否可以成功运行这个例子,对于增加你的学习信心很重要. 当然,其中遇到的很多不明白的问题.配置和代码等,先放一放,不要着急. 你目前的任务就是实现这个例子,并成功运行它. 我这里采用Web项目(你也可以采用WinForm 或控制台程序): 1. 新建两个项目: 因为我们写的是Demo,所以并没有严格按照一种框架去搭建项目,只是简单的用了两个项目(之后还会添加一个Models类库项目),这样可以尽可能排除框架对你的干扰,让你把更多的精力花在学习NHibernate上面. NHibernateW

spark-streaming入门（二）

Input DStreams and Receivers Input DStreams are DStreams representing the stream of input data received from streaming sources. In the quick example, lines was an input DStream as it represented the stream of data received from the netcat server. Eve

IntelliJ IDEA下Maven SpringMVC+Mybatis入门搭建例子

很久之前写了一篇SSH搭建例子,由于工作原因已经转到SpringMVC+Mybatis,就以之前SSH实现简单登陆的例子,总结看看SpringMVC+Mybatis怎么实现. Spring一开始是轻量级的框架,在SSH中,处于中间粘合剂的作用,核心作用是IoC(控制反转).DI(依赖注入),IoC和DI是同一个概念,只是以不同角度进行解释.简单的说,就是Spring帮助你管理Bean,只要写好了配置文件或者Spring注解,那么Spring可以自动帮你创建Bean,不需要手动new.经过后来的发

猜你喜欢

使用vs2015开发linux：Ubuntu程序

官方介绍这个插件的博客:(https://blogs.msdn.microsoft.com/vcblog/2016/03/30/visual-c-for-linux-development/) 1.首 ...

Python学习进程（13）文件与IO

本节介绍基本的IO函数和文件的读写操作. (1)读取键盘输入: Python用于读取键盘输入的函数有两个:raw_input与input. 1)raw_input函数从标准输入读取一 ...

如何判断一条sql(update,delete)语句是否执行成功

如何判断一条sql(update,delete)语句是否执行成功 catch (SQLException e) { } catch不到错误应该就成功了. ============== ...

蓝牙核心技术概述

转:http://blog.csdn.net/xubin341719/article/details/38305331 关键词:蓝牙核心技术协议 HCI L2CAP SDP RFCOMM 作者:x ...

java语言打印上三角和下三角，进一步得到九九乘法表

关于下面两种图形的打印问题 ***** 与 * **** ** *** *** ** **** * ***** 一:程序 1.先打印下三角 2.结果 3.后打印上三角 4.结果二:知识点 1.f ...

明星软件工程师的10种特质（转）

如今,每家公司都似乎成了科技公司.从软件创业公司到投机性投资公司.制药巨头和媒体巨头,它们都越来越多地加入到软件业务行列.代码质量不仅成为了一个必需品,更成为了一个竞争优势.因为众多公司围绕软件而竞争 ...

【POJ】3744 Scout YYF I

http://poj.org/problem?id=3744 题意:直线上n个地雷,n<=10,范围在[1, 100000000],每一次有p的概率向前走一步,1-p的概率向前走两步,问安全通过 ...

巴西瘫痪少年将穿脑控机械战甲为世界杯开球

阿里巴巴:6 月 12 日,中国邮政集团公司与阿里巴巴集团达成战略合作.双方将在物流.电商.金融.信息安全等领域全面开展深度合作,合力建设中国智能物流骨干网.通过这个网络平台,邮政覆盖全国超十万个网点 ...

oracle数据库报ORA-01033错误

Oracle登录 ORA-01033: ORACLE正在初始化或关闭的解决办法 2015-03-16 01:20 | 160511人阅读 | 来源 Oracle登录 ORA-01033: ORACLE ...

MySQL错误（一）

Host 'localhost' is not allowed to connect to this MySQL server 手贱误操作将root用户删除,解决办法: 找到mysql的配置文件 my ...

简单控件提纲

简单控件:Label - 文本显示控件,虽然说属性中可以设置此控件的诸多样式,但是不建议大家使用,而是使用CSS来设置相应的样式 Literal - 用来显示文本,text中的内容会原封不动的打印到浏 ...

Matlab 图像预处理

%%%%%%%%%%%%%%%%% %%降采样 clear all im={}; %创建字典保存读取的图片 dis=dir('F:\kaggle_data_zip\Sample\*.jpeg');%% ...

linux_磁盘管理与文件系统

一.总结: Linux系统管理磁盘和文件系统管理: RAID, LVM; btrfs; 程序包管理:rpm, yum(dnf) Linux的网络管理; 进程和作业管理:htop, glances, ...

六：二叉树中第k层节点个数与二叉树叶子节点个数

二叉树中第k层节点个数递归解法: (1)如果二叉树为空或者k<1返回0 (2)如果二叉树不为空并且k==1,返回1 (3)如果二叉树不为空且k>1,返回左子树中k-1层的节点个数与右子树 ...

RPM是一个文件包管理

RPM是一个文件包管理程序,它是Linux现在默认的软件包管理器,全称是Redhat Package Manager,缩写为RPM,由Redhat(红帽公司)最先发布,现在基本上所有的Linux以及部 ...

《OpenGL 超级宝典（Super Bible）第五版》有关 PBO 的 Example

代码即关键注释如下: static GLfloat vGreen[] = { 0.0f, 1.0f, 0.0f, 1.0f }; static GLfloat vWhite[] = { 1.0f, 1 ...

Ionic基础——介绍及开发准备

写在前面: Nyan!大家好!我是RexminCat,在这篇博文中,我会大概介绍一下Ionic是个什么东西,他能干什么,他的优点与缺点,以及如何开始使用! Ionic 介绍: ionic 是一个强大的 ...

AjaxUpLoad.js使用实现文件上传

AjaxUpLoad.js的使用实现无刷新文件上传,如图. 图1 文件上传前图2 文件上传后 1.创建页面并编写HTML上传文档: <div class="uploadFile&quo ...

java知识点:读万卷书,行万里路(三)

回调函数就是一个通过指针调用的函数可以被循环调用可用于通知机制回调函数可以是全局,静态函数 ThreadLocal 存放的值是线程内共享的,线程间互斥的,主要用于线程内共享一些数据,避免通过参 ...

HAproxy基础（1）-理论篇

一.HAProxy简介 HAProxy提供高可用性.负载均衡以及基于TCP和HTTP应用的代理,支持虚拟主机,它是免费.快速并且可靠的一种解决方案.HAProxy特别适用于那些负载特大的web站点,这 ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.024 s.