Apache Zeppelin是什么?

Apache Zeppelin提供了web版的类似ipython的notebook,用于做数据分析和可视化。背后可以接入不同的数据处理引擎,包括spark, hive, tajo等,原生支持scala, java, shell, markdown等。它的整体展现和使用形式和Databricks Cloud是一样的,就是来自于当时的demo。

Zeppelin是一个Apache的孵化项目.
一个基于web的笔记本,支持交互式数据分析。你可以用SQL、Scala等做出数据驱动的、交互、协作的文档。(类似于ipython notebook,可以直接在浏览器中写代码、笔记并共享)

多用途笔记本

可实现你所需要的: 
数据采集 
数据发现 
数据分析 
数据可视化和协作

支持多种语言,默认是scala(背后是Spark shell),SparkSQL, Markdown 和 Shell。 
 
甚至可以添加自己的语言支持。

Apache Spark 集成

Zeppelin 提供了内置的 Apache Spark 集成。你不需要单独构建一个模块、插件或者库。 
Zeppelin的Spark集成提供了: 
自动引入SparkContext 和 SQLContext 
从本地文件系统或maven库载入运行时依赖的jar包。
可取消job 和 展示job进度

数据可视化

一些基本的图表已经包含在Zeppelin中。可视化并不只限于SparkSQL查询,后端的任何语言的输出都可以被识别并可视化。 

动态表格

Zeppelin 可以在你的笔记本中动态地创建一些输入格式。 
 
更多关于动态表格

协作

Notebook 的 URL 可以在协作者间分享。 Zeppelin 然后可以实时广播任何变化,就像在 Google docs 中一样。 

发布

Zeppelin 提供了一个 URL 用来仅仅展示结果,那个页面不包括 Zeppelin 的菜单和按钮。这样,你可以轻易地将其作为一个iframe集成到你的网站。 

100% 开源

Apache Zeppelin (孵化中) 是 Apache2 许可软件。 请查看源码库 和 如何贡献

Zeppelin 有着非常活跃的开发社区。加入邮件列表和在我们的问题跟踪上报告问题has a very active development community. Join the Mailing list and report issues on our Issue tracker.

以上翻译自Apache Zeppelin (incubating)官网。 
由于目前并不提供binary安装包,需要自己编译。

如果有一个工具,可以让你在同一个Web页面上写Shell代码,Python代码,Scala代码,你想要么? 
如果还可以执行PySpark代码和Spark代码呢?心动了吗? 
如果还可以写Hive-SQL,Spark-SQL呢? 
如果还可以把这些代码保存起来,并形成文档,支持Markdown语法,如何? 
如果还可以将SQL的结果在Web界面上可视化出来呢? 
如果还支持R语言,还支持Kylin呢?还支持Angular呢?还支持PostgreSQL呢?不信你不心动。

原文地址:https://www.cnblogs.com/wangsongbai/p/9116146.html

时间: 2024-10-12 21:25:54

Apache Zeppelin是什么?的相关文章

Spark交互式分析平台Apache Zeppelin的安装

Zeppelin介绍 Apache Zeppelin提供了web版的类似ipython的notebook,用于做数据分析和可视化.背后可以接入不同的数据处理引擎,包括spark, hive, tajo等,原生支持scala, java, shell, markdown等.它的整体展现和使用形式和Databricks Cloud是一样的,就是来自于当时的demo. Zeppelin可实现你所需要的: - 数据采集 - 数据发现 - 数据分析 - 数据可视化和协作 支持多种语言,默认是scala(背

Apache Zeppelin安装及介绍

背景 Apache Zeppelin提供了web版的类似ipython的notebook,用于做数据分析和可视化.背后可以接入不同的数据处理引擎,包括spark, hive, tajo等,原生支持scala, java, shell, markdown等.它的整体展现和使用形式和Databricks Cloud是一样的,就是来自于当时的demo. Mac OS上安装 目前github上,zeppelin版本是0.5.0,没用预先编译好的包提供下载.安装文档:http://zeppelin.inc

Apache Zeppelin

介绍 用于做数据分析和可视化 一.二进制安装 1)下载二进制包 wget http://mirrors.tuna.tsinghua.edu.cn/apache/incubator/zeppelin/0.5.6-incubating/zeppelin-0.5.6-incubating-bin-all.tgz 2)解压缩 tar -xzvf zeppelin-0.5.6-incubating-bin-all.tgz cd zeppelin-0.5.6-incubating-bin-all bin/z

Apache Zeppelin简介

Zeppelin是一个Apache的孵化项目. 一个基于web的笔记本,支持交互式数据分析.你可以用SQL.Scala等做出数据驱动的.交互.协作的文档.(类似于ipython notebook,可以直接在浏览器中写代码.笔记并共享) 多用途笔记本 可实现你所需要的: - 数据采集 - 数据发现 - 数据分析 - 数据可视化和协作 支持多种语言,默认是scala(背后是spark shell),SparkSQL, Markdown 和 Shell. 甚至可以添加自己的语言支持.如何写一个zepp

Ubuntu下基于Saprk安装Zeppelin

前言 Apache Zeppelin是一款基于web的notebook(类似于ipython的notebook),支持交互式地数据分析,即一个Web笔记形式的交互式数据查询分析工具,可以在线用scala和SQL对数据进行查询分析并生成报表.原生就支持Spark.Scala.SQL .shell .markdown等.而且它是完全开源的,目前还处于Apache孵化阶段.其已经在各大公司均有采用,比如美团.微软等等. Zeppelin的后台数据引擎可以是Spark,也可以通过实现更多的解释器来为Ze

Zeppelin使用hive解释器

此zeppelin为官方0.5.6版,可能还在孵化阶段,可能出现一些bug吧. 配置 cp zeppelin-env.sh.template zeppelin-env.sh vi zeppelin-env.sh 添加: export JAVA_HOME=/usr/lib/jvm/java-1.8.0-openjdk-1.8.0.65-3.b17.axs7.ppc64le export HADOOP_CONF_DIR=/etc/hadoop/conf 启动zepplein ../bin/zeppe

Zeppelin使用报错

报错信息: INFO [2016-11-03 17:05:08,481] ({pool-2-thread-2} SchedulerFactory.java[jobFinished]:137) - Job remoteInterpretJob_1478163908285 finished by scheduler org.apache.zeppelin.jdbc.JDBCInterpreter1260005516 INFO [2016-11-03 17:12:54,001] ({pool-1-th

Zeppelin添加mysql解释器

安装Apache zeppelin 1 wget http://apache.fayea.com/zeppelin/zeppelin-0.6.2/zeppelin-0.6.2-bin-all.tgz 1 tar -xzvf zeppelin-0.6.2-bin-all.tgz 配置Mysql interpreter 1.在zeppelin目录下的interpreter下放入mysql的解释器. mysql解释器 密码:s8ec 2.修改配置文件 1 [[email protected] conf

Spark北京Meetup第九次活动-Zeppelin主题

活动时间 北京第九次Spark Meetup活动将于2015年08月22日进行:下午14:00-18:00. 活动地点 北京市海淀区丹棱街5号 微软亚太研发集团总部大厦1号楼 活动内容 1. <Keynote> ,分享人:Sejun Ra ,CEO of NFLabs.com 2. <An introduction to Zeppelin with a demo>,分享人: Anthony Corbacho, Engineer from NFLabs and Apache Zepp