Apache Zeppelin是什么？

Apache Zeppelin提供了web版的类似ipython的notebook，用于做数据分析和可视化。背后可以接入不同的数据处理引擎，包括spark, hive, tajo等，原生支持scala, java, shell, markdown等。它的整体展现和使用形式和Databricks Cloud是一样的，就是来自于当时的demo。

Zeppelin是一个Apache的孵化项目.
一个基于web的笔记本，支持交互式数据分析。你可以用SQL、Scala等做出数据驱动的、交互、协作的文档。(类似于ipython notebook，可以直接在浏览器中写代码、笔记并共享)

多用途笔记本

可实现你所需要的：
- 数据采集
- 数据发现
- 数据分析
- 数据可视化和协作

支持多种语言，默认是scala(背后是Spark shell)，SparkSQL, Markdown 和 Shell。

甚至可以添加自己的语言支持。

Apache Spark 集成

Zeppelin 提供了内置的 Apache Spark 集成。你不需要单独构建一个模块、插件或者库。
Zeppelin的Spark集成提供了：
- 自动引入SparkContext 和 SQLContext
- 从本地文件系统或maven库载入运行时依赖的jar包。
- 可取消job 和展示job进度

数据可视化

一些基本的图表已经包含在Zeppelin中。可视化并不只限于SparkSQL查询，后端的任何语言的输出都可以被识别并可视化。

动态表格

Zeppelin 可以在你的笔记本中动态地创建一些输入格式。

更多关于动态表格

协作

Notebook 的 URL 可以在协作者间分享。 Zeppelin 然后可以实时广播任何变化，就像在 Google docs 中一样。

发布

Zeppelin 提供了一个 URL 用来仅仅展示结果，那个页面不包括 Zeppelin 的菜单和按钮。这样，你可以轻易地将其作为一个iframe集成到你的网站。

100% 开源

Apache Zeppelin (孵化中) 是 Apache2 许可软件。请查看源码库和如何贡献。

Zeppelin 有着非常活跃的开发社区。加入邮件列表和在我们的问题跟踪上报告问题has a very active development community. Join the Mailing list and report issues on our Issue tracker.

以上翻译自Apache Zeppelin (incubating)官网。
由于目前并不提供binary安装包，需要自己编译。

如果有一个工具，可以让你在同一个Web页面上写Shell代码，Python代码，Scala代码，你想要么？
如果还可以执行PySpark代码和Spark代码呢？心动了吗？
如果还可以写Hive-SQL，Spark-SQL呢？
如果还可以把这些代码保存起来，并形成文档，支持Markdown语法，如何？
如果还可以将SQL的结果在Web界面上可视化出来呢？
如果还支持R语言，还支持Kylin呢？还支持Angular呢？还支持PostgreSQL呢？不信你不心动。

原文地址：https://www.cnblogs.com/wangsongbai/p/9116146.html

时间： 2024-10-12 21:25:54

Apache Zeppelin是什么？

多用途笔记本

Apache Spark 集成

数据可视化

动态表格

协作

发布

100% 开源

Apache Zeppelin是什么？的相关文章

Spark交互式分析平台Apache Zeppelin的安装

Apache Zeppelin安装及介绍

Apache Zeppelin

Apache Zeppelin简介

Ubuntu下基于Saprk安装Zeppelin

Zeppelin使用hive解释器

Zeppelin使用报错

Zeppelin添加mysql解释器

Spark北京Meetup第九次活动－Zeppelin主题