SQL on Spark的简介

　　AMPLab 将大数据分析负载分为三大类型：批量数据处理、交互式查询、实时流处理。而其中很重要的一环便是交互式查询。

　　大数据分析栈中需要满足用户 ad-hoc、reporting、 iterative 等类型的查询需求，也需要提供 SQL 接口来兼容原有数据库用户的使用习惯，同时也需要 SQL 能够进行关系模式的重组。完成这些重要的 SQL 任务的便是 Spark SQL 和 Shark 这两个开源分布式大数据查询引擎，它们可以理解为轻量级 Hive SQL 在 Spark 上的实现，业界将该类技术统称为 SQL on Hadoop。

　在 Spark 峰会 2014 上， Databricks 宣布不再支持 Shark 的开发，全力以赴开发Shark 的下一代技术 Spark SQL，同时 Hive 社区也启动了 Hive on Spark 项目，将 Spark作为 Hive（除 MapReduce 和 Tez 之外的）新执行引擎。根据伯克利的 Big Data Benchmark测试对比数据， Shark 的 In Memory 性能可以达到 Hive 的 100 倍，即使是On Disk 也能达到 10 倍的性能提升，是 Hive 强有力的替代解决方案。而作为 Shark 的进化版本的 Spark SQL，在 AMPLab 最新的测试中的性能已经超过 Shark。图 1 展示了 Spark SQL和 Hive on Spark 是新的发展方向。
　　

　　　　　　　　　　　　　　图 1 Spark SQL 和 Hive on Spark 是新的发展方向

时间： 2024-10-17 16:29:24

SQL on Spark的简介的相关文章

SQL SERVER 开窗函数简介

在SQL SERVER 2005/2008支持两种排名开窗函数和聚集开窗函数. 以SQL SERVER中分面页为例,按时间顺序列出定单号. WITH OrderInfo AS ( SELECT ROW_NUMBER() OVER(ORDER BY OrderDate) AS Number, OrderID,CustomerID, EmployeeID,OrderDate FROM Orders (NOLOCK) ) SELECT Number,OrderID,CustomerID, Employ

SQL中 decode()函数简介

SQL中 decode()函数简介今天看别人的SQL时看这里面还有decode()函数,以前从来没接触到,上网查了一下,还挺好用的一个函数,写下来希望对朋友们有帮助哈! decode()函数简介: 主要作用:将查询结果翻译成其他值(即以其他形式表现出来,以下举例说明): 使用方法: Select decode(columnname,值1,翻译值1,值2,翻译值2,...值n,翻译值n,缺省值) From talbename Where … 其中columnname为要选择的table中所定义的

sql语法值ORACLE简介

前言 1977年提出了关系型数据库,大型的数据库产品有oracle.db2和Sybase: 中型的右SqlServer和mysql;小型的代表为access. 正文数据库的常用术语:dbms是数据库管理系统: dbms是关系型数据库管理系统和dba是数据库管理员的意识 oracle的安装安装过程简单略过. 安装好之后有个数据库实例sid,即库名. 1) 连接数据库之前记得开启oracleXXX(SID)TNSListener服务和oracleServiceXXX(SID)这两个服务. ora

翻译之：SQL Server统计信息简介

本文选自<Pro SQL Server Internals> 作者: Dmitri Korotkevitch 出版社: Apress 出版年: 2016-12-29 页数: 804 作者简介:Dmitri Korotkevitchis是微软SQL Server MVP和微软认证大师.作为应用程序和数据库开发人员.数据库管理员和数据库架构师,他具有多年使用SQL Server的经验.他专门从事OLTP系统在高负载下的设计.开发和性能调优.Dmitri经常在各种Microsoft和SQL PASS

SQL Server 2012 FileTables 简介

本文将介绍有关 SQL Server 2012 FileTables. 大家都知道像是 SQL Server 这类的关联式数据库擅长处理大量结构化数据,对于文件或目录这类型的非结构化数据的管理及查询,相对而言比较难以处理. 以一般网站应用程序开发为例,常常会需要提供使用者透过浏览器上传文件的功能,应用程序要如何记录这些文件的相关资讯,大致上都是采用这两种方法,一是只在 DBMS 中纪录文件名称.大小.类型等资讯,实际文件还是存放在文件系统当中,二是把上传的文件转成二进制后保存到 DBMS 中.

Spark安装简介

1.简介 Spark 是一个基于内存计算的开源的集群计算系统,目的是让数据分析更加快速,由加州大学伯克利分校 AMP 实验室 (Algorithms,Machines,and People Lab) 开发,可用来构建大型的.低延迟的数据分析应用程序.spark-sql还能提供比较完整的sql的功能,多表分析关联非常方便. 2.单机最简安装从官网Spark上下载编译好的bin包(spark-1.3.0-bin-hadoop2.4.tgz). 解压安装 tar -zxvf spark-1.3.0-

SQL中 decode()函数简介（转载）

今天看别人的SQL时看这里面还有decode()函数,以前从来没接触到,上网查了一下,还挺好用的一个函数,写下来希望对朋友们有帮助哈! decode()函数简介: 主要作用:将查询结果翻译成其他值(即以其他形式表现出来,以下举例说明): 使用方法: Select decode(columnname,值1,翻译值1,值2,翻译值2,...值n,翻译值n,缺省值) From talbename Where - 其中columnname为要选择的table中所定义的column, ·含义解释: dec

[翻译]Apache Spark入门简介

原文地址:http://blog.jobbole.com/?p=89446 我是在2013年底第一次听说Spark,当时我对Scala很感兴趣,而Spark就是使用Scala编写的.一段时间之后,我做了一个有趣的数据科学项目,它试着去预测在泰坦尼克号上幸存.对于进一步了解Spark内容和编程来说,这被证明是一个很好的方式.对于任何有追求的.正在思考如何着手的Spark开发人员,我都非常推荐这个项目. 今天,Spark已经被很多巨头使用,包括Amazon.eBay以及Yahoo!.很多组织都在拥

SQL中 decode()函数简介 - FreeSpider - 博客园

body { font-family: Microsoft YaHei UI,"Microsoft YaHei", Georgia,Helvetica,Arial,sans-serif,宋体, PMingLiU,serif; font-size: 10.5pt; line-height: 1.5; } html, body { } h1 { font-size:1.5em; font-weight:bold; } h2 { font-size:1.4em; font-weight:bo

猜你喜欢

3.Spring Boot中使用Swagger2构建强大的RESTful API文档

原文:http://www.jianshu.com/p/8033ef83a8ed 由于Spring Boot能够快速开发.便捷部署等特性,相信有很大一部分Spring Boot的用户会用来构建REST ...

大学毕业必须知道的东西：三方协议、报到证（派遣证）、干部身份

[档案问题] 毕业之前必看的东西-你自己的档案问题,详细至极真正能证明你学习经历的就是你的档案.档案里面有你各个时期的学籍卡.成绩单.各方面的评语.获奖证明.还有你的党团材料.这些都是原始材料,不可复 ...

MyBatis批量操作报错：Parameter 'xxxList' not found. Available parameters are [list]

需求: 根据传入的参数批量删除数据: DAO: List ll = new ArrayList<Integer>(); for(int i=10;i<25;i++){ ll.add ...

Android学习笔记（二三）：多页显示-Flipper的使用

除了Tab在一个Activity中显示多页内容,还可以使用Flipper,Flipper没有标签,是一页页的显示方式. 例子一:基础的Flipper 1)Android XML文件 Flipper采用 ...

db2备份和导入单个表操作

cmd →db2admin db2 connect to databasename user 登陆名 using 登陆密码 >db2 export to t1.ixf of ixf select ...

Python入门系列教程（五）函数

全局变量修改全局变量 a=100 def test(): global a a=200 print a 多个返回值缺省参数 def test3(a,b=1): print a,b test3(a) ...

HDU 5738 Eureka

传送门题目大意: $给出平面上的n个点,每个点有唯一的标号(\text{label}),这n个标号的集合记作S,点可能重合.求满足下列条件的S的子集T的数目:$ $1. |T|\ge 2$ $2.T ...

HDU 4831 Scenic Popularity

Scenic Popularity Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 32768/32768 K (Java/Others ...

判断终端是ios还是安卓的一些妙用

最近遇到一个项目要求有两个icon(就是下载地址下载安卓的apk 和ios的安装包) 一开始的方案是什么设备都显示这两个icon 但是后来老大说这样不好安卓用户给他下载ios 也不行 ...

11Mybatis_SqlMapConfig.xml专题讲解

Mybatis的SqlMapConfig.xml中以下的标签: properties(属性) settings(全局配置参数) typeAliases(类型别名) typeHandlers(类型处理器 ...

13.5

//13.5 import java.util.Scanner; import java.awt.*; import java.util.*; import javax.swing.*; import ...

Tomcat：云环境下的Tomcat设计思路——Tomcat的多实例安装

Cloud现在是一个热门的技术,Tomcat是学习Java的人一般都会接触的Web服务器,如果在Cloud环境下使用Tomcat,又当如何呢?不可避免的,要安装多个Tomcat了,这里称之为Tomca ...

JDBC batch批处理Statement executeBatch 具体解释

JDBC提供了数据库batch处理的能力,在数据大批量操作(新增.删除等)的情况下能够大幅度提升系统的性能.我曾经接触的一个项目,在没有採用batch处理时,删除5万条数据大概要半个小时左右,后来对系 ...

2016/05/19 thinkphp 3.2.2 文件上传

显示效果: 多文件上传. 这里是两个文件一起上传上传到文件夹的效果: ①aa为调用Home下common文件夹下的function.php 中的rname方法实现的 ②cc为调用与Home ...

0day笔记（一）

1.现代攻击技术的精髓就是混淆数据和代码的界限,让系统错误地把数据当做代码去执行. bug和漏洞的区别: 功能性逻辑缺陷(bug):影响软件的正常功能,例如,执行结果错误,图标显示错误. 安全性逻辑缺 ...

如何使用CSS3实现书页（书本）卷角效果

我们有时候想在页面显示一个公告或用户提示信息.一个常用设计是使用书签形状. 我们可以给书签添加卷角效果,以使其更为逼真.所谓的"卷角"实际上可以用小角度倾斜的阴影效果来模拟. 用C ...

linux 正则使用

1.rm(ls) :快速删除一些连续的文件(ls和rm一样,这里就是列举了) [[email protected] test]# ls 1 12 13 2 3 4 [[email protected] ...

反向代理服务器(转)

反向代理及Nginx示例 1 反向代理的概念反向代理(Reverse Proxy)方式是指以代理服务器来接受internet上的连接请求,然后将请求转发给内部网络上的服务器,并将从服务器上得到的结果 ...

GTID与MHA

MHA 基于binlog文件位置的复制 * Phase 3: Master Recovery Phase.. * Phase 3.1: Getting Latest Slaves Phase.. La ...

CountDownTimer倒计时器的使用

以前好多倒计时的需求都需要自己去写,今天发现android 原来自带了倒计时的类CountDownTimer,和适合用于发送短信 ,等待验证码的情况代码展示了在一个TextView进行60S的倒计时 ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.021 s.