Greenplum 介绍

数据库分两种类型:

1、OLTP:重吞吐和高并发;前台应用,面向客户。

主要特点:

a、单次处理的数据量很小

b、对响应时间要求很高

c、用户数量庞大

2、OLAP:重计算,Greenplum属于OLAP;后台数据,面向业务管理人员。

主要特点:

a、主要用于查询分析

b、复杂查询涉及的数据量庞大

c、用户数量少

Greenplum是一个关系型数据库集群,它实际上是由数个独立的数据库服 务 组 合 成 的 逻 辑 数 据 库 。 与 Oracle R A C 的 Shared-Everything架 构 不 同 ,Greenplum采用 Shared-Nothing架 构 ,整个集群由很多个数据节点(Segment Host) 和 控 制 节 点 (Master Host) 组成,其中每个数据节点上可以运行多个数据库。简单来说,Shared-Nothing是一个分布式 的架构,每个节点相对独立。在典型的Shared-Nothing中,每一个节点上所有的资源(CPU, 内存,磁盘)都是独立的,每个节点都只有全部数据的一部分,也只能使用本节点的资源。


Greenplum 应用场景

Greenplum数据引擎是为新一代数据仓库和大规模分析处理而建立的软件解决方案,其 最大的特点是不需要高端的硬件支持仍然可以支撑大规模的高性能数据仓库和商业智能査

询。在数据仓库、商业智能的应用上,尤其在海量数据的处理方面Greenplum表现出极其优

异的性能。

传统数据库侧重交易处理,关注的是多用户的同时的双向操作,在保障即时性的要求下,系统通过内存来处理数据的分配、读写等操作,存在IO瓶颈。而分析型数据库是以实时多维分析技术作为基础,对数据进行多角度的模拟和归纳,从而得出数据中所包含的信息和知识。Greenplum虽然是关系型数据库产品,但是它具有査询速度快、数据装载速度快、 批量DML处理快的主要特点,而且性能可以随着硬件的添加呈线性增加,拥有非常良好的可扩展性。因此,Greenplum主要适用于面向分析的应用,比如构建企业级ODS/EDW、数 据集市等。

时间: 2024-08-29 12:54:58

Greenplum 介绍的相关文章

MPP架构海量数据分析仓库——Greenplum介绍

一.Greenplum背景 时间回到2002年,互联网行业经过近10年的发展,数据量正处于快速增长期: 1.传统的主机计算模式在海量数据面前,除了造价昂贵外,在CPU计算和IO吞吐上不能满足海量数据的计算需求: 2.传统数据库大多基于SMP架,纵向扩容(scale-up)模式遇到了瓶颈. 3.分布式存储和分布式计算理论刚刚被提出来,Google的两篇著名论文关于GFS分布式文件系统和关于MapReduce 并行计算框架的理论引起业界的关注,分布式计算模式在互联网行业特别是收索引擎和分词检索等方面

Greenplum的MVCC多版本控制的简单介绍(主要涉及cmin,cmax,xmin,xmax说明)

熟悉Greenplum数据库的朋友应该都知道,GP底层是使用PostgreSQL数据库来实行MPP架构的,而对于事务控制这一块,也是使用PostgreSQL的多版本控制MVCC,实现了读写分离,显然就会提高数据库每秒查询的性能. 在Read Commit事务隔离级别时,查询请求只读取查询请求之前已经提交的事务的数据更改,对当前版本的数据并不影响: 而DML语句,会操作当前版本.因此做到了读写分离的目的,提高数据库并发能力. 我们先来回顾一下PostgreSQL里面的MVCC多版本控制. 在Pos

Postgres数据库基本介绍

最近一直在做一个和PostgreSQL数据库相关的项目,把自己在这个过程中学习的知识记录下来.关于PostgreSQL数据库网上已经有太多的相关介绍了,为了博文的系统性还是先看一下维基百科对PostgreSQL数据库的介绍吧. PostgreSQL是自由的对象-关系型数据库服务器(数据库管理系统),在灵活的BSD-风格许可证下发行.它在其他开放源代码数据库系统(比如MySQL和Firebird),和专有系统比如Oracle.Sybase.IBM的DB2和Microsoft SQL Server之

Greenplum安装

最近需要安装Greenplum测试一些东西,在安装过程中出现了许多问题,所以在这里将安装过程整理一下,主要参考<Greenplum企业应用实践>和http://jxzhfei.blog.51cto.com/1382161/1767126,链接的文章和书中的安装是基本吻合的,但是比书上更加详细一些. 我安装的平台有两个:win虚拟机和云服务器,有区别的地方我会注明的. 下面我详细记录一下安装过程: 1.安装centOS操作系统 我使用的是CentOS6.5.需要注意的是CenOS6和CentOS

[转]greenplum(postgresql)之数据字典

greenplum是基于postgresql开发的分布式数据库,里面大部分的数据字典是一样的.我们在维护gp的时候对gp的数据字典比较熟悉,特此分享给大家.在这里不会详细介绍每个字典的内容,只会介绍常见的应用以及一些已经封装好了的函数.具体的介绍大家可以去看postgresql的中文文档(附件),里面有详细的解释. 1.postgresql中,所有数据库的对象都是用oid连接在一起的. 这样子会造成我们在理解数据字典的时候有一些不知所云.下面介绍几个函数,可以简化很多的操作. 名字 引用 描述

PostgreSQL 优势,MySQL 数据库自身的特性并不十分丰富,触发器和存储过程的支持较弱,Greenplum、AWS 的 Redshift 等都是基于 PostgreSQL 开发的

PostgreSQL 优势 2016-10-20 21:36 686人阅读 评论(0) 收藏 举报  分类: MYSQL数据库(5)  PostgreSQL 是一个自由的对象-关系数据库服务器(数据库管理系统),功能很强大.包括了可以说是目前世界上最丰富的数据类型的支持,比如 IP 类型和几何类型等等. 发现很多读者都问过这样一个问题:如果打算为项目选择一款免费.开源的数据库,那么你可能会在MySQL与PostgreSQL之间犹豫不定.针对这个问题,我们采访到了即将在Postgres中国用户20

Greenplum 数据库架构分析

Greenplum 数据库是最先进的分布式开源数据库技术,主要用来处理大规模的数据分析任务,包括数据仓库.商务智能(OLAP)和数据挖掘等.自2015年10月正式开源以来,受到国内外业内人士的广泛关注.本文就社区关心的Greenplum数据库技术架构进行介绍. 一. Greenplum数据库简介 大数据是个炙手可热的词,各行各业都在谈.一谈到大数据,好多人认为就是Hadoop.实际上Hadoop只是大数据若干处理方案中的一个.现在的SQL.NoSQL.NewSQL.Hadoop等等,都能在不同层

greenplum分布式集群(数据仓库)实战总结一

1.准备环境 1.1集群介绍 系统环境:centos6.5 数据库版本:greenplum-db-4.3.3.1-build-1-RHEL5-x86_64.zip greenplum集群中,4台机器IP分别是 [[email protected] ~]# cat /etc/hosts 127.0.0.1   localhost localhost.localdomain localhost4 localhost4.localdomain4 ::1         localhost localh

基于Greenplum Hadoop分布式平台的大数据解决方案及商业应用案例剖析

随着云计算.大数据迅速发展,亟需用hadoop解决大数据量高并发访问的瓶颈.谷歌.淘宝.百度.京东等底层都应用hadoop.越来越多的企 业急需引入hadoop技术人才.由于掌握Hadoop技术的开发人员并不多,直接导致了这几年hadoop技术的薪水远高于JavaEE及 Android程序员. Hadoop入门薪资已经达到了 8K 以上,工作1年可达到 1.2W 以上,具有2-3年工作经验的hadoop人才年薪可以达到 30万—50万 . 一般需要大数据处理的公司基本上都是大公司,所以学习had