基于PostgreSQL的可扩展的开源大数据集群数据库：Postgres-XL

http://www.postgres-xl.org/

Postgres的-XL是一个基于PostgreSQL数据库的横向扩展开源SQL数据库集群，具有足够的灵活性来处理不同的数据库工作负载:

OLTP 写频繁的业务
需要MPP并行性商业智能
操作数据存储
Key-value 存储
GIS的地理空间
混合业务工作环境
多租户服务提供商托管环境

可扩展性

Postgres-XL（eXtensible Lattice），可以跨多个节点或者分区表，或复制它们。分区（或分布）表允许跨多个节点的写入可扩展性，以及大规模并行处理（MPP）大数据类型的工作负荷。

复制的表是典型的不经常改变的静态数据。复制数据，允许读可扩展性。

完全ACID

Postgres-XL是一款完全符合ACID的事务型数据库。不仅为您提供任何时候都完全一致的视图，而且使用了集群范围的多版本并发控制（MVCC）。

当你在Postgres-XL开始一个交易或查询时，你会看到整个集群范围内一致的数据。当你一个连接里读取你的数据时，甚至在没有任何锁定另一个连接里，

你可以更新相同的表。归功于全球事务标识符和快照，这些连接正在使用他们自己的版本的行。读取器和写入器互相不阻塞对方。

组件

Global Transaction Monitor (GTM)

全局交易监测，确保群集范围内的事务一致性。 GTM负责发放事务ID和快照作为其多版本并发控制的一部分。

集群可选地配置一个备用GTM，以改进可用性。此外，可以在协调器间配置代理GTM，可用于改善可扩展性，减少GTM的通信量。

Coordinator

协调员管理用户会话，并与GTM和数据节点进行交互。协调员解析，并计划查询，并给语句中的每一个组件发送下一个序列化的全局性计划

Data Node

数据节点是数据实际存储的地方。数据的分布可以由DBA来配置。为了提高可用性，可以配置数据节点的热备以便进行故障转移准备。

时间： 2024-10-28 16:17:48

基于PostgreSQL的可扩展的开源大数据集群数据库：Postgres-XL的相关文章

基于Docker搭建大数据集群（六）Hive搭建

基于Docker搭建大数据集群(六)Hive搭建前言之前搭建的都是1.x版本,这次搭建的是hive3.1.2版本的..还是有一点细节不一样的 Hive现在解析引擎可以选择spark,我是用spark做解析引擎的,存储还是用的HDFS 我是在docker里面搭建的集群,所以都是基于docker操作的一.安装包准备 Hive官网下载微云下载 | 在 tar 目录下二.版本兼容我使用的相关软件版本 Hadoop ~ 2.7.7 Spark ~ 2.4.4 JDK ~ 1.8.0_221 S

基于Docker搭建大数据集群（七）Hbase部署

基于Docker搭建大数据集群(七)Hbase搭建一.安装包准备 Hbase官网下载微云下载 | 在 tar 目录下二.版本兼容三.角色分配节点 Master Regionserver cluster-master yes no cluster-slave1 backup yes cluster-slave2 no yes cluster-slave3 no yes 四.配置修改 hbase-env.sh export JAVA_HOME=/opt/jdk/jdk1.8.0_221 h

基于Docker搭建大数据集群（一）Docker环境部署

本篇文章是基于Docker搭建大数据集群系列的开篇之作主要内容 docker搭建 docker部署CentOS 容器免密钥通信容器保存成镜像 docker镜像发布环境 Linux 7.6 一.Docker安装安装工具包 bash yum install -y yum-utils #安装工具包,缺少这些依赖将无法完成设置远程仓库 bash yum-config-manager --add-repo https://download.docker.com/linux/centos/dock

6个人如何维护上千规模的大数据集群？

本文主要介绍饿了么大数据团队如何通过对计算引擎入口的统一,降低用户接入门槛:如何让用户自助分析任务异常及失败原因,以及如何从集群产生的任务数据本身监控集群计算/存储资源消耗,监控集群状况,监控异常任务等. 如果你想了解大数据的学习路线,想学习大数据知识以及需要免费的学习资料可以加群:784789432.欢迎你的加入.每天下午三点开直播分享基础知识,晚上20:00都会开直播给大家分享大数据项目实战. 饿了么 BDI-大数据平台研发团队目前共有 20 人左右,主要负责离线&实时 Infra 和平台工

大数据集群本地安装方法

大数据集群本地安装方法 1.使用Vmware安装Linux系统请自行下载,并安装.至少安装两台(这里以安装三台为例) 2. 安装xshell和xftp 安装xshell和xftp主要主要是方面后面传文件.写命令等操作. (注意,xshell和xftp的版本一定要一致,不然安装xftp可能会有问题) 3. 配置虚拟机IP A. 每台虚拟机都用root账号登录 a. 编辑hosts文件(使用以下命令) sudo vi /etc/hosts 添加以下内容 192.168.79.131 master

Ambari和大数据集群部署（精华）

(个人经历,如有问题请于评论区提出宝贵意见) 踩了无数的坑,终于将ambari和大数据集群部署成功了,请一定要按照步骤仔细操作,避免出现问题. 英文官方文档链接:https://docs.hortonworks.com/HDPDocuments/Ambari-2.5.1.0/bk_ambari-installation/bk_ambari-installation.pdf 基础环境操作系统:ubuntu16HDP: 2.6.2.14Hdp-utils:1.1.0.21Ambari:2.5.2.0

基于hortonworks的大数据集群环境部署流水

一.ambari及HDP安装文件下载地址: 1.系统操作系统:CentOS7 2.软件本次安装采用最新版本: ambari-2.7.0.0 hdp-3.0.0.0 详细信息及下载地址如下: Ambari 2.7.0 Repositories Base URL :http://public-repo-1.hortonworks.com/ambari/centos7/2.x/updates/2.7.0.0 Repo File :http://public-repo-1.hortonworks.c

基于Docker搭建大数据集群（三）Hadoop部署

主要内容 Hadoop安装前提 zookeeper正常使用 JAVA_HOME环境变量安装包微云下载 | tar包目录下 Hadoop 2.7.7 角色划分角色分配 NN DN SNN cluster-master 是否否 cluster-slave1 否是是 cluster-slave1 否是否 cluster-slave1 否是否一.环境准备上传到docker镜像 docker cp hadoop-2.7.7.tar.gz cluster-master:/root

基于Docker搭建大数据集群（五）Mlsql部署

主要内容 mlsql部署前提 zookeeper正常使用 spark正常使用 hadoop正常使用安装包微云下载 | tar包目录下 mlsql-cluster-2.4_2.11-1.4.0.tar.gz mlsql-console-1.4.0.tar.gz mlsql-engine_2.4-1.4.0.tar.gz 一.环境准备上传到docker镜像 docker cp mlsql-cluster-2.4_2.11-1.4.0.tar.gz cluster-master:/root/t