2019,数据库行业迎50年第二次巨变


数据库与中间件和操作系统并列为全球三大基础软件技术,也是企业IT系统必不可少的核心技术,银行、电信、制造、互联网等所有行业都依赖于数据库技术。由于其技术的高难度,数据库长期以来被少数公司控制了绝大部分市场份额。据不同的统计口径,全球数据库市场在300亿美金到600亿美金之间,商用数据库的领导厂商主要是Oracle、微软、IBM和SAP。

自1968年IBM推出了第一代数据库DB1以及1970年IBM工程师Edgar Codd写下了最早的关系型数据模型构想的论文,随后的30年间出现了著名的数据库公司Oracle(1977年成立)、Informix(1980年成立,后被IBM收购)、Sybase(1984年成立,后被SAP收购)、Sybase与微软合作的SQL Server(后由微软接管)等,全球数据库产业在2000年前后进行了第一次大战并主要形成IBM、微软、Oracle三巨头格局。

2000年以后的互联网和云计算技术变革,为数据库技术带来了“釜底抽薪”的底层计算系统变化,导致了以开源、分布式和云计算为主导的新数据库时代。2012年Google发布论文首次对外介绍了自研的具有划时代意义的Spanner全球分布式数据库、2014年AWS推出了云原生关系型数据库Aurora、2017年阿里云推出云原生关系型数据库POLARDB,2018年10月Gartner全球数据库魔力象限的领导者和挑战者象限出现了7强格局:微软、Oracle、SAP、AWS、Google、IBM和阿里云。

2019年3月21日的2019阿里云峰会·北京上,阿里云发布了POLARDB的2.0版本,实现了首次兼容Oracle数据库,可帮助金融、医疗、制造等大型企业在数小时内完成业务迁移。除阿里云外,其它国内云厂商也相继推出了自研的云数据库和分布式数据库产品。2019新年伊始,数据库产业50年的第二次“世界大战”已经硝烟四起。

电商巨头的技术溢出效应

从Gartner的2018全球数据库魔力象限来看,AWS与阿里云是两大电商巨头的对外技术输出平台,AWS与阿里云都推出了种类丰富的数据库产品。而Google虽然是全球互联网技术和云技术的“大牛”,但Google内部技术的对外商用化输出往往晚于市场,Cloud Spanner就是直到2017年才向市场推出。

过去十年,电商巨头的技术溢出效应十分明显。AWS目前已经推出的数据库产品包括Amazon DynamoDB(非关系型文档和键值数据库)、Amazon ElastiCache (提供Redis和Memcached开源分布式缓存数据库) 、Amazon Neptune(图数据库)、Amazon Elastic MapReduce(EMR)Hadoop发行版,以及Amazon Relational Database Service(Amazon RDS,支持Amazon Aurora、MariaDB、Microsoft SQL Server、MySQL、Oracle和PostgreSQL等的云数据库服务)以及云原生数据库Amazon Aurora for MySQL and PostgreSQL等。

而阿里云已经推出的数据库产品包括ApsaraDB for RDS(关系型云数据库服务,支持MySQL即AliSQL、SQL Server、PostgreSQL、Redis等)、PolarDB(云原生数据库,支持MySQL、PostgreSQL、Oracle)、HybridDB for MySQL and PostgreSQL(云数据仓库)、Elastic MapReduce for Hadoop、HiTSDB(时序数据库)、X-DB(分布式数据库)、GraphDB(图数据库)等,此外阿里云Apsara Stack还支持企业本地化私有云部署。

无论是AWS还是阿里云,所提供的数据库及数据服务种类繁多,覆盖了绝大多数用户场景,特别是由于电商交易系统的特殊性,AWS和阿里云等开发了支持数据强一致的交易型分布式数据库,能够满足金融类业务的苛刻需求,而成本则远低于商业数据库。

为什么电商企业如此孜孜不倦的钻研数据库呢?以阿里云为例。阿里最早从淘宝、天猫等电商业务发展起来,当时采用的就是IBM DB2和Oracle商用数据库,支持了早期淘宝、天猫的快速发展,这是阿里数据库发展第一个阶段。到了2011和2012的时候,双11开始上规模,业务高速发展对传统的Oracle企业级数据库解决方案提出了挑战,成本太高是首当其冲的挑战,其次当电商业务逻辑变复杂以后,需要理解Oracle数据库的技术实现,以便从根本上解决业务极限场景的挑战,但无论是请Oracle专家到现场的时间还是成本都无法满足业务要求,阿里巴巴从2012、2013年后就开始大规模使用开源数据库,这是阿里数据库发展的第二阶段。第三个发展阶段就是云时代,阿里云的业务快速发展要求自研云原生数据库,这就是POLARDB的诞生逻辑;以及在阿里集团业务中,传统用中间件进行开源数据库分为分表的解决方案也不能满足业务要求,这就是X-DB的的诞生逻辑。

简单来说,电商企业的技术溢出是被业务倒逼的结果。阿里电商双十一场景,在世界范围内来看都绝无仅有,这也给了中国电商企业登顶全球基础软件技术领导地位的机会。作为全球绝无仅有的高并发挑战,阿里分布式技术经过双十一极限流量洪峰的实战考验,这也是为什么阿里云能够首次代表中国厂商冲入Gartner全球数据库魔力象限。2018年,美国犹他大学计算机系终身正教授、世界级数据库系统专家李飞飞,正式加入阿里巴巴,任数据库产品事业部负责人以及达摩院任数据库首席科学家,他于2018年底入选了2018 ACM杰出科学家。李飞飞门下弟子遍布全球所有顶尖企业的数据库部门,但李飞飞自己却选中了阿里,其主要原因就是阿里的全球独一无二的业务场景。

云厂商集开源技术大成


(阿里达摩院数据库首席科学家李飞飞)

2019年是阿里云十周年、AWS进入第13个年头。云厂商对于开源技术的集大成,正在进入全新的阶段。2014年AWS发布Amazon Aurora的时候,当时称性能与商用数据库相当,但成本只有商用数据库的1/10。而2017年阿里云推出POLARDB的时候,在100TB的数据容量上提供了10倍于传统商业数据库的性价比,如今性能达到AWS Aurora的2倍。

不可否认,阿里云的数据库发展离不开Google和AWS等前辈的指引。谷歌最早提出了Spanner,可以实现跨数据中心的数据强一致性,这在当时是跨时代的技术,但谷歌其实是巧妙的利用了原子钟的硬件解决方案;PostgreSQL的XC/XL开源分布式数据库使用的是GTM(Global Transaction Manager)解决方案。阿里云的X-DB则采用了混合逻辑来解决分布式事务处理和查询,已经支持了几乎阿里集团所有海量数据高并发的场景。

如今,阿里云正在把多个领先的数据库技术融合起来,以满足客户的更多、更高需求。云原生数据库POLARDB采用了存储计算分离、软硬件一体化设计,通过高速的RDMA网络提供共享存储的架构,可以快速实现弹性缩扩容,单个实例可扩展到1000核计算能力、同时可以横向扩展到100TB存储空间,满足大规模业务场景的需求,2.0版本则兼容Oracle。据了解,POLARDB与X-DB的优势即将融合成一体,也就是即将推出的POLARDB分布式版本。

即将推出的POLARDB分布式版本是在POLARDB共享存储、一写多读的架构上结合X-DB的核心分布式技术,这样企业就可以利用X-DB的分库分表强一致分布式技术挂起多个POLARDB实例,支持几乎无限的水平规模拓展,满足企业级上百个节点高并发业务需求。POLARDB分布式版本的推出,将用一个通用商业数据库产品来满足公共云上大中小企业的需求以及线下企业级超大规模用户的需求。这款产品最大的好处之一,在于底层接入的不是单节点数据库,而是分布式共享存储且单机支持100T,这样一个200T的数据库只需要两个POLARDB实例即可,大幅降低了跨分区处理的可能性。

POLARDB分布式版本这样一个集大成的通用型全场景覆盖数据库产品,当前阿里云已经储备了足够的技术和实践,现在的主要工作是产品化、标准化,以便能够快速规模化部署。李飞飞认为,阿里巴巴在分布式数据库的某些领域和某些维度上,可能超过像谷歌这样公司在分布式领域的积累,这是因为任何技术都是业务推动衍生出来的,只要有业务场景就能推动其技术从跟随发展到后发领先。

除了分布式和云原生数据库技术外,李飞飞所带领的团队还专注于数据库生态工具库,也就是开发各种辅助工具帮助客户用好数据库。阿里云的一个数据库生态工具就是针对混合数据库和混合云之间的数据迁移工具ADAM,可以大幅减少不同类型数据库和云部署之间数据迁移的各种消耗和对业务的冲击;另一个工具是混合数据库管理,可以管理A/B数据库、云上和云下数据库等混部架构,满足业务对混部数据库的访问和统一控制管理需求。

据了解,阿里云数据库很快将在2019年SIGMOD大会上介绍阿里云双十一场景下的分布式数据库架构。此前,谷歌Spanner、AWS Aurora等都是首先在SIDMOD会议上发布。而阿里云将登陆2019年SIGMOD会议,这也代表了中国技术厂商的成就。

展望未来几年,全球数据库市场将迎来50年的第二次巨变。在2018 Gartner全球数据库魔力象限的7强格局中,AWS、阿里云和Google为开源技术厂商,微软、Oracle和IBM也大举支持开源技术。Gartner预计,开源数据库将在2019年占据20%的数据库市场份额,而到2023年75%的数据库都将登陆云平台。一场数据库的世纪之战,已经在所难免。(文/宁川)

原文地址:https://blog.51cto.com/cloudtechtime/2367587

时间: 2024-10-07 20:55:41

2019,数据库行业迎50年第二次巨变的相关文章

生物医药行业迎“黄金时代” 生物医药股增长七成

三季度,生物医药板块的表现可谓风生水起.板块指数一路从6月3日的1097.533点,飙涨到1393.892点,大涨27.12%,远远跑赢了大盘的涨幅.这背后离不开生物医药板块的良好业绩.在25家已披三季报业绩的生物医药股中,业绩增长的达18家,占比72%.业内人士认为,受医改.老龄化等政策性问题的影响,将给生物医药板块带来稳定的消费市场,未来10年仍有望强势增长. 生物医药企业三季度发力 进入10月份以来,生物医药板块明显走强,板块涨幅位居市场前列.这除了受政策利好影响外,生物医药板块的三季报也

2019年杭电多校第二场 1002题Beauty Of Unimodal Sequence(LIS+单调栈)

题目链接 传送门 思路 首先我们对\(a\)正反各跑一边\(LIS\),记录每个位置在前一半的\(LIS\)中应该放的位置\(ans1[i]\),后一半的位置\(ans2[i]\). 对于字典序最小的方案,我们找到第一个峰值,然后往前遍历.在\(i\)这个位置,如果它在\(LIS\)中放的位置是\(pos\),那么我们先看当前放在\(pos+1\)的值是否比它大,大的话就说明这个位置一定比前面放过在\(pos\)这个位置的更优(因为字典序更小,且\([1,i]\)一定可以放满\([1,pos-1

数据库的总结

1 1.SQL Server数据库基础 2 3 1-1:使用数据库的必要性 4 a.可以结构化存储大量的数据信息,方便用户进行有效的检索和访问. 5 b.可以有效地保持数据信息的一致性.完整性,降低数据冗余. 6 c.可以满足应用的共享和安全方面的要求. 7 d.数据库技术能够方便智能化地分析,产生新的有用信息. 8 1-2:DBMS(数据库管理系统)的发展史 9 a.萌芽阶段--文件系统 10 b.初级阶段--第一代数据库 11 c.中级阶段--第二代数据库 12 d.高级阶段--新一代数据库

数据库表的查询操作实践演练(实验三),数据库演练

继前两次的实验,本次实验以熟练掌握利用select语句进行各种查询操作:单表查询.多表连接及查询.嵌套查询.集合查询等,巩固数据库查询操作.下面就跟着小编一起练习吧!在实验一创建并插入数据的表(Student, Course,SC,Teacher,TC)的基础上,完成以下操作.(1)将教师‘罗莉'的名字改为‘罗莉莉'.复制代码 代码如下:update Teacher set tname='罗莉莉' where tname='罗莉'(2)将两个同学(数据自己临时设置,用后即删除)的两门课程的成绩以

程序员的奋斗史(三十八)——大学断代史(二)——我与数据库的故事

文/.温国兵 惰性人皆有之,也算是人的一大天性.几日之前便构思好此文,怎奈每日杂事繁多,今日才提起笔,作下此文.本文谈谈我与数据库的故事. 说起和数据库结缘,还得从大一说起.大一刚开始接触C语言,每日就沉浸在无止境的代码中.在网上查资料的过程中,看到别人用C语言写了一个小型的图书操作程序,数据库采用的是SQL Server,运行出来的效果图很炫,惊叹原来还可以这样管理数据.熟知C语言的同学肯定对文件操作不陌生,当时我们写程序如果有静态数据,都是放在文件里的.直到后来做的C语言课程设计,我也是一大

数据库原理

第一章 数据库系统基本概念 要求.目标: 了解和掌握数据管理技术的发展阶段,数据描述的术语,数据抽象的四个级别,数据库管理系统的功能,数据库系统的组成. 一. 数据管理技术的发展 1. 分为四个阶段:人工管理阶段.文件系统阶段.数据库阶段和高级数据库阶段. 2. 数据库阶段数据管理的特点: 1) 采用数据模型表示复杂的数据结构. 2) 有较高的数据独立性. 3) 数据库系统为用户提供了方便的用户接口. 4) 提供四方面的数据控制功能:数据库的恢复.数据库的并发控制.数据的完整性.数据安全性. 5

PostgreSQL Replication之第二章 理解PostgreSQL的事务日志(4)

2.4 调整检查点和XLOG 目前为止,这一章已经提供深入洞察PostgreSQL如何写入数据,一般来说,XLOG是用来干什么的.考虑到这方面的知识,我们现在可以继续并学习我们能做些什么来使我们的数据库在复制和单台服务器运行的两种情况更加有效的工作. 2.4.1 理解检查点 在本章中,我们已经看到在数据可能到其它地方之前,它已经被写入到了XLOG.问题是,如果XLOG从未被删除,显然,在没有填满磁盘的同一时间,我们不会永远写到XLOG中. 要解决这个问题,XLOG必须在某一时刻被删除.这个过程就

SQL Server数据库学习总结

经过一段时间的学习,也对数据库有了一些认识,数据库基本是由表,关系,操作组成:对于初学者首先要学的 一图胜"十"言:SQL Server 数据库总结 一个大概的总结 经过一段时间的学习,也对数据库有了一些认识.  数据库基本是由表,关系,操作组成:对于初学者首先要学的:  1.数据库是如何存储数据的  表,约束,触发器  2.数据库是如何操作数据的  insert,update,delete T-sql 函数 存储过程 触发器  3.数据库是如何显示数据的  select SQLSer

05_NoSQL数据库之Redis数据库:Redis的常用命令,键值相关命令和服务器相关命令

 Redis常用命令 Redis提供了丰富的命令对数据库和各种数据库类型进行操作,这些命令可以再Linux终端使用. 键值相关命令: Keys:返回满足给定pattern的所有key 用表达式*表示取出所有的key 127.0.0.1:6379> keys * 1) "age" 2) "name" 3) "age2" 127.0.0.1:6379> keys a* 1) "age" 2) "age2&