alluxio2.0特性-预览

项目地址

https://github.com/Alluxio/alluxio/tree/branch-2.0-preview

2.0版本-构思和设计

支持超大规模数据工作负载

Alluxio作为计算和存储之间的数据编排层,使数据移动并且可以跨多个不同的存储系统访问:HDFS,对象存储,网络附加存储,随着时间的推移,Alluxio需要的元数据支持规模 提供可以轻松超过最大的Hadoop部署。 特别是元数据管理被认为是Hadoop的弱点,但Alluxio应该将元数据管理变成一种优势。

更友好的数据工程界面

Alluxio的创建重点是基于Hadoop的计算工作负载。 但是多年来,数据密集型计算工作负载的数量和类型已经爆炸式增长,并且在现有数据或新数据存储系统上实现这些工作负载的数据编排和工程设计非常重要。 特别是,在机器学习和深度学习培训之前,需要许多数据工程,包括手动数据移动。 Alluxio应该通过为数据科学家提供本地已知API同时减少所需的数据工程来大大简化这一过程。

使存储和计算更加分离

整个企业中的数据孤岛只会随着跨多个Hadoop集群的数据而增加,越来越多地存在于许多不同的对象存储中,并且在一些情况下存储在内部或公共云中。 这使得计算与数据分解变得更加困难,因为数据处理被移动到与存储数据的位置不同的位置时,数据位置和访问受到严重影响。 Alluxio应该通过抽象存储同时使数据更易于访问,继续实现计算和存储的分离。

2.0版本-进步和功能

Alluxio 2.0包含许多增强功能,以支持项目的设计目标,所有开源都将包含在Community Edition中!

支持超大规模数据工作负载

  • 支持超过10亿个文件 - 2.0引入了分层元数据管理的新选项,以支持具有超过10亿个文件的单个群集部署。我们使用RocksDB进行非堆存储,现在是默认的。热数据的元数据继续存储在堆上的进程内存中,而其余元数据由进程内存外的Alluxio管理。 alluxio.master.metastore可以配置为仅更改为堆。
  • 高度分布式数据服务 - 2.0引入了Alluxio作业服务,这是一种分布式集群服务,现在可以使用复制,持久性,交叉存储移动和分布式负载等数据操作,从而实现高性能和大规模扩展。看一下Alluxio支持的所有文件系统API。
  • 增强数据局部性的自适应复制 - 为自动管理的Alluxio中存储的数据副本配置范围的新功能。 alluxio.user.file.replication.max和alluxio.user.file.replication.min可用于指定范围。可在此处找到所有用户配置的完整列表
  • 嵌入式日志的高可用性 - 文件和对象元数据的新容错和高可用性模式称为嵌入式日志,它使用RAFT一致性算法,独立于任何其他外部存储系统。这对于抽象对象存储特别有用。了解如何在此配置嵌入式日记

在任何存储上启用机器学习和深度学习工作负载

机器学习和深度学习框架需要从Hadoop和对象存储中提取数据,这通常是一个非常手动且耗时的过程。

  • Alluxio POSIX API Alluxio的FUSE功能支持POSIX兼容API,因此TensorFlow,Caffe和其他基于Python的模型等框架可以使用传统的文件系统访问通过Alluxio直接访问任何存储系统中的数据。了解有关POSIX API的更多信息。

更好的存储抽象,实现完全独立和弹性的计算

  • 支持不同版本的HDFS集群 - 数据的爆炸性增长导致企业拥有许多数据孤岛,包括跨多个不同版本的多个Hadoop集群。目前,跨这些集群的统一访问非常困难。使用Alluxio 2.0,用户可以使用Alluxio的任何版本连接到多个HDFS集群,并统一数据访问。在此处查找支持的HDFS版本列表。
  • 与Hadoop主动同步 - 新功能与HDFS iNotify集成,可更新存储在Hadoop中的文件所发生的任何数据和元数据更改,允许应用程序通过Alluxio访问数据,以主动接收最新更新。

原文地址:https://www.alluxio.com/blog/announcing-alluxio-20-preview-enabling-hyper-scale-data-workloads-in-the-cloud

原文地址:https://www.cnblogs.com/victor2302/p/10519450.html

时间: 2024-11-10 11:22:40

alluxio2.0特性-预览的相关文章

C# 6.0 功能预览 (二)

在Language Feature Status上面看到,其实更新的并不是特别多,为了不会误导看了C# 6.0 功能预览 (一)的园友,现在把官方的更新列表拿了过来,供大家参考 Roslyn 编译平台概述 示例 语法可视化工具 蓝图 语言功能状态 语言设计说明 FAQ 语言功能实现状态 存在: 在以前的版本中已经存在 完成: 已经在该版本中实现 计划: 预计在该版本中 可能: 预计可能在该版本中 撤销: 可能不在该版本中 没有: 该版本中没有 N/A: 没有意义 功能 例子 C# Primary

Spark3.0 preview预览版尝试GPU调用(本地模式不支持GPU)

Spark3.0 preview预览版可以下载使用,地址:https://archive.apache.org/dist/spark/spark-3.0.0-preview/,pom.xml也可以进行引用,如下: <dependencies> <dependency> <groupId>junit</groupId> <artifactId>junit</artifactId> <version>3.8.1</ver

Vue.js 3.0 新特性预览

总结起来,Vue 3 以下方面值得我们期待 : 更快 更小 更易于维护 更多的原生支持 更易于开发使用 完整的PPT:docs.google.com/presentatio… Evan 和 Vue 团队的目标是尽可能顺利地过渡到 Vue 3 ,在这个过程中,这些变化在无形地改善了框架. 让 Vue 更快 虽然 Vue 已经非常快了,但 Evan 认为 Vue 3 会更快.如何做到呢… 重写虚拟DOM (Virtual DOM Rewrite) 随着虚拟 DOM 重写,我们可以期待更多的 编译时(

Office 2016 正式发布——新特性预览

今天微软又发生了一件大事!Windows Office 2016正式发布,这标志着Windows Office 又达到了一个新的里程碑! 全新的Office 发布为Office 365 用户带来了新的价值,它不仅与Windows 10完美匹配,并且更加重视商业安全.用户使用这些新功能特性能够更加流畅的工作,不受干扰.随着Windows 2016发布,Mac Office 2016也同期上线. 全新的Office 体验——让团队协作更加便捷高效 全新的Office 让团队协作变得更加轻松便捷,Of

CSS3_新特性预览

一.强大的CSS选择器 以前我们通常用class. ID 或 tagname 来选择HTML元素,CSS3的选择器强大的难以置信.  它们可以减少在标签中的class和ID的数量更方便的维护样式表.更好的实现结构与表现的分离. 二.圆角效果 以前做圆角通常使用背景图片,或繁琐的元素拼凑,现在很简单了 border-radius 帮你轻松搞定.   三.块阴影与文字阴影 可以对任意DIV和文字增加投影效果. 四.新的颜色制式和透明设定 CSS3支持更多的颜色和更广泛的颜色定义.新颜色CSS3支持H

Eova 1.2 正式版 新特性预览

效率决定成本,细节决定成败!Eova不仅仅是快速开发,让你有更多的时间完善细节和业务! Form流式布局:多列显示,视野开阔 前端验证:提升性能,提升体验,保障业务 红色必填项:一目了然输入提示:快速理解字段含义默认值显示:初始显示默认值,减少操作

在 Databricks 可获得 Spark 1.5 预览版

我们兴奋地宣布,从今天开始,Apache Spark1.5.0的预览数据砖是可用的.我们的用户现在可以选择提供集群与Spark 1.5或先前的火花版本准备好几个点击. 正式,Spark 1.5预计将在数周内公布,和社区所做的QA测试的版本.鉴于火花的快节奏发展,我们觉得这是很重要的,使我们的用户尽快开发和利用新特性.与传统的本地软件部署,它可以需要几个月,甚至几年,从供应商收到软件更新.数据砖的云模型,我们可以在几小时内更新,让用户试他们的火花版本的选择. What's New? The las

JavaScript 图片上传预览效果

图片上传预览是一种在图片上传之前对图片进行本地预览的技术.使用户选择图片后能立即查看图片,而不需上传服务器,提高用户体验.但随着浏览器安全性的提高,要实现图片上传预览也越来越困难.不过群众的智慧是无限的,网上已经有很多变通或先进的方法来实现.例如ie7/ie8的滤镜预览法,firefox 3的getAsDataURL方法.但在opera.safari和chrome还是没有办法实现本地预览,只能通过后台来支持预览.在研究了各种预览方法后,作为总结,写了这个程序,跟大家一起分享.上次写的简便无刷新文

微信接口图文消息群发,预览

上来就直接贴代码了,具体问题放到最后说,这个类我将方法全都封装在里面了,基本上拿去修改一下就可以用了 using System;using System.Collections.Generic;using System.Linq;using System.Web;using System.Text.RegularExpressions;using Newtonsoft.Json;using System.Web.SessionState;using Website_CS;using mgtArt