Tachyon基本使用04-----Tachyon配置项

一、Tachyon配置说明

Tachyon 配置参数分为4类:Master,Worker, Common (Master and Worker), and User configurations。

环境变量配置文件在$TACHYON_HOME/conf/tachyon-env.sh,这些变量将会被TACHYON_JAVA_OPTS调用,这个文件的配置模版为$TACHYON_HOME/conf/tachyon-env.sh.template

额外的Java VM选项可以添加到TACHYON_MASTER_JAVA_OPTS和TACHYON_WORKER_JAVA_OPTS配置中。在模板文件,TACHYON_JAVA_OPTS将会被TACHYON_MASTER_JAVA_OPTS和TACHYON_WORKER_JAVA_OPTS调用。

例如,如果你想使Java在7001端口远程调试在Master上,你可以修改TACHYON_MASTER_JAVA_OPTS是这样的:

exportTACHYON_MASTER_JAVA_OPTS="$TACHYON_JAVA_OPTS -agentlib:jdwp=transport=dt_socket,server=y,suspend=n,address=7001"

二、Tachyon常用配置

属性名 默认值 含义
tachyon.home "/mnt/tachyon_default_home" Tachyon的安装目录
tachyon.underfs.address $tachyon.home + "/underfs" Tachyon底层文件系统目录
tachyon.data.folder $tachyon.underfs.address + "/tachyon/data" Tachyon底层文件系统数据目录
tachyon.workers.folder $tachyon.underfs.address +
"/tachyon/workers"
Tachyon
worke目录
tachyon.usezookeeper false 是否使用zookeeper来进行master容错
tachyon.zookeeper.address null Zookeeper地址
tachyon.zookeeper.election.path "/election" Zookeeper选举文件夹
tachyon.zookeeper.leader.path "/leader" Zookeeperleader文件夹
tachyon.underfs.hdfs.impl "org.apache.hadoop.hdfs.DistributedFileSystem" HDFS底层文件系统实现类
tachyon.max.columns 1000 RawTable允许的最大列数,必须在客户端和服务器端设置
tachyon.table.metadata.byte 5242880 在RawTable的元数据中最大允许多少字节
fs.s3n.awsAccessKeyId null S3
AWS访问密钥ID
fs.s3n.awsSecretAccessKey null S3
aws 加密访问Key ID
tachyon.underfs.glusterfs.mounts null Glusterfs卷装入点,如/卷
tachyon.underfs.glusterfs.volumes null Glusterfs卷名,如tachyon_vol
tachyon.underfs.glusterfs.mapred.system.dir glusterfs:///mapred/system 根据需要指定GLusterfs中MapReduce的数据子目录

三、Master配置

tachyon.master.journal.folder $tachyon.home +"/journal/" master
journal log 存储目录
tachyon.master.hostname localhost Master主机名
tachyon.master.port 19998 Master节点运行端口
tachyon.master.web.port 19999 WEB接口运行端口
tachyon.master.whitelist / 缓存路径

四、Wroker配置

tachyon.worker.port 29998 Worker节点运行端口
tachyon.worker.data.port 29999 Worker数据服务运行端口
tachyon.worker.data.folder /mnt/ramdisk Worker节点数据目录
tachyon.worker.memory.size 128 MB Worker几点内存容量

五、用户配置

tachyon.user.failed.space.request.limits 3 文件系统终止之前的时间
tachyon.user.quota.unit.bytes 8
MB
客户端请求Worker几点的最小大小
tachyon.user.file.buffer.bytes 1 MB 文件缓冲区大小
tachyon.user.default.block.size.byte 1 GB Tachyon文件默认的block size
tachyon.user.remote.read.buffer.size.byte 1 MB 从远程worker读取数据的缓冲区大小
时间: 2024-10-05 18:23:55

Tachyon基本使用04-----Tachyon配置项的相关文章

tachyon 配置项

Tachyon 配置参数分为4类:Master,Worker, Common (Master and Worker), and User configurations. 环境变量配置文件在$TACHYON_HOME/conf/tachyon-env.sh,这些变量将会被TACHYON_JAVA_OPTS调用,这个文件的配置模版为$TACHYON_HOME/conf/tachyon-env.sh.template 额外的Java VM选项可以添加到TACHYON_MASTER_JAVA_OPTS和

Tachyon简介

发布人:南京大学PASA大数据实验室顾荣 Tachyon是什么 Tachyon(/'t?ki:??n/ 意为超光速粒子)是以内存为中心的分布式文件系统,拥有高性能和容错能力,能够为集群框架(如Spark.MapReduce)提供可靠的内存级速度的文件共享服务.从软件栈的层次来看,Tachyon是位于现有大数据计算框架和大数据存储系统之间的独立的一层.它利用底层文件系统作为备份,对于上层应用来说,Tachyon就是一个分布式文件系统. Tachyon诞生于UC Berkeley的AMPLab,其最

spark中使用的内存文件系统-Tachyon FS 简介

转自:http://blog.csdn.net/u014252240/article/details/41810849 发布人:南京大学PASA大数据实验室顾荣 1. Tachyon是什么 Tachyon(/'t?ki:??n/ 意为超光速粒子)是以内存为中心的分布式文件系统,拥有高性能和容错能力,能够为集群框架(如Spark.MapReduce)提供可靠的内存级速度的文件共享服务.Tachyon诞生于UC Berkeley的AMPLab,由该实验室的李浩源童鞋初创.2012年12月,Tachy

Spark入门实战系列--10.分布式内存文件系统Tachyon介绍及安装部署

1 Tachyon介绍 1.1 Tachyon简介 随着实时计算的需求日益增多,分布式内存计算也持续升温,怎样将海量数据近乎实时地处理,或者说怎样把离线批处理的速度再提升到一个新的高度是当前研究的重点.近年来,内存的吞吐量成指数倍增长,而磁盘的吞吐量增长缓慢,那么将原有计算框架中文件落地磁盘替换为文件落地内存,也是提高效率的优化点. 目前已经使用基于内存计算的分布式计算框架有:Spark.Impala及SAP的HANA等.但是其中不乏一些还是有文件落地磁盘的操作,如果能让这些落地磁盘的操作全部落

《SPARK/TACHYON:基于内存的分布式存储系统》-史鸣飞(英特尔亚太研发有限公司大数据软件部工程师)

史鸣飞:大家好,我是叫史鸣飞,来自英特尔公司,接下来我向大家介绍一下Tachyon.我事先想了解一下大家有没有听说过Tachyon,或者是对Tachyon有没有一些了解?对Spark呢? 首先做一个介绍,我来自英特尔的大数据团队,我们团队主要是致力于各种大数据的软件开发以及这些软件在工业界的推广和应用,我所在的团队主要负责Spark及其软件栈的开发和推广.我们是国内最早参加Spark开发和推广的团队,我们在2012年就加入了Spark社区.在Spark和相关的项目中间投入了大量的人力,长期以来我

Spark(十二) -- Spark On Yarn & Spark as a Service & Spark On Tachyon

Spark On Yarn: 从0.6.0版本其,就可以在在Yarn上运行Spark 通过Yarn进行统一的资源管理和调度 进而可以实现不止Spark,多种处理框架并存工作的场景 部署Spark On Yarn的方式其实和Standalone是差不多的,区别就是需要在spark-env.sh中添加一些yarn的环境配置,在提交作业的时候会根据这些配置加载yarn的信息,然后将作业提交到yarn上进行管理 首先请确保已经部署了Yarn,相关操作请参考: hadoop2.2.0集群安装和配置 部署完

Tachyon基本使用02-----Tachyon本地模式安装

一.配置系统环境 1.清除默认防火墙规则 # service iptables save iptables:将防火墙规则保存到 /etc/sysconfig/iptables:     [确定] 2.关闭Selinux # cat /etc/sysconfig/selinux |grep SELINUX|grep -v ^# SELINUX=disabled  SELINUXTYPE=targeted  # 3.配置ip地址 # cat /etc/sysconfig/network-script

Tachyon:Spark生态系统中的分布式内存文件系统

转自: http://www.csdn.net/article/2015-06-25/2825056  摘要:Tachyon把内存存储的功能从Spark中分离出来, 使Spark可以更专注计算的本身, 以求通过更细的分工达到更高的执行效率. Tachyon是Spark生态系统内快速崛起的一个新项目. 本质上, Tachyon是个分布式的内存文件系统, 它在减轻Spark内存压力的同时,也赋予了Spark内存快速大量数据读写的能力.Tachyon把内存存储的功能从Spark中分离出来, 使Spar

Tachyon Cluster: 基于Zookeeper的Master High Availability(HA)高可用配置实现

1.Tachyon简介 Tachyon是一个高容错的分布式文件系统,允许文件以内存的速度在集群框架中进行可靠的共享,就像Spark和 MapReduce那样.通过利用信息继承,内存侵入,Tachyon获得了高性能.Tachyon工作集文件缓存在内存中,并且让不同的 Jobs/Queries以及框架都能内存的速度来访问缓存文件.因此,Tachyon可以减少那些需要经常使用的数据集通过访问磁盘来获得的次数. 2.Tachyon能解决什么问题:(摘自Tachyon 分布式内存文件系统) 1.不同Fra