luigi学习-luigi的配置文件

一、luigi配置文件的加载顺序

/etc/luigi/client.cfg

luigi.cfg

LUIGI_CONFIG_PATH环境变量

二、配置文件分节

配置文件被分为了多个section,每一个控制着不同方面的配置

三、利用配置文件来给参数赋值

如果你有这样的一个类:

class DailyReport(luigi.contrib.hadoop.JobTask):
    date = luigi.DateParameter(default=datetime.date.today())
    # ...

你可以使用配置文件的方式赋值,并且将覆盖参数的默认值:

[DailyReport]
date=2012-01-01

四、Configuration classes

配置文件的内容可以作为全局的变量来使用

配置文件:

[mysection]
option=hello
intoption=123

使用python代码来读取:

import luigi

# Config classes should be camel cased
class mysection(luigi.Config):
    option = luigi.Parameter(default=‘world‘)
    intoption = luigi.IntParameter(default=555)

mysection().option
mysection().intoption

 五、配置选项

5.1hadoop的配置项

commad=hadoop  #hadoop作业提交的命令,默认值就是hadoop

python-executable=python  #运行python程序的命令,默认值就是python

scheduler=fair  #hadoop的作业调度器,可以是fair或者capacity,默认值是fair

streaming-jar  #streaming jar的路径,必须制定

version=cdh4  #hadoop集群的版本,可以是"cdh3","cdh4"或者"apache1",默认值是"cdh4"

时间: 2024-10-08 10:17:30

luigi学习-luigi的配置文件的相关文章

luigi学习1

一.luigi介绍 luigi是基于python语言的,可帮助建立复杂流式批处理任务管理系统.这些批处理作业典型的有hadoop job,数据库数据的导入与导出,或者是机器学习算法等等. luigi的github:https://github.com/spotify/luigi 目前已经有一些抽象层次较低的数据处理工具,比如hive,pig,cascading等.luigi并不是要取代他们,而是帮助你管理这些作业,luigi的task可以是一个hive查询,java写的hadoop作业,一个sc

JavaEE学习之Maven配置文件pom.xml详解(转)

一.引言 (本文转载自:http://blog.csdn.net/longeremmy/article/details/9670619) 使用maven有一些时间了,一直没有好好将pom配置文件每个节点的意义好好了解一番.今天突然想来了解下:pom- project object model 项目对象模型.顾名思义,他是用来描述项目信息的,以及构建方式,依赖等.网上有一篇文章写的很详细,这里就借用一下,以备日后使用. 二.详解 1 <project xmlns="http://maven.

luigi学习2-在hadoop上运行Top Artists

一.AggregateArtistsHadoop class AggregateArtistsHadoop(luigi.contrib.hadoop.JobTask): date_interval = luigi.DateIntervalParameter() def output(self): return luigi.contrib.hdfs.HdfsTarget("data/artist_streams_%s.tsv" % self.date_interval) def requ

maven 学习---Maven 构建配置文件

什么是构建配置文件? 构建配置文件是一组配置的集合,用来设置或者覆盖 Maven 构建的默认配置.使用构建配置文件,可以为不同的环境定制构建过程,例如 Producation 和 Development 环境. Profile 在 pom.xml 中使用 activeProfiles / profiles 元素指定,并且可以用很多方式触发.Profile 在构建时修改 POM,并且为变量设置不同的目标环境(例如,在开发.测试和产品环境中的数据库服务器路径). Profile 类型 Profile

MyBatis学习--SqlMapConfig.xml配置文件

简介 SqlMapConfig.xml是MyBatis的全局配置文件,在前面的文章中我们可以看出,在SqlMapConfig.xml主要是配置了数据源.事务和映射文件,其实在SqlMapConfig.xml中还可以配置很多信息,如: 1.properties(属性) 2.settings(全局配置参数) 3.typeAliases(类型别名) 4.typeHandlers(类型处理器) 5.objectFactory(对象工厂) 6.plugins(插件) 7.environments(环境集合

Spring Boot学习——Spring Boot配置文件application

Spring Boot配置文件有两种格式: application.properties 和 application.yml.两种配置文件只需要使用一个. 这两种配置文件的语法有些区别,如下 1. application.properties server.port = 8080         -- tomcat 端口 server.context-path = /webName    -- URL路径 2. application.yml server: port: 8080        

Prism 学习:从配置文件中加载 Module

之前我们已经了解过,如何从指定的目录中来加载 Module(原文),现在我们来看,如何从应用程序的配置文件中来加载 Module.以这种方式来加载 Module 的优点包括:1. 被加载的 Module 不需要被引用到主程序中:2. 配置文件可以根据实际情况修改,而不需要重新编译程序. 大概需要以下几步: 1. 将 Module 所在的类库文件复制到应用程序所在的地方,可以与主程序同目录,也可以在主程序下的子目录中: 2. 在 Bootstrapper 中重载 CreateModuleCatal

struts学习之struts配置文件详解

在struts中如果使用到其他拦截器,一定要放在核心拦截器之前,否则不起作用. 在struts中可以使用servlet. <?xml version="1.0"encoding="UTF-8" ?> <!DOCTYPE struts PUBLIC "-//Apache Software Foundation//DTD StrutsConfiguration 2.0//EN" "http://struts.apache.

git学习——&lt;一&gt;git配置文件

一.git所有配置文件 <一>./etc/gitconfig全局配置文件 修改该配置文件,会对所有用户有影响. 使用git config --system来配置该文件 <二>.~/.gitconfig当前用户配置文件 ~代表当前用户的家目录 使用git config --global来配置该文件 <三>..git/config版本库配置文件    在版本库中.git目录下 使用git config --local配置该文件 *三个配置文件,从上到下管理范围逐渐变小,操作