spark 查看 job history 日志

SPARK_HOME/conf 下:

spark-defaults.conf 增加如下内容

spark.eventLog.enabled true 
spark.eventLog.dir hdfs://master:8020/var/log/spark 
spark.eventLog.compress true

spark-env.sh 增加如下内容

export SPARK_HISTORY_OPTS=”-Dspark.history.ui.port=18080 -Dspark.history.retainedApplications=3 -Dspark.history.fs.logDirectory=hdfs:/master.et2:8020/var/log/spark”

启动start-history-server.sh

SPARK_HOME/conf 下: 执行 ./start-history-server.sh

spark job history web: master:18080

这样在spark任务运行完成之后,就可以通过web页面查看日志了

history server相关的配置参数描述

  1. spark.history.updateInterval 
      默认值:10 
      以秒为单位,更新日志相关信息的时间间隔
  2. spark.history.retainedApplications 
      默认值:50 
      在内存中保存Application历史记录的个数,如果超过这个值,旧的应用程序信息将被删除,当再次访问已被删除的应用信息时需要重新构建页面。
  3. spark.history.ui.port 
      默认值:18080 
      HistoryServer的web端口
  4. spark.history.kerberos.enabled 
      默认值:false 
      是否使用kerberos方式登录访问HistoryServer,对于持久层位于安全集群的HDFS上是有用的,如果设置为true,就要配置下面的两个属性
  5. spark.history.kerberos.principal 
      默认值:用于HistoryServer的kerberos主体名称
  6. spark.history.kerberos.keytab 
      用于HistoryServer的kerberos keytab文件位置
  7. spark.history.ui.acls.enable 
      默认值:false 
      授权用户查看应用程序信息的时候是否检查acl。如果启用,只有应用程序所有者和spark.ui.view.acls指定的用户可以查看应用程序信息;否则,不做任何检查
  8. spark.eventLog.enabled 
      默认值:false 
      是否记录Spark事件,用于应用程序在完成后重构webUI
  9. spark.eventLog.dir 
      默认值:file:///tmp/spark-events 
      保存日志相关信息的路径,可以是hdfs://开头的HDFS路径,也可以是file://开头的本地路径,都需要提前创建
  10. spark.eventLog.compress 
      默认值:false 
      是否压缩记录Spark事件,前提spark.eventLog.enabled为true,默认使用的是snappy

以spark.history开头的需要配置在spark-env.sh中的SPARK_HISTORY_OPTS,以spark.eventLog开头的配置在spark-defaults.conf 
尊重原创,未经允许不得转载:http://blog.csdn.net/stark_summer/article/details/46459701

时间: 2024-12-14 19:43:36

spark 查看 job history 日志的相关文章

Ubuntu启动、停止、重启MySQL,查看MySQL错误日志、中文编码错误

1)启动: sudo /etc/init.d/mysql start 2)停止: sudo /etc/init.d/mysql stop 3)重启: sudo /etc/init.d/mysql restart 4)查看日志: cat /var/log/mysql.err cat /var/log/mysql/error.log 5)不支持中文 修改 /etc/mysql/my.cnf 在 [client] 下面增加: default-character-set=utf8 或 character

mysqlbinlog 查看mysql bin 日志 mysqlbinlog: unknown variable 'default-character-set=utf8'

mysqlbinlog  mysql-bin.000036 | less 查询包含几个字段的语句: mysqlbinlog mysql-bin.000036| egrep '(2011030610002460|2011030310001730|2011030410011680|2011030410006280)' mysqlbinlog查看二进制日志的问题 在使用mysqlbinlog查看日志的时候碰到了一个问题, 错误提示如下:/usr/local/mysql/bin/mysqlbinlog:

Linux系统 multitail 同时跟踪查看多个日志文件

一.问题描述: 平时我们在排查问题的时候往往需要查看日志文件来定位问题,有些程序可能关联的多个程序,因此需要打开多个窗口使用 tailf 或者tail -f 方式查看日志 但是需要不停的切换窗口来看不同的日志输出,比较麻烦,特别是想在同一时刻查看不同的日志文件的时候,手速再快也切换不过来的.因此 此文的主角  multitail 工具就解决这个问题的. 二.multitail 工具安装 1.系统环境 [[email protected] ~]# cat /etc/redhat-release C

查看与输出日志信息

查看与输出日志信息: 1.优先级级别从高到低: Error > Warning > Info > Debug > Verbose 2.日志输出的3种方式: (1)       Log.i (2)       System.out.println (3)       System.err.println 3.实践: 1 package com.example.test; 2 3 import android.test.AndroidTestCase; 4 import android

linux下打开、关闭tomcat,实时查看tomcat执行日志

?? 启动:通常是运行sh tomcat/bin/startup.sh 停止:通常是运行sh tomcat/bin/shutdown.sh脚本命令 查看:运行ps -ef |grep tomcat 输出例如以下 *** 5144   .. .等等.Bootstrap start 说明tomcat已经正常启动. 5144 就为进程号 pid = 5144 杀死:kill -9 5144 ------------------------linux下实时查看tomcat执行日志------------

查看系统事件日志

Win8查看系统事件日志的方法如下: 1.按快捷键win+Q打开应用界面,选择控制面板,进入控制面板,点击“系统和安全”. 2.点击“查看事件日志”. 3.进入事件查看器的第二种方法:在桌面“计算机”图标上面点击右键,选择“管理”. 4.在计算机管理界面选择“事件查看器”. 5.进入事件查看器界面,在此可查看系统事件日志. 6.点击windows日志. 7.将windows日志展开后可以查询到详细信息.

如何查看crontab的日志记录

在Unix和类Unix的操作系统之中,crontab命令常用于设置周期性被执行的指令,也可以理解为设置定时任务. crontab中的定时任务有时候没有成功执行,什么原因呢?这时就需要去日志里去分析一下了,那该如何查看crontab的日志记录呢? 1. linux 看 /var/log/cron.log这个文件就可以,可以用tail -f /var/log/cron.log观察 2. unix 在 /var/spool/cron/tmp文件中,有croutXXX001864的tmp文件,tail

在多个邮件服务器上查看邮件跟踪日志

命令分解: 1.获取组织内的所有邮件服务器 $Servers = Get-ExchangeServer 2.获取 HUB 服务器 $Servers | where {$_.isHubTransportServer -eq $true -or $_.isMailboxServer -eq $true} 3.查询指定时间 master 到zhaodongwei 发送成功的邮件 Get-MessageTrackingLog -Sender [email protected] -Start "2018-

【docker】docker logs-查看docker容器日志

引用地址 https://www.jianshu.com/p/1eb1d1d3f25e 通过docker logs命令可以查看容器的日志. 命令格式: $ docker logs [OPTIONS] CONTAINER Options: --details 显示更多的信息 -f, --follow 跟踪实时日志 --since string 显示自某个timestamp之后的日志,或相对时间,如42m(即42分钟) --tail string 从日志末尾显示多少行日志, 默认是all -t, -