gluster brick进程启动失败处理方法

环境说明:

复制卷,centos 7下,gluster版本3.6.7

故障现象:

# gluster v status tank

Status of volume: tank

Gluster processPortOnlinePid

------------------------------------------------------------------------------

Brick w-ostack03.sys.bjdt.net:/data/tank49152Y30371

Brick w-ostack04.sys.bjdt.net:/data/tankN/ANN/A

NFS Server on localhost2049Y29320

Self-heal Daemon on localhostN/AY29337

NFS Server on w-ostack03.sys.bjdt.net2049Y17638

Self-heal Daemon on w-ostack03.sys.bjdt.netN/AY30385

Task Status of Volume tank

------------------------------------------------------------------------------

There are no active volume tasks

故障log:

[2016-04-08 03:24:33.909878] I [graph.c:269:gf_add_cmdline_options] 0-tank-server: adding option ‘listen-port‘ for volume ‘tank-server‘ with value ‘49152‘

[2016-04-08 03:24:33.909921] I [graph.c:269:gf_add_cmdline_options] 0-tank-posix: adding option ‘glusterd-uuid‘ for volume ‘tank-posix‘ with value ‘6b2cfe95-1eb1-4510-b7db-af34ba73162c‘

[2016-04-08 03:24:33.911030] I [rpcsvc.c:2142:rpcsvc_set_outstanding_rpc_limit] 0-rpc-service: Configured rpc.outstanding-rpc-limit with value 64

[2016-04-08 03:24:33.911090] W [options.c:898:xl_opt_validate] 0-tank-server: option ‘listen-port‘ is deprecated, preferred is ‘transport.socket.listen-port‘, continuing with correction

[2016-04-08 03:24:33.912278] E [posix.c:5632:init] 0-tank-posix: Extended attribute trusted.glusterfs.volume-id is absent

[2016-04-08 03:24:33.912297] E [xlator.c:425:xlator_init] 0-tank-posix: Initialization of volume ‘tank-posix‘ failed, review your volfile again

[2016-04-08 03:24:33.912306] E [graph.c:322:glusterfs_graph_init] 0-tank-posix: initializing translator failed

[2016-04-08 03:24:33.912315] E [graph.c:525:glusterfs_graph_activate] 0-graph: init failed

[2016-04-08 03:24:33.912689] W [glusterfsd.c:1211:cleanup_and_exit] (--> 0-: received signum (0), shutting down

故障分析:

# getfattr -dm . -e hex tank

查看对应brick目录,缺少扩展属性。

解决方案:

扩展属性很多,这里只需要手动添加trusted.glusterfs.volume-id属性即可。

实例操作如下:

setfattr -n trusted.glusterfs.volume-id -v 0xd810be517a524864bfa7e94fd52c4dbc tank

然后重启服务:

systemctl restart glusterd.service   # centos 7上操作命令

service glusterd restart

故障解决,然后如果是复制卷,可以执行heal命令,恢复未数据。

gluster volume heal tank full

完美解决。

时间: 2024-08-28 17:33:25

gluster brick进程启动失败处理方法的相关文章

进程启动失败:安全问题 Xcode process launch failed: Security Xcode

Xcode 进程启动失败:安全问题,模拟器中没有问题,实体机器上不行 花了大约一周到两周的时间开发了一块app,昨天把 iPhone 5S 升级到了 iOS 8 GM 系统,升级没什么问题,测试app也没有什么问题,当我从 iPhone 5S 上删除掉我的app,并且重新构建的时候,出现了如下的错误. 1 2 Could not launch "My App" process launch failed: Security 于是我紧接着使用模拟器测试了一遍,没有问题,初步原因是 iPh

Mongodb分片配置服务器不同步导致mongos进程启动失败

生产环境中,使用的mongodb分片,由于突然断电,服务再起来的时候发现三个mongos进程中有一个启动失败,多次尝试仍不能启动.查看日志,内容如下: 大概意思是配置服务器configserver数据不同步. 解决办法: 杀死所有mongos进程 连接到每个分片的configserver,运行命令db.runCommand('dbhash') 找到MD5值,这时两个能正常运行的MD5值是一样的,不能正常运行的MD5和上面俩都不一样 删除不能正常运行的dbpath,将能正常运行的dbpath下的数

ORA-01078和LRM-00109问题导致ORACLE启动失败解决方法

操作环境 SuSE11 + ORACLE11gR2(11.2.0.3) 问题现象 新安装ORACLE启动失败,提示ORA-01078和LRM-00109错误.具体错误现象如下 SQL> startup ORA-01078: failure in processing system parameters LRM-00109: could not open parameter file '/home/oracle/base/dbs/initora11g.ora'  问题分析 根据错误分析是查找不到参

Android Studio ADB启动失败解决方法

在用Android studio启动自己的Android代码的时候,出现adb not responding. 解决方法: 1.输入netstat -aon|findstr "5037",可以看到进程号为5196的进程(这个进程号因机器和时间而异)在占用5037端口(adb需要使用此端口). 2.打开任务管理器,选择“进程”选项卡,点击选项栏“查看-选择列...”,勾选“PID(进程标识符)”,点确定.会看到每个进程都会显示它们的PID了.找到进程号为5196的进程,结束这个进程,ki

Postgresql数据库autovacuum进程启动失败

最近线上Postgresql数据库中其中几台服务器更新时变得非常慢,经过排查和对比,发现时因为autovacuum未启动导致的. 1.使用表pg_stat_all_tables查看autovacuum执行记录 select schemaname,relname,last_autovacuum,last_autoanalyze from pg_stat_all_tables; 如上图,发现所有的对象对应的analyze及vacuum执行记录均为空. 2.使用ps -ef | grep postgr

xampp中apache点击启动失败解决方法

错误提示: 9:15:53 AM  [Apache] Error: Apache shutdown unexpectedly.9:15:53 AM  [Apache] This may be due to a blocked port, missing dependencies, 9:15:53 AM  [Apache] improper privileges, a crash, or a shutdown by another method.9:15:53 AM  [Apache] Press

tomcat作为windows服务启动失败解决方法

再使用如下方法注册windows服务时,出现问题: 1 set CATALINA_BASE=E:\tomcat\tomcat-web-server 2 set CATALINA_HOME=E:\tomcat\tomcat-web-server 3 call E:\tomcat\tomcat-web-server\bin\service.bat install tomcat-web-server 原因是CATALINA_BASE路径设置错了,尾部包含了空格,要格外注意.

License Manager 10.3启动失败解决方法

参考:http://jingyan.baidu.com/article/c275f6bac8763ae33d756788.html 安装ARCGIS10.3过程中无法启动license. 解决办法: 进入License10.3安装目录的bin目录下,在CMD中执行以下命令: C:\Program Files (x86)\ArcGIS\License10.3\bin>lmgrd -z -c service.txt 注意:输入的第一个字母时L不是I 执行完毕后如下图: 此时License Manag

SSH启动失败解决方法

今天连接linux时居然连不上,报错信息是: 查了一下终于找到了解决办法,只需要一些命令 : cd /etc/ssh sudo chmod 644 ./* sudo chmod 600 ssh_host_dsa_key sudo chmod 600 ssh_host_rsa_key sudo chmod 755 . 然后重启: /etc/init.d/sshd restart Linux上的SSH无法启动 首先通过物理终端进入到linux上,手工检查ssh发现没运行 # /etc/init.d/