2015-10-5系统崩溃记录

2015-10-5系统崩溃记录

在3系统级别切换至5系统级别的时候,出现了报错

[[email protected] linux]# init 5

Calling the system activity data collector (sadc)…

并且在切换到3系统级别的时候也是出现了同样的提示

Calling the system activity data collector (sadc)…

立刻拍摄当前系统快照,并且恢复上一次系统快照,进行系统级别切换的操作

之前快照版本的系统没有任何问题,再次切换到当前版本系统时,错误依旧

整理了一下两个版本系统之间我做的系统改动

  1. 我关闭了selinux防火墙
  2. 我更改了系统字体,由en-US改为了zh-CN
  3. 我把开机系统自动启动级别5改为了3
  4. 我关闭了大部分开机自启动服务
  5. 我更改了CRT远程服务的端口,由22改为了52113
  6. 我更改了网络监听地址,由0.0.0.0改为自己本身ip

进过逻辑排查,我排除了2.5.6的可能性,把原因锁定在了1.4上,但不排除3的可能性

按照顺序来,我先把selinux防火墙重新开启,发现了自己十月一日更改时做的备份,备份真的很重要,也方便很多,直接cp回来就OK了

[[email protected] selinux]# getenforce     

Disabled

[[email protected] selinux]# ls /etc/selinux/  

config                  restorecond.conf       semanage.conf

config.cp.20151001  restorecond_user.conf  targeted

重新开启防火墙,

[[email protected] selinux]# cp config.cp.20151001 config

cp: overwrite `config‘? y

检查一下

[[email protected] selinux]# cat config | grep  SELINUX=

SELINUX=enforcing

这个防火墙比较蛋疼,必须要重启

启动看到这个,selinux启动还要读条。。。

Selinux启动是搞定了,但是并没有什么作用提示依然存在

接着就更改启动级别

[[email protected] linux]# cat /etc/inittab

# inittab is only used by upstart for the default runlevel.

#

# ADDING OTHER CONFIGURATION HERE WILL HAVE NO EFFECT ON YOUR SYSTEM.

#

# System initialization is started by /etc/init/rcS.conf

#

# Individual runlevels are started by /etc/init/rc.conf

#

# Ctrl-Alt-Delete is handled by /etc/init/control-alt-delete.conf

#

# Terminal gettys are handled by /etc/init/tty.conf and /etc/init/serial.conf,

# with configuration in /etc/sysconfig/init.

#

# For information on how to write upstart event handlers, or how

# upstart works, see init(5), init(8), and initctl(8).

#

# Default runlevel. The runlevels used are:

#   0 - halt (Do NOT set initdefault to this)

#   1 - Single user mode

#   2 - Multiuser, without NFS (The same as 3, if you do not have networking)

#   3 - Full multiuser mode

#   4 - unused

 

#   5 - X11

#   6 - reboot (Do NOT set initdefault to this)

#

id:3:initdefault:

查看启动文件可以看到目前的启动级别是3级别,直接启动进来没有任何问题,那我现在改回到5级别为系统的默认启动级别,这里为了尽快处理问题为主,直接vi修改

修改好了再检查一下

[[email protected] linux]# cat /etc/inittab |grep id:

id:5:initdefault:

继续重启

然后发现,系统直接进不去了

卡在了读取界面

切换到CRT观察一下,意外的是CRT竟然登录进去了,说明系统启动完成了,只是无法加载图形化界面,那基本就可以确定了是关于5系统级别的某项启动服务没有开启

为了验证自己的猜想,在CRT下直接init 3切换一下级别

果然3级别直接让我输入账号密码准备让我登录了

既然确定具体原因了,就不浪费时间了,直接把矛头指向开机启动服务

我现在要做的就是把排除每一个启动服务,当然一些用肉眼看就能排除的就不需要额外浪费功夫了,比如network,ip6,VMtools等,为了减少工作量,我找到了上一个快照版本系统的启动服务的状态,能明显看出来,我关掉了很多

最后,罪魁祸首被抓了出来,messagebus这个服务

事件监控服务,负责在各个系统进程之间传递消息。google是这么定义它的

不过在我这里,他也就起到能init 5的作用,检查的时候还发现,我把haldaemon服务也给关掉了,平时都用CRT这些错误还真的很难发现

开启这两个服务的开机自启动

[[email protected] linux]# chkconfig |egrep ‘messagebus|haldaemon‘ | awk ‘{print "chkconfig " $1 " on"}‘ | bash

检查一下

[[email protected] linux]# chkconfig --list | egrep ‘messagebus|haldaemon‘

haldaemon       0:off   1:off   2:on    3:on    4:on    5:on    6:off

messagebus      0:off   1:off   2:on    3:on    4:on    5:on    6:off

然后init 5一下,登录成功

时间: 2024-10-15 12:18:40

2015-10-5系统崩溃记录的相关文章

我关注的一周技术动态 2015.10.04

分布式系统实践 1. Distributed Systems(电子书) http://www.printfriendly.com/print/v2?url=http://book.mixu.net/distsys/ebook.html# 要点: 免费的介绍分布式系统理论的电子书, 这本书的难度非常适合初学者, 涵盖了分布式系统的方方面面, 但是又没有深入细节而无法理解, 结合具体例子, 让分布式理论学起来也不那么枯燥了. 2. 分布式系统一致性的发展历史(一) http://www.dianro

Clover KextsToPatch 使用方法 2015.10.21

Clover KextsToPatch 使用方法 2015.10.21 前些天,因为 Thinkpad X230 BIOS 白名单限制,给她换了一块 ar9285 无线网卡,只是因为这块网卡正好可以被 Mac OS X 驱动,也正好在 Thinkpad X230 BIOS 白名单之中.给 Clover 配置的时候,为了防止忘记,便记录下来. 因为灵活使用 Clover 成为黑苹果用户的必修课,否则你就只能漫天寻找 kext,寄希望与运气能正确驱动你的硬件了.Clover 中有一个强大的功能 Ke

升级Windows 10 正式版过程记录与经验

升级Windows 10 正式版过程记录与经验 [多图预警]共50张,约4.6MB 系统概要: 预装Windows 8.1中文版 C盘Users 文件夹已经挪动到D盘,并在原处建立了符号链接.(我怀疑这是系统升级失败的原因) 本次升级目标: 保持正版Windows身份 尽量保留程序和设置 使用工具: Windows PE UltraISO等 注: 文中图片序号不连续.小数序号一般为照片.整数一般为截图. 本文为原创,URL:http://www.cnblogs.com/go2bed/p/4695

我关注的一周技术动态 2015.10.25

分布式系统实践 1. ScyllaDB:用 C++ 重写后的 Cassandra ,性能提高了十倍 http://blog.jobbole.com/93027/?hmsr=toutiao.io&utm_medium=toutiao.io&utm_source=toutiao.io 要点: 一直非常不喜欢hadoop系列对JVM的重度依赖, 可能是我不熟悉java的原因吧, 总感觉JVM背着我们做了很多不可见的工作, 心里不踏实. ScyllaDB宣称比Cassandra性能提高十倍, 肯定

我关注的一周技术动态 2015.10.18

分布式系统实践 1. 从Storm和Spark 学习流式实时分布式计算的设计 http://www.csdn.net/article/2014-08-04/2821018/1 要点: 流式计算并不是什么新鲜的东西, 相信很多同学也都用过. 不过之前流式计算往往都用在业务相关的地方, 随着大规模分布式系统对trace和metric数据收集的迫切需求, 基于时间序列数据库和流式计算就可以实现复杂的数据分析和汇聚功能, 这篇文章帮助大家理解流式计算的原理, 大家可以想象一下, 如果希望实时统计性能消耗

基于android4.4系统行车记录应用黑屏问题分析及对策

基于android4.4系统行车记录应用黑屏问题分析及对策 笔者最近遇到一个棘手的问题,那就是行车记录应用出现黑屏的问题,现象就是进入行车记录应用surface是黑的,录像文件几分钟一个的那种,每个文件的大小都是零.看到这个大家都非常重视,对于车载产品来说,行车记录功能需要保持长时间正常工作,出现这种问题肯定是不能接受的,必须解决!那这个问题是怎么出现的呢? 跟了很长时间,同时动用了8台相同的机器来单独做行车记录的拷机测试,12个小时内都不会出问题,但是超过24小时,就有那么2-3台机器会出现黑

批量创建10个系统用户,并且设置随机数密码

linux生成随机密码有很多方法,这里介绍两种,一种是内部系统变量($RANDOM),另一种是使用openssl. 内部系统变量($RANDOM)直接echo就可以获取到一组随机数: # echo $RANDOM 30468 获取8位随机数: #echo $RANDOM|md5sum |cut -c 1-8 393c839b 使用openssl命令获取随机数: # openssl rand -base64 8 qpIpWLYS6Yk= 获取8位随机数: # openssl rand -base6

OS X 10.10.4系统,命名为“Yosemite”(优胜美地)

新版OS X 10.10.4系统,命名为“Yosemite”(优胜美地),拥有全新的界面设计及一些功能更新,下面一起来了解一下. 一.界面扁平化.进一步融入iOS功能 首先,OS X 10.10 Yosemite最大变化来自于界面设计,全面向iOS 7的扁平化风格靠拢.可以看到,Dock栏和图标完全重新设计,同时添加了半透明效果.通知中心进一步强化,新增全天通知功能,并且支持天气.股票等小插件,实用性增强. 另外,Spotlight拥有了一个可以跳出到桌面中央的搜索栏,能够实现本地及网络搜索,包

系统崩溃分析

平台:MT55 F3700 现象:压测发现部分死机问题,遥控器无法待机,但主页.上下左右OK等按键仍起作用,无法播放视频,各信源下黑屏无法播放图像 关键log: 2014-06-28 14:50:45┇01-01 08:56:56.605   853  1005 F libc    : Fatal signal 11 (SIGSEGV) at 0x00000558 (code=1) 2014-06-28 14:50:45┇01-01 08:56:56.672   985  1266 I Acti