检測磁盘驱动的健康程度SMART

在server中,全部组件中一般最easy坏掉的就是磁盘。所以一般採取RAID来保证系统的稳定性,通过冗余磁盘的方式防止磁盘故障。

现代硬件驱动器一般支持SMART(自我监測分析和报告技术),它可以监视整个硬盘驱动器的健康状况。而且当硬盘驱动器即将故障的时候会发出警告。

一般硬件厂商提供的磁盘工具,是在系统重新启动后检查磁盘驱动的健康状况,而SMART能够不用重新启动系统就能够检查硬盘驱动器的健康程度。

在linux中,工具包的名字为smartmontools

在centos中能够使用 yum install smartmontools来安装工具

首先通过smartctl -i /dev/sda 来检查一下硬盘是否具有 SMART 特性

以下是smart工具的说明文档,里面有具体的说明

http://smartmontools.sourceforge.net/smartmontools_scsi.html

这个是我在虚拟机中測试的不支持

这个是我在真server中測试的,支持

watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvZGFwZW5nMDExMg==/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center" >

SMART support 是 Disabled 状态的话,须要开启 SMART 的支持:

smartctl -s on /dev/sda

然后使用smartctl -H /dev/sda来检測磁盘的健康状况

查看/dev/sda当前总体监控状态。PASSED表示健康。否则意味着磁盘已经故障。或非常快就会发生问题。

使用

smartctl -t short /dev/sda

做一个高速自检

smartctl -l selftest /dev/sda

查看自检的进度和结果

使用smartctl -t long /dev/sda 做长时间自检,这个非常耗时,一般放在凌晨

使用smartctl -l error /dev/sda查看出错日志

watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvZGFwZW5nMDExMg==/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center" >

在这里,我的读、写都没有错误发生。在Non-medium error count 中出现错误6。

我一直没有搞懂(非媒介错误计数)这个是什么意思。在官方文档查了一下。出现例如以下:

non-medium error counter (only a single number displayed). This represents the number of recoverable events other than write, read or verify errors.

我大致理解了一下,是除了read,write,verify errors的错误,可恢复事件的数量

查看全部信息

打印/dev/sda全部的SMART信息。

smartctl  -a  /dev/sda

相当于依次运行:

smartctl  –i  /dev/sda

smartctl  -c  /dev/sda

smartctl  -A  /dev/sda

smartctl  -l  error  /dev/sda

smartctl  -l  selftest  /dev/sda

smartctl  -l  selective  /dev/sda

开/关SMART功能

打开或关闭/dev/sda 的SMART功能。

smartctl  -s  on/off  /dev/sda

查看当前SMART功能是否开启,能够使用 –i 參数。

smartctl  -i  /dev/sda

离线測试

对/dev/sda进行离线測试,它的结果主要用来更新SMART 属性。

smartctl  -t  offline  /dev/sda

观察測试进度

通过-c 參数。能够观察到測试的进度:

smartctl -c    /dev/sda

smartctl參数帮助

-h                帮助信息

-V                版本号信息

-i                打印基本信息(磁盘设备号、序列号、固件版本号…)

-a      打印磁盘全部的SMART信息

执行时行为 參数:

-q  TYPE        指定输出的安静模式。

TYPE能够有3种选择:

eorsonly                仅仅打印错误日志。

slent                        有不论什么打印。

nserial                不打印序列号

-d  TYPE        指定磁盘的类型。

假设没有指定,smartctl会依据磁盘的名字来

推測磁盘类型。

-T  TYPE        指定当错误发生时,smartctl的容忍程度,是否继续执行。

TYPE能够有4种选择:

conservative        一有错就会退出

normal        假设必须支持的SMART命令失败,则退出

permissive     忽略一次必须支持的SMART命令失败

verypermissive  忽略全部必须支持的SMART命令失败

-b  TYPE        指定当发生校验错误时,smartctl的动作。

TYPE有3种选择:

warn                发出警告,继续运行

exit                 退出smartctl

ignore                不发出告警。继续运行

-r  TYPE        smartmontools开发者相关。

-n  POWERMODE        指定当磁盘处于节能模式时。smartctl是否继续检查。

默认是不检查。

POWERMODE有4种选择:

never   检查

sleep    除了sleep模式,检查。

standby  除了sleep或standby模式,检查。

idle      除了sleep或standby或idle模式,见车。

SMART功能开关 參数:

-s  on/off        打开或关闭磁盘的SMART功能

-o  on/off        打开或关闭SMART自己主动离线检測。该功能每4小时就会自己主动扫描磁盘是

否有缺陷。

-S  on/off   打开或关闭“自己主动保存厂商指定属性”功能。

SMART 读和显示数据 參数

-H                报告磁盘的是否健康。假设报告不健康,则说明磁盘已经损坏或会在24小时

内损坏。

-c                显示磁盘支持的普通SMART功能,以及这些功能当前的状态。

-A                显示磁盘支持的厂商指定SMART特性。这些特性的编号从1-253,而且有指

定的名字。

-l  TYPE        指定显示的log类型。

TYPE有4种选择:

error                仅仅显示error  log。

selftest        仅仅显示selftest  log

selective 仅仅显示selective  self-test  log

directory 仅仅显示Log  Directory

-v  N,OPTION        显示厂商指定SMART特性N时,使用厂商相关的显示方式。

-F  TYPE        设置smartctl的行为,当出现一些已知但还没有解决的硬件或软件bug时,

smartctl应该怎么做。

-P  TYPE        设置smartctl是否对磁盘使用数据库中已有的參数。

SMART 离线測试、自測试 參数

-t  TEST        立马运行測试,能够和-C參数一起使用。

TEST能够有下面几个选择:

offline  离线測试。

能够在挂载文件系统的磁盘上使用

short   短时间測试。能够在挂载文件系统的磁盘上使用。

long   长时间測试。能够在挂载文件系统的磁盘上使用。

conveyance  [ATA only]传输zi測试。能够在挂载文件系统的磁盘上使用。

select, N-M

select, N+SIZE  [ATA only]有选择性測试。測试磁盘的部分LBA。

N表示

LBA编号,M表示结束LBA编号。SIZE表示測试的LBA

范围。

-C  在captive模式下执行測试。

注意:(1)-C必须配合-t一起使用。但假设是-t offline,则-C不生效。

(2)-C会使得磁盘非常忙,所以最好是在没有挂载文件系统的磁盘上使用。

-X  中断no-captive模式下执行的測试。

时间: 2024-08-26 18:34:19

检測磁盘驱动的健康程度SMART的相关文章

检测磁盘驱动的健康程度SMART

在linux中,工具包的名字为smartmontools 在CentOS中可以使用 yum install smartmontools来安装工具 首先通过smartctl -i /dev/sda 来检查一下硬盘是否具有 SMART 特性 下面是smart工具的说明文档,里面有详细的说明 http://smartmontools.sourceforge.net/smartmontools_scsi.html 这个是我在虚拟机中测试的不支持 这个是我在真服务器中测试的,支持 SMART suppor

检测磁盘驱动的健康程度

在服务器中,所有组件中一般最容易坏掉的就是磁盘.所以一般采取RAID来保证系统的稳定性,通过冗余磁盘的方式防止磁盘故障. 现代硬件驱动器一般支持SMART(自我监测分析和报告技术),它能够监视整个硬盘驱动器的健康状况,并且当硬盘驱动器即将故障的时候会发出警告. 一般硬件厂商提供的磁盘工具,是在系统重启后检查磁盘驱动的健康状况,而SMART可以不用重启系统就可以检查硬盘驱动器的健康程度. 在linux中,工具包的名字为smartmontools 在centos中可以使用 yum install s

人脸检測中几种框框大小的选择~

人脸检測应用极为广泛,内部细节也偏多,尤其是涉及到几种类型的框,这几种框的大小之前有着千丝万缕的联系,对检測性能的好坏影响程度大小不一.本篇文章基于自己在人脸检測方面的经验,说说对这些框之间关系的一些理解. 如今大部分人脸检測效果都已adaboost+LBP(各种改进)的方式实现,adaboost由N个强分类器组成,每一个强分类器由M个弱分类器组成,而每一个弱分类器事实上就是一个特征. 本文以LBP特征为例,人脸检測共涉及到例如以下几类框: 1. LBP特征矩形框大小(极为重要) 2. 检測框大

模式识别 - 有害视频检測程序的策略

有害视频检測程序的策略 本文地址: http://blog.csdn.net/caroline_wendy/article/details/26346831 有害(色情\恐怖\暴力)视频, 严重危害网络的健康, 须要进行检測和过滤. 检測色情\恐怖视频, 通过检測程序, 检測出多个场景的概率, 然后进行排序, 当场景多余6个时, 仅仅取最大的6个场景; 返回的概率值是前3个最大检測值场景的概率的均值; 色情\恐怖汇总时, 首先检測色情, 假设为色情视频, 则不进行恐怖的检測, 否则继续检測恐怖,

网络接口的检測

假设没有下面命令,能够先去加入一个http://repoforge.org/use/ 的yum源. ifstat命令 ifstat能够监控网络接口.比較简单地查看网络流量 ifstat默认是不监控回环接口的流量的流量的单位是KB/s 使用ifstat -a能够监控全部的接口 -l    监測环路网络接口(lo). 缺省情况下.ifstat监測活动的全部非环路网络接口.经使用发现,加上-l參数能监測全部的网络接口的信息.       而不是仅仅监測 lo的接口信息,也就是说,加上-l參数比不加-l

行人检測之HOG特征(Histograms of Oriented Gradients)

之前的文章行人计数.计次提到HOG特征这个概念,这两天看了一下原版的论文,了解了一下HOG特征的原理,并依据自己的理解将这种方法的流程写了下来,假设有不正确的地方欢迎指正. HOG(Histograms of Oriented Gradients)特征的基本思想:The basic idea is that local object appearance and shape can often be characterized rather well by the distribution of

Cocos2d-x3.0游戏实例之《别救我》第七篇——物理世界的碰撞检測

事实上我也非常吃惊-居然写到第七篇了,我估计也就是四篇的内容,感觉非常奇妙,我也不会非常唠叨什么吖(小若:32个喷! ),怎么都到第七篇了. 笨木头花心贡献,啥?花心?不呢,是用心~ 转载请注明,原文地址: http://www.benmutou.com/blog/archives/920 文章来源:笨木头与游戏开发 碰撞监听 首先,确保我们创建物理对象的时候,给对象设置了碰撞条件(假设你是一步步按着教程来写的代码,那就是设置好了): body->setCategoryBitmask(1);  

爱国者布局智能硬件,空探系列PM2.5检測仪“嗅霾狗”大曝光

随着6月1日史上最严禁烟令的正式实施,国内包含北京.上海.成都等大中型城市已经在公共场所全面禁烟.众所周知,实施禁烟令的根本在于促进空气的净化,实现环境的改善,要达到这个目的,光有禁烟令是远远不够的,这背后更须要企业的努力,和我们每一个人的努力. 众所周知,PM2.5是空气污染的一大罪魁祸首,其来源有非常多,除吸烟之外,汽车尾气,工业废气等等,都会添加大气中PM2.5的含量,但绝大多数消费者对此却一无所知. 所以.解决空气污染除了要控制污染源之外.还须要向民众普及相关知识,要让他们对大气污染有更

Memory Leak检測神器--LeakCanary初探

??在之前的文章Android内存泄露的几种情形中提到过在开发中常见的内存泄露问题,可是过于草率.因为刚开年,工作还没正式展开,就看了一下Github开源大户Square的LeakCanary,并用公司项目的測试环境来练手.试图找出项目中存在的内存泄露.与上一篇不同,这一篇我会先说一下Java的内存区域以及垃圾回收机制,然后再讲LeakCanary的应用.而且会用一个在项目中遇到的真实案例来结尾. Java的内存模型 ??在对于LeakCanary来说,我们主要关心Java程序执行时的堆和栈.