使用Perfstat工具收集Netapp存储诊断信息

概要简介

Perfstat是一个Netapp存储诊断数据命令行收集工具,该工具能够收集Netapp存储的详尽的信息,包括配置信息和性能数据,针对于Netapp存储OS的2种模式分别有两个版本:

存储模式 Perfstat版本
7 mode Perfstat 7
Cluster Mode Perfstat 8

perfstat 7.x用于收集 7 mode Netapp存储的信息,perfstat 8.x主要用于收集Cluster mode Netapp存储信息

注意:

从Netapp Data Ontap 8.3之后,7 mode将退出历史舞台。

作为命令行工具,perfstat使用起来还是较为复杂,为了简化使用,Netapp给该工具做了一个GUI外壳,方便用户使用。下面以Windows为例说明perfstat 使用方法。

下载运行

该GUI工具可以在Windows和Linux运行,可以从Netapp官网下载(需要有Netapp的账号)

下载后会有一个.zip的压缩包,比如gPerfstat_Windows.zip。解压缩某个目录下,注意文件路径中不要包含空格,否则程序不能正常运行。

双击运行文件gPerfstat.exe。

数据收集

程序运行后出现以下界面,如果你的Perfstat版本不是最新,可以在此输入Netapp网站的账号更新软件,否则“Skip”跳过该页面

选择“Perfstat V8”,进入收集参数设定界面

  • 如果收集Cluster mode存储在“Select Mode”选择“Cluster-mode”
  • Cluster mode下存储有群集管理地址,参与群集的节点也有独立的地址,可以选择从群集管理地址或者节点地址进行收集。如下图,选择收集整个群集的信息,灾难Controller IP/Name(s)填写存储的群集管理地址,如果是双活群集,请勾选“Metrocluster”。此处可以填写多个群集管理地址,以逗号分隔开即可。如果填写主机名,请确保DNS解析正常。
  • 在username/Password处填写群集管理用户名和密码。填写完以后,后台会调用openssh创建ssh密钥对,并上传到存储

  • 在username/Password处填写群集管理用户名和密码。填写完以后,后台会调用openssh创建ssh密钥对,并上传到存储,这样建立本地主机和存储的SSH信任关系。

  • 在“perfstat time”可以定义信息收集的时间,默认选择“6min(3x2)” interation:3           time:2min。即perfstat命令迭代收集3次,每次运行间隔2分钟。
  • 如果要自定义时间间隔可以在下拉菜单选择“Customize Perfstat…”,然后选择运行次数和时间间隔,比如运行20次,每次间隔2分钟。该命名的执行时间将超过:20x2=40min
  • 另外通过“Incremental”栏位指定Runs的值可以设定perfstat命令执行的次数,如果该值设定为10,那么,整个信息收集时间:40min*10=400min。
  • 如果希望在指定的时间运行或者定期运行,那么在“Execute”栏位指定,Schedule表示在指定时间运行,Now表示马上运行;Once表示在指定时间运行一次,Daily表示在指定时间每天运行。
  • 在“Preset file name”下拉菜单选择时,一般保留默认。除非perfstat执行时间过长,就选择“Critical_preset”。该配置下Perfstat将缩减收集信息的范围以尽快完成收集。
  • 如果收集过程中需要给perfstat命令传递其他GUI不能定义的参数,将改参数添加填写到“generate cmd”栏位。

  • 点击“generate cmd”按钮,以上配置的参数就生成命令行了。
  • 点击“Start”按钮运行,出现以下对话框提示命令已经开始运行。
  • 点击“OK”关闭提示窗口,等待运行完毕。运行完毕后会有提示窗口出现。
  • 运行结果保存在安装目录“CLI_Logs”下。
  • 如果中途需要终止程序,在Active Process区域,Process ID下选择进程号,然后点击“Abort”。同时也可以通过“Logs”按钮打开对应的运行结果输出文件。

数据上传

收集到的数据可以上传到netapp的网站https://latx.netapp.com,注意登录该网站需要有账号。

该网站可以将上传数据进行分析并且生产图表。利用这些图表可以很便利地分析现有存储的运行状况。

上传步骤:

1.登录https://latx.netapp.com后,看到如下Web页面

2.点击“New Perfstat”,出现上传的窗口

  • case Number——可选项。如果你已经和Netapp 开了支持的案例,可以输入案例编号,随后Netapp可以根据该编号在Latx网站找到你上传的数据。也可以空白
  • Case Status——必选项。下拉菜单中选择案例状态,“Associated with a Netapp support case”表示上传数据已经和一个已开的案例相关;“Not associated with a Netapp support case”表示上传数据和某个案例关联。
  • data Status——必选项。”Captured during  a performance issue“表示存储故障期间收集的数据;”Not captured during  a performance issue“表示非存储故障期间收集的数据;“Data status unknow”数据状态未知
  • 点击”Load files“按钮旁边的出现文件上传窗口,选择文件上传即可。注意上传文件的大小不能超过25MB,如果超过25MB只能直接上传”http://upload.netapp.com

  • 文件上传完毕后,点击”Load Files“按钮,网站后台程序将把上传文件进行解压分析。完成后会出现以下界面:

数据分析

利用Latx的图表可以分析存储的运行状态。

1.IO延迟

2.磁盘利用率

在Summary菜单下可以看总体磁盘利用率

如上图,当前的磁盘利用率为100%,说明磁盘非常繁忙,存储的响应能力肯定非常差。所以延迟比较高。

不过,在该视图下,不能精确反应磁盘的利用率,这个100%只是利用率最高的部分磁盘的数据。并不是所有磁盘的平均值。这是由于我们看到的这个图形是根据”sysstat“命令输出的结果生成。该命令输出的磁盘利用率是取所有磁盘中最高值。假设有这种情况,存储节点有30块磁盘,只有一块磁盘非常繁忙,使用率达到100%,其他29块都只有10%。那么,这个命令输出的磁盘利用率也是100%。

要获得精确的磁盘利用率,在”Summary“视图下,点击”Disk Utilization“

随后,出现精确磁盘利用视图,该试图基于命令 ”statit“的输出生成,可以获得每个磁盘的利用率,并且根据磁盘的繁忙程度用深浅不一的颜色进行标注,越是繁忙的磁盘,标识的颜色越深。

在”Configure“下拉菜单下,选择”Show Grid Lines“,在Grid Szie处将滑块移动到最右侧。如下图,小方块每一行代表一个磁盘,鼠标放置到小方块上,右下角状态栏会显示当前0b.01.20磁盘的利用率为98%

3.CPU的利用率

CPU的利用率同样可以在Summary视图下查看,如下图所示,数据收集期间,CPU的最大利用率为60%,平均利用率为15%。类似于磁盘利用率,因为CPU有多个核,该处显示的最大CPU利用率也是取利用率最高核的利用率。

时间: 2024-10-10 08:37:17

使用Perfstat工具收集Netapp存储诊断信息的相关文章

自动化收集SQLSERVER诊断信息

自动化收集SQLSERVER诊断信息 相信很多人都遇到过当SQLSERVER出现问题的时候,而你又解决不了需要DBA或者微软售后支持工程师 去帮忙解决问题,那么他们一般需要你收集一些系统信息和SQLSERVER诊断信息. 而收集这些信息又需要图形工具,又需要指令,步骤又非常复杂. 我们要按照步骤一步一步把需要的信息收集全,在收集的过程中,往往折腾几次就头痛了 解决问题的工具 这个问题随着一个在SQL2005里的工具的出现而得到了解决 这个工具可以自动收集很多信息,扩展了原来的应用,增强了其信息收

Oracle 通过ADR工具 收集ORA-600错误信息

 问题描述: 2014-06-10 在点检数据库预警文件时,出现Ora -00600 错误,并且Rman L1 备份失败,查询相关资料,得知是Bug:9835218.于是,提SR寻求Oracle 官方技术支持. Oracle回复如下: Your Service Request has been submitted as anORA-600/ORA-7445 issue based on the problem type you chose when logging the SR. Additio

【转自mos文章】数据库 hang问题的诊断信息收集方法

数据库 hang问题的诊断信息收集方法 来源于: How to Collect Diagnostics for Database Hanging Issues (文档 ID 452358.1) 适用于: Oracle Database - Enterprise Edition - Version 9.0.1.0 and later Oracle Database - Personal Edition - Version 9.0.1.0 and later Oracle Database - St

数据库性能优化、统计信息与对象统计信息概述收集、扩展统计信息、dbms_stats.get_prefs

数据库性能优化 相关书籍: 1.基于成本的Oracle优化法则 2.Oracle性能诊断艺术 3.基于Oracle的SQL优化 ----------------------------------------------------------------------------------------- 两种优化器: CBO  cost-base optimizer 基于cost 更大适应性/灵活性/10g开始 RBO  rule-base optimizer 基于规则 制定了15条/10g以

Oracle里收集与查看统计信息的方法

Oracle数据库里的统计信息是这样的一组数据:它存储在数据字典里,且从多个维度描述了Oracle数据库里对象的详细信息.CBO会利用这些统计信息来计算目标SQL各种可能的.不同的执行路径的成本,并从中选择一条成本值最小的执行路径来作为目标SQL的执行计划. Oracle数据库里的统计信息可以分为如下6种类型: 表的统计信息 索引的统计信息 列的统计信息 系统统计信息 数据字典统计信息 内部对象统计信息 表的统计信息用于描述Oracle数据库里表的详细信息,它包含了一些典型的维度,如记录数.表块

SQL点滴13—收集SQLServer线程等待信息

原文:SQL点滴13-收集SQLServer线程等待信息 要知道线程等待时间是制约SQL Server效率的重要原因,这一个随笔中将学习怎样收集SQL Server中的线程等待时间,类型等信息,这些信息是进行数据库优化的依据. sys.dm_os_wait_stats 这是一个系统视图,里面存储线程所遇到的所有的等待信息,具体的列如下表 列名 数据类型 说明 Wait_type Nvarchar(60) 等待类型名称 waiting_tasks_count Bigint 等待类型的等待数.该计数

netAPP存储恢复删除数据方法-留着万一有用呢

[存储数据恢复背景介绍] 某公司的netAPP存储设备,因为实习生在操作过程中的误操作导致存储内部分重要数据被删除,该存储采用的是WAFL文件系统,底层是多块硬盘组成的raid阵列.下面小编将为大家详细介绍该案例的数据恢复过程,同时该数据恢复方法同样适用于netAPP其他型号存储的误删除数据的恢复. [存储数据误删除恢复方法] 对存储设备的原始数据进行镜像备份,这样做的目的是为了在数据恢复过程中对镜像数据进行分析与恢复,保留用户的存储设备原始状态,以免因数据恢复工作人员的操作对原始数据进行更改或

NetApp存储数据误删除恢复报告

一.NetApp存储阵列简要: NetApp FAS3220是NetApp推出的中端存储阵列,针对NAS和SAN环境构建,被定制为虚拟化.私有云或传统.早先的用途,适用于从几TB到超过2PB的存储需求,提供数据保护,可扩展性,自动精简配置,精简克隆,备份和灾难恢复,下面就讲解NetApp FAS 3220存储的数据恢复的方法. 二.NetApp存储阵列故障信息: 本次讲解的NetApp FAS 3220型号的存储,硬件环境是一共96块600G的SAS硬盘,硬盘和普通的硬盘还不一样,这个硬盘的扇区

css工具收集

收集一些css的生成工具,开发中可以直接拿过来用.特别是那些css3中的一些新的特性. 1  css渐变背景在线生成工具      http://www.colorzilla.com/gradient-editor/ 2  css3圆角在线生成工具      http://border-radius.com/ 3  网格布局在线生成工具     http://grid.mindplay.dk/ 持续更新...... 大家如果有用的好的前台工具给留言推荐下,我收集补充下.谢谢. css工具收集,布