RRDtool 的功能及使用介绍

定义：RRDtool（Round Robin Database Tool）是一个用来处理定量数据的开源高性能数据库。

一.RRDtool 的特性

由于 RRDtool 设计的初衷就是为监控开发的，所以与其他的数据库相比，RRDtool 有以下特性：

有一个强大的绘图引擎，可以根据数据库内容，创建 png 格式的图片。图 1，图 2 和图 3 所示的就是三张通过 rrdtool graph 命令生成的网络带宽波形图。

图 1. 最近一小时的网卡收发速率

图 2. 最近一天的网卡收发速率

图 3. 最近一年的网卡收发速率

是一个基于时间序列的环形数据库。可以想象一个圆，圆周上有一些均匀分散的点。这些点就是数据存储的位置。从圆心画一条到圆周的某个点的箭头，这个箭头就是指向当前元素的指针。在当前元素被读或写之后，指针就往下一个元素移动。当所有位置都被用过，原来的位置就会被重用。这样，数据库永远不会满，不需要维护。
可以被配置成存储当前值与前一个值变化速度，而不是简单地存储提供的值。
要求在预定的时间间隔中取得监控数据，如果没有得到更新的数据，就将该时间段的值设为 UNKNOWN.

二.RRDtool 中的数据处理

RRD 数据库存储的值并不一定等于更新时提供的值。这个值是根据数据库设定对提供的值进行计算得到的。计算过程可以分为三个步骤：

1.根据用户定义的数据类型对提供的值进行计算，具体计算方法见表 1

数据类型	计算方法
GAUGE	等于提供的值，适用于提供值为速度计、温度或人数等
COUNTER	当前值与前一个值的变化速度，要求递增的值，如计数器，里程表等。如果计数器溢出，RRDTool会检查溢出是32位还是64位，并相应的加上合适的值
DERIVE	当前值与前一个值的变化速度，不要求递增。除了不进行溢出处理之外，该类型的内部处理机制与COUNTER相同
ABSOLUTE	假定前一个值始终为0，求变化速度。可用来存储读取后复位的计数器

表 1.RRDtool 中的数据类型

1）整形

输入的时间经常会不在时间间隔的边界，所以需要根据前后两个有效的更新进行线性整形。（有效时间是被 heartbeat 设定控制的）假定你在监视一个增长速度不均匀的计数器，每分钟检查一次，在 4：30 是 2，5：30 是 4，那么第 5 分钟的变化速度为 3。整形后得到的值称为 PDP（Primary Data Points）。

2）合并

RRDtool 最终会根据设定对 PDP 进行合并，得到 CDP（Consolidated Data Point）。CDP 可以是多个（可以是一个）PDP 的平均值、最小值、最大值以及最近的值。CDP 是 RRD 数据库中最终存储的数据。这对于输出监控数据时是非常有利的。假设每个 PDP 的时间间隔是 1 分钟，如果你想查看 1 天的数据，而且你不需要查看每一分钟具体的监控数据，只是想看一下这一个天中每半个小时的监控数据。如果 RRD 中存储的是 PDP, 在输出时就需要对当天的 PDP 每 30 个进行合并。合并需要时间，如果你需要合并的数据量更大，如 1 个月或是 1 年，那这个合并的时间会非常长。所以 RRDtool 选择在数据库更新时对 PDP 进行合并，保存 CDP。用户可以根据需要设定如何对 PDP（非 UNKNOWN）进行合并。

合并方式	计算方法
AVERAGE	平均值
MIN	最小值
MAX	最大值
LAST	最近值

表 2.PDP 的合并方式

三.RRDtool 命令使用

1. 创建 RRD 数据库

语法：

rrdtool create filename [--start|-b start time] [--step|-s step] [--no-overwrite] [DS:ds-name:DST:dst arguments] [RRA:CF:cf arguments]

参数：

1) create 关键字，用于创建一个 RRD 数据库文件

filename 文件名，扩展名最好是 .rrd

--start|-b start time 第一个记录的开始时间，默认是当前时间减 10 秒。表示方法为从 1970-01-01 UTC 到指定时间的秒数

--step|-s step 每条记录的时间间隔，默认为 300 秒

--no-overwrite 不覆盖同文件名的数据库文件

2) DS:ds-name:DST:dst arguments

DS 关键字，用于定义数据源。一个 RRD 文件可以有多个 DS。

ds-name 数据源名称，可以是 1 ～ 19 个 [a-zA-Z0-9_] 中的任意字符，一个 RRD 数据库文件可以有多个数据源。

DST 数据类型。支持的数据类型有：

GAUGE, COUNTER, DERIVE, ABSOLUTE，COMPUTE

DS:ds-name:GAUGE | COUNTER | DERIVE | ABSOLUTE:heartbeat:min:max

DS:ds-name:COMPUTE:rpn-expression

COMPUTE 存放对其他数据源进行公式计算的结果。

Heartbeat 心跳，两次数据源更新之间将数据源的数值确定为 UNKNOWN 前所允许的最大秒数。Min:max PDP 的最小值 / 最大值。

3) RRA:CF:cf arguments

RRA 关键字，用于定义 RRA（round robin archive）档。一个 RRD 数据库文件有至少一个的 RRA 档。CDP 就被保存于 RRA 中。

CF 合并方式，可以是 AVERAGE,MIN,MAX,LAST

RRA:AVERAGE | MIN | MAX | LAST:xff:steps:rows

xff 定义合并时间间隔内允许的 PDP 为 UNKNOWN 的比例，超过这个比例时，CDP 被置为 UNKNOWN。

steps 定义多少个 PDP 合并一个 CDP。

rows 定义一个 RRA 档保存有多少条记录。

2. 更新 RRD 数据库

语法：

rrdtool {update | updatev} filename [--template|-t ds-name[:ds-name]...] [--daemon address] [--] N|timestamp:value[:value...] [email protected][:value...] [timestamp:value[:value...] … ]

参数：

1) update/updatev 关键字，用于更新数据库

updatev 会输出磁盘上数据库文件更新后输出更新信息。由于 updatev 需要直接的磁盘访问，所有不能与 --daemon 共用。

filename 需要更新的 RRD 数据库的文件名

2) --template|-t ds-name[:ds-name]...

默认情况下，需要按照数据源定义的顺序更新。该参数允许你指定要更新的数据。

3) --daemon address

使用缓存后台程序更新数据库，而不直接访问磁盘。

4)N|timestamp:value[:value...]

更新时间及数据。时间格式可以是 N| 时戳；N 表示现在；时戳以自 1970-01-01 以来的秒数来表示。如果使用负数时间（当前时间之前多长时间），需要使用—与其它选项区分开。用 U 表示数据的值为 UNKNOWN。

[email protected][:value...]

更新时间也可以使用 AT 风格表示。

环境变量 RRDCACHED_ADDRESS 与 --daemon 选项的作用是一样的，如果两者都出现的话，前者优先。

3. 读取数据

语法：

rrdtool fetch filename CF [--resolution|-r resolution] [--start|-s start] [--end|-e end] [--daemon address]

参数：

1) fetch 关键字，用于取数据。

2) filename 需要读取的文件的文件名

3) CF 需要读取数据的合并方式（AVERAGE,MIN,MAX,LAST）

4) --resolution|-r resolution （default is the highest resolution）

解析度，也就是你要取数据的时间间隔（单位：秒）；rrdfetch 会尽量找到最匹配的 RRA。默认为数据库文件支持的最高解析度，即时间间隔最短的；如果想取的不是最高解析度的 RRA，假设要取得的是解析度为 x 的 RRA，开始时间和结束时间必须落在期望解析度的边界点上，即需要满足以下条件：

a.start 时间和 end 时间都是 x 的倍数

b.start 时间和 end 时间都在 RRA 记录的时间范围内。

5) --start|-s start （default end-1day）

开始时间；支持时戳和 AT 风格；默认是 1 天前。

6) --end|-e end （default now）

结束时间；格式与开始时间相同；默认是现在；

7) --daemon address

缓存后台程序地址。如果指定的话，在读取之前，会发 flush 指令给缓存后台程序将缓存的数据同步到磁盘。

RRDtool 的功能及使用介绍

时间： 2024-10-07 05:02:23

RRDtool 的功能及使用介绍