@转EXT2->EXT3->EXT4

Linux文件系统第一篇—从Ext2到Ext3再到Ext4

1 概述

Linux继承了UNIX一切皆文件的设计哲学,用文件和树形目录的抽象逻辑概念代替了硬盘和光盘等物理设备使用数据块的概念,用户使用文件系统来保存数据时不必关心数据实际保存在硬盘(或者光盘)的地址为多少的数据块上,只需要记住这个文件的所属目录和文件名。但对于程序员来说,了解文件系统的底层组织方式,是进行Linux系统编程所必备的。接下来的讨论主要聚焦于磁盘文件系统。

2 索引式文件系统与日志式文件系统

2.1 索引式文件系统

  • 核心数据结构说明

Linux中文件和目录保存在称为块设备的磁盘或磁带上,通常每个磁盘上可以定义一个或多个文件系统,Linux文件系统的运行离不开三个重要的数据结构:superblock,inode,block,当然还包含引导块,存放引导程序,用来读入和启动操作系统。 
superblock:记录文件系统的整体信息,包含inode/block的大小、总量、使用量、剩余量,以及文件系统的格式,文件系统挂载时间,最近一次数据写入时间,最近一次校验磁盘的时间等。
inode:记录文件的属性,一个文件占用一个inode,inode大小(ext2中)大约为128B,并记录文件数据所在的block号码,具体来说包含的信息如下:

  • 文件的字节数
  • 文件拥有者的User ID
  • 文件的Group ID
  • 文件的读、写、执行权限
  • 文件的时间戳,共有三个:ctime表示inode上一次变动的时间,mtime表示文件内容上一次变动的时间,atime表示文件上一次打开的时间
  • 链接数:指有多少文件名指向这个inode
  • 文件数据的block号码
    在文件的block数量很大时,通常会采用多级block来记录block号码,这里采用Bitmap标记未使用的inode号码。

block:实际记录文件的内容,若文件太大,则会占用多个block,通常的block大小有1K,2K,4K三种,这里内核记录block信息的数据结构是Bitmap。
使用dumpe2fs命令可以查询某块设备上superblock和blockgroup的详细信息,这里不再详细给出。
此外,这里再澄清两个概念:
Hard Link:硬链接,硬链接文件和原始文件对应同一个inode号码,增加硬链接文件一般不改变磁盘的空间与inode数目,通常硬链接文件不能跨越文件系统建立,并且不能生成目录的链接文件。
Symbolic Link:符号链接,创建一个新的文件,读取该文件时会让数据读取指向它link的文件的文件名,和原始文件的inode号码不同。
如下图,passwd-hd和passwd-so分别是passwd的硬链接和软链接,可见前者和passwd的inode号码一致,而后者不一致。

  • 文件读取流程介绍

文件系统需要链接到目录树才能被我们使用,也就是所谓的挂载,挂载点一定是目录,该目录是文件系统的入口。假设我们想要读取文件/etc/paswd的内容,那么一般需要从根目录的inode内容开始往下读,直到找到正确的文件名,具体流程在我的ubuntu 16.04上如下:

  1. 寻找/的inode:通过挂载点信息找到inode号码为2的inode,且其权限可以让我们读取block的内容;
  2. /的block:根据block的内容找到含有etc/目录的inode号码261633;
  3. etc/的inode:根据261633号inode内容中的权限值,知道可以读取etc/的block内容;
  4. etc/的block:根据block号码找到含有passwd文件的inode号码261846;
  5. passwd的inode:根据261846号inode内容中的权限值,知道可以读取passwd的block内容;
  6. passwd的block:读取block中的内容至内存缓冲区。

2.2 日志式文件系统
上述提到的文件系统称为索引式文件系统,Linux内核早期支持中的ext2文件系统正是这种类型。这是针对新增一个文件时,需要的步骤如下:

  1. 确定使用者对于要增加新文件的目录是否具有w与x的权限,如有,方可新增;
  2. 根据inode bitmap寻找到没有使用的inode号码,将新文件的权限/属性写入;
  3. 根据block bitmap找到没有使用的block号码,将数据写入block中,更新inode的block指向数据;
  4. 将刚刚写入的inode与block数据同步更新至inode bitmap和block bitmap,并更新superblock的内容。

上述的inode bitmap,block bitmap,superblock称为系统的元数据(metadata)。在系统故障时,会出现元数据内容与实际数据存放内容不一致的情况,当然在文件系统重新启动时,会调用文件扫描工具fsck来恢复损坏的元数据信息,但在文件系统很大时,要花费很长时间来恢复。针对上述不一致的情况,出现了日志式文件系统,日志式文件系统会专门划出一个区块记录系统写入和修改文件的步骤,此时写文件的步骤如下:

  1. 准备:当系统写入一个文件时,会在日志记录区块记录文件要写入的信息;
  2. 写入:写入文件的权限和数据,更新元数据的内容;
  3. 完成:在数据与元数据更新完成后,在日志记录区块中完成文件的记录。

在出现故障需要恢复时,可根据日志追踪之前提交到主文件系统的更改,大大减少了磁盘的扫描时间,实现丢失数据的快速重建,比传统的索引式文件系统更安全。Linux下的集中日志式文件系统有XFS(目前是CentOS7的默认文件系统),ReiserFSExt3Ext4

3 Ext2/Ext3/Ext4的区别和比较

3.1 Ext2与Ext3的比较

ext3和ext2的主要区别在于,ext3引入Journal(日志)机制,Linux内核从2.4.15开始支持ext3,它是从文件系统过渡到日志式文件系统最为简单的一种选择,ext3提供了数据完整性和可用性保证

  • ext2和ext3的格式完全相同,只是在ext3硬盘最后面有一部分空间用来存放Journal的记录;
  • 在ext2中,写文件到硬盘中时,先将文件写入缓存中,当缓存写满时才会写入硬盘中;
  • 在ext3中,写文件到硬盘中时,先将文件写入缓存中,待缓存写满时系统先通知Journal,再将文件写入硬盘,完成后再通知Journal,资料已完成写入工作;
  • 在ext3中,也就是有Journal机制里,系统开机时检查Journal的内容,来查看是否有错误产生,这样就加快了开机速度;

3.2 Ext3与Ext4的比较

Linux内核从2.6.28开始支持ext4文件系统,相比于ext3提供了更佳的性能和可靠性。下面先简单罗列出二者的差异,后续文章再来深入探索。
1. 与 Ext3 兼容。 执行若干条命令,就能从 Ext3 在线迁移到 Ext4,而无须重新格式化磁盘或重新安装系统。原有 Ext3 数据结构照样保留,Ext4 作用于新数据,当然,整个文件系统因此也就获得了 Ext4 所支持的更大容量。 
2. 更大的文件系统和更大的文件。 较之 Ext3 目前所支持的最大 16TB 文件系统和最大 2TB 文件,Ext4 分别支持 1EB的文件系统,以及 最大16TB 的文件。 
3. 无限数量的子目录。 Ext3 目前只支持 32,000 个子目录,而 Ext4 支持无限数量的子目录。 
4. Extents。 Ext3 采用间接块映射,当操作大文件时,效率极其低下。比如一个 100MB 大小的文件,在 Ext3 中要建立 25,600 个数据块(每个数据块大小为 4KB)的映射表。而 Ext4 引入了现代文件系统中流行的 extents 概念,每个 extent 为一组连续的数据块,上述文件则表示为“该文件数据保存在接下来的 25,600 个数据块中”,提高了不少效率。 
5. 多块分配。 当写入数据到 Ext3 文件系统中时,Ext3 的数据块分配器每次只能分配一个 4KB 的块,写一个 100MB 文件就要调用 25,600 次数据块分配器,而 Ext4 的多块分配器“multiblock allocator”(mballoc) 支持一次调用分配多个数据块。 
6. 延迟分配。 Ext3 的数据块分配策略是尽快分配,而 Ext4 和其它现代文件操作系统的策略是尽可能地延迟分配,直到文件在 cache 中写完才开始分配数据块并写入磁盘,这样就能优化整个文件的数据块分配,与前两种特性搭配起来可以显著提升性能。 
7. 快速 fsck。 以前执行 fsck 第一步就会很慢,因为它要检查所有的 inode,现在 Ext4 给每个组的 inode 表中都添加了一份未使用 inode 的列表,今后 fsck Ext4 文件系统就可以跳过它们而只去检查那些在用的 inode 了。 
8. 日志校验。 日志是最常用的部分,也极易导致磁盘硬件故障,而从损坏的日志中恢复数据会导致更多的数据损坏。Ext4 的日志校验功能可以很方便地判断日志数据是否损坏,而且它将 Ext3 的两阶段日志机制合并成一个阶段,在增加安全性的同时提高了性能。 
9. “无日志”(No Journaling)模式。 日志总归有一些开销,Ext4 允许关闭日志,以便某些有特殊需求的用户可以借此提升性能。 
10. 在线碎片整理。 尽管延迟分配、多块分配和 extents 能有效减少文件系统碎片,但碎片还是不可避免会产生。Ext4 支持在线碎片整理,并将提供 e4defrag 工具进行个别文件或整个文件系统的碎片整理。 
11. inode 相关特性。 Ext4 支持更大的 inode,较之 Ext3 默认的 inode 大小 128 字节,Ext4 为了在 inode 中容纳更多的扩展属性(如纳秒时间戳或 inode 版本),默认 inode 大小为 256 字节。Ext4 还支持快速扩展属性(fast extended attributes)和 inode 保留(inodes reservation)。 
12. 持久预分配(Persistent preallocation)。 P2P 软件为了保证下载文件有足够的空间存放,常常会预先创建一个与所下载文件大小相同的空文件,以免未来的数小时或数天之内磁盘空间不足导致下载失败。 Ext4 在文件系统层面实现了持久预分配并提供相应的 API(libc 中的 posix_fallocate()),比应用软件自己实现更有效率。 
13. 默认启用 barrier。 磁盘上配有内部缓存,以便重新调整批量数据的写操作顺序,优化写入性能,因此文件系统必须在日志数据写入磁盘之后才能写 commit 记录,若 commit 记录写入在先,而日志有可能损坏,那么就会影响数据完整性。Ext4 默认启用 barrier,只有当 barrier 之前的数据全部写入磁盘,才能写 barrier 之后的数据。

4 小结

目前,大多数Linux发行版,包括我的Ubuntu 16.04的默认支持文件系统是ext4,ext4也是首个专门为Linux设计的文件系统,我们可以轻易的从ext3迁移到ext4,对于程序员来说,了解文件系统的演化脉络是十分重要的,后续会继续深入讨论Linux下的各个文件系统。

参考资料
【1】鸟哥的Linux私房菜第八章
【2】Ext2、Ext3和Ext4之间的区别
【3】Linux 文件系统剖析

转自 https://zhuanlan.zhihu.com/p/22976640 @auth 徐志强

时间: 2024-10-14 06:03:06

@转EXT2->EXT3->EXT4的相关文章

【转载】格式化存储装置成为 Ext2/Ext3/Ext4 档案系统

格式化 用系统管理员帐户 (即 root) 身份打「mkfs -t ext2|ext3|ext4 储存装置」: mkfs -t ext3 /dev/sdb5 要格式化档案系统为 Ext2,亦可以直接使用命令 mkfs.ext2 或 mke2fs,例如: mkfs.ext2 /dev/sdb5 或者: mke2fs /dev/sdb5 要格式化档案系统为 Ext3,亦可以使用命令 mkfs.ext3 或 mke2fs -j,例如: mkfs.ext3 /dev/sdb5 或者: mke2fs -j

EXT2/EXT3/EXT4 比較

Linux kernel自2.6.28開始正式支持新的文件系統Ext4.Ext4是Ext3的改進版,修改了Ext3中部分重要的數據結構,而不僅僅像Ext3對Ext2那樣,只是增加了一個日誌功能而已.Ext4可以提供更佳的性能和可靠性,還有更為豐富的功能: 1.與Ext3兼容.執行若干條命令,就能從Ext3在線遷移到Ext4,而無須重新格式化磁盤或重新安裝系統.原有Ext3數據結構照樣保留,Ext4作用於新數據,當然,整個文件系統因此也就獲得了Ext4所支持的更大容量. 2.更大的文件系統和更大的

linux分区之ext2,ext3,ext4,gpt

2013-07-10 12:00:24 标签:ext3 gpt 原创作品,允许转载,转载时请务必以超链接形式标明文章 原始出处 .作者信息和本声明.否则将追究法律责任.http://wushank.blog.51cto.com/3489095/1244191 一.各分区简单介绍: 1.EXT是Linux系统下的一种磁盘分区格式,等同于XP下的FAT/FAT16/FAT32,大家知道安卓是基于Linux系统开发的手机系统,那么同样的就有这些分区格式,平时我们所说的开启a2sd功能,就是在SD卡中分

ext2,ext3,ext4文件系统管理软件包e2fsprogs

e2fsprogs(也叫做e2fs programs)是一个Ext2(及Ext3/4)文件系统工具集(Ext2 Filesystems Utilities[2] ),它包含了诸如创建.修复.配置.调试ext2文件系统等的标准工具. e2fsprogs是开放源代码软件,遵从GPLv2或LGPLv2.

调整分区大小(ext2\ext3\ext4)

现在的时间是2017年5月27日 我想说调整分区大小没那么麻烦,至少我直接将一个ext3格式分区从50G减少到了30G. 步骤如下 1 首先确保那个分区是没被挂载的. 2 调整分区大小,但是其实并没有实际的改变分区的边界. e2fsck /dev/sda3 resize2fs /dev/sda3 30G 3 删了分区,重建分区.这样分区的大小就被改变了. 需要注意的是,你重建的分区必须和原来的分区起始地址一致,分区编号一致. 那你就事先打印一下,记住那个分区开始的扇区.(fdisk 的命令 p)

linux下使用extundelete恢复ext3/ext4分区数据

Windows平台恢复误删数据so easy,但是linux就没那么简单了,因为没有"回收站".BUT,如果有一天真的不小心误删了文件,那如何是好?那就借助恢复神器extundelete了. 以下均为本人虚拟机上操作,经测试,文件系统ext3/ext4均适用. 一.安装extundelete 1.需要安装依赖包,否则编译不通过 [[email protected] /]#yum install e2fsprogs* -y 2.下载并安装extundelete 下载地址:https://

Linux ext2/ext3文件系统详解

转载: Linux ext2/ext3文件系统使用索引节点来记录文件信息,作用像windows的文件分配表.索引节点是一个结构,它包含了一个文件的长度.创建及修改时间.权限.所属关系.磁盘中的位置等信息.一个文件系统维护了一个索引节点的数组,每个文件或目录都与索引节点数组中的唯一一个元素对应.系统给每个索引节点分配了一个号码,也就是该节点在数组中的索引号,称为索引节点号. linux文件系统将文件索引节点号和文件名同时保存在目录中.所以,目录只是将文件的名称和它的索引节点号结合在一起的一张表,目

Linux ext3 ext4 区别

Linux kernel 自 2.6.28 开始正式支持新的文件系统 Ext4. Ext4 是 Ext3 的改进版,修改了 Ext3 中部分重要的数据结构,而不仅仅像 Ext3 对 Ext2 那样,只是增加了一个日志功能而已.Ext4 可以提供更佳的性能和可靠性,还有更为丰富的功能: 1. 与 Ext3 兼容. 执行若干条命令,就能从 Ext3 在线迁移到 Ext4,而无须重新格式化磁盘或重新安装系统.原有 Ext3 数据结构照样保留,Ext4 作用于新数据,当然,整个文件系统因此也就获得了 E

[转] Linux Ext3 Ext4 区别

Linux kernel 自 2.6.28 开始正式支持新的文件系统 Ext4. Ext4 是 Ext3 的改进版,修改了 Ext3 中部分重要的数据结构,而不仅仅像 Ext3 对 Ext2 那样,只是增加了一个日志功能而已.Ext4 可以提供更佳的性能和可靠性,还有更为丰富的功能: 1. 与 Ext3 兼容. 执行若干条命令,就能从 Ext3 在线迁移到 Ext4,而无须重新格式化磁盘或重新安装系统.原有 Ext3 数据结构照样保留,Ext4 作用于新数据,当然,整个文件系统因此也就获得了 E

刨根问底:ext3/ext4文件系统最大空间及单个文件大小演算法则

从ext3和ext4文件系统来窥探空间和文件大小的演算法则 学习操作系统就不得不研究磁盘以及磁盘文件系统,磁盘是底层物理设备,而文件系统则是管理磁盘的上层工具,文件系统规划了磁盘存放数据的格式,确定了一个操作系统能够支持多大的磁盘空间,每个分区能够支持多大的数据空间,以及每个文件所能支持的大小.通常对系统管理员而言,最需要的知道的就是最大磁盘空间,最大分区空间以及最大文件的大小.本论题只讨论这三种大小到底是怎么算出来的,而不是死记硬背.知道了原理,以后不管遇到什么文件系统,都会有章可循,至少知道