Linux 文件系统相关的基本概念

本文介绍 Linux 文件系统相关的基本概念。

硬盘的物理组成

盘片
硬盘其实是由单个或多个圆形的盘片组成的,按照盘片能够容纳的数据量,分为单盘(一个硬盘里面只有一个盘片)或多盘(一个硬盘里面有多个盘片)的硬盘。下面是一张盘片的示意图(此图来自互联网):

磁道和柱面
硬盘中有磁头在盘片上读写数据,磁头固定在机械臂上,机械臂上有多个磁头(每个盘片的两侧各一个)。当磁头固定不动时(假设机械手臂不动),盘片转一圈所画出来的圆就是磁道(track)。所有盘片上相同半径的那个磁道就组成了柱面(cylinder)。柱面是磁盘分区是的最小单位。

扇区
由圆心向外画直线,可以将磁道再划分为扇区,扇区就是盘片上最小的读写单位。通常情况下,一个扇区的大小为 512 个字节。因此可以使用下面的公式计算磁盘的容量:
柱面数 * 磁头数 * 扇区数 * 512 字节

磁盘分区

为什么要对硬盘进行分区呢?
因为我们必须要告诉操作系统:这块硬盘可以访问的区域是从 A 柱面到 B 柱面。如此一来,操作系统才能控制硬盘磁头去 A-B 范围内的柱面上访问数据。如果没有告诉操作系统这些信息,它就无法在磁盘上存取数据。所以对磁盘分区的要点是:记录每一个分区的起始与结束柱面
实际上,分区时指定的开始和结束位置是柱面上的扇区(sector):

下图是通过 fdisk 命令查看到的磁盘分区信息:

那么,这些分区的信息(起始柱面与结束柱面)被存放在了哪里呢?答案是磁盘的主引导区(Master Boot Recorder, MBR)。MBR 在一块硬盘的第 0 轨上,这也是计算机启动之后要去使用硬盘时必须读取的第一个区域。 这个区域内记录了硬盘里所有分区的信息即磁盘分区表,以及启动时可以写入引导程序的位置。因此 MBR 对于硬盘来说至关重要,如果它坏掉了,这块磁盘也就寿终正寝了。下面是磁盘分区表的示意图(此图来自互联网):

文件系统

在告知系统分区所在的起始与结束柱面后,需要将分区格式化为操作系统能够识别的文件系统。每个操作系统能够识别的文件系统并不相同,比如 Windows 系统在默认的情况下就无法识别 Linux 的文件系统,所以要针对操作系统来格式化分区。可以简单的认为每个分区就是一个文件系统。

逻辑块
不论哪种文件系统,目的都是为了存储数据。前面提到,硬盘的最小读写单位是扇区,而现实中数据的读写单位并不是扇区的大小,原因是使用扇区的大小为单位来读写数据的效率实在是太低了。因为一个扇区只有 512 个字节,而磁头是一个扇区一个扇区的读取数据,也就是说,如果文件有 10M,那么读取这个文件磁头就要进行 20480 次读取操作(I/O)。
为了提升效率,就有了逻辑块(Block)的概念。逻辑块是在分区进行文件系统的格式化时所指定的"最小存储单位",这个最小存储单位以扇区的大小为基础(因为扇区为硬盘的最小物理存储单位),大小为扇区大小的 2? 倍。此时,磁头一次可以读取一个逻辑块。指定逻辑块的大小为 4KB(即由连续的 8 个扇区构成的一个块),那么,同样读取一个 10M 的文件,磁头要读取的次数则大幅下降为 2560 次,这样就大大提高了文件的读取效率。
需要注意的是,逻辑块也并不是越大越好。因为一个逻辑块最多仅能容纳一个文件(这里指 Linux 的 ext2 文件系统)。这有什么问题呢?举例来说,假如逻辑块的大小为 4KB,有一个文件大小为 0.1KB,这个小文件将占用掉一个块的空间。也就是说,该块虽然可以容纳 4KB 的容量,然而由于文件只占用了 0.1KB,实际上剩下的 3.9KB 空间就不能再被使用了(完全浪费掉了)。所以好的方式是根据实际的使用场景来设置逻辑块的大小。

在分区上创建文件系统时,可以指定文件系统的逻辑块大小:

上面命令中我们指定的逻辑块大小为 1024 B,也就是两个扇区的大小。我们还可以通过 tune2fs 查看现有文件系统逻辑块的大小:

这里需要区分三个概念:
扇区、逻辑块和页
块设备中最小的寻址单元是扇区。
逻辑块是文件系统的一种抽象--只能基于块来访问文件系统。内核执行的所有磁盘操作都是按照块进行的(但是所有设备的 I/O 必须以扇区为单位进行操作)。对块的要求有:必须是扇区大小的 2 的整数倍;不能超过页的大小。
内核把内存的物理页作为内存的管理单位,因为从磁盘读取的数据最终都会被保存在内存中,所以系统优化的结果是不允许文件系统中的逻辑块超过内存页的大小。可以通过下面的命令查看系统中页的大小:

$ getconf PAGESIZE

超级块
分区完成后,每个分区会被格式化为一个文件系统。而每个文件系统开始位置的那个块就称为超级块(superblock)。超级块会记录整个文件系统的整体信息,包括 inode 与 block 的总量、使用量、剩余量等。
也就是说,要使用一个分区(或文件系统)来进行数据访问时,第一个要经过的就是超级块。所以,如果超级块损坏了,这个分区上的数据也就丢掉了。

inode
Linux 操作系统的文件数据除了文件实际内容外,通常含有非常多的属性,例如文件权限(rwx)与文件属性(拥有者、群组、时间参数等)。文件系统通常会将这两部份的数据分别存放在不同的区块,权限与属性放置到 inode 中,至于实际数据则放置到 datablock 区块中。

block
实际记录文件的内容,若文件太大时,会占用多个 block。

每个文件都会占用一个 inode,inode 内则有文件数据放置的 block 号码。下面是 inode、block 数据存取的示意图(此图来自互联网):

这种数据存取的方法我们称为索引式文件系统(indexed allocation)。

挂载点
在 Linux 系统中,文件系统被安装在一个特定的挂载点(一个普通的目录)上,所有的已安装文件系统都作为根文件系统树的枝叶出现在系统中。与这种单一、统一的树形成鲜明对照的就是 Windows 系统的表现,它们以字母命名文件系统,比如我们常见的 C 盘、D 盘。

参考:
《鸟哥的私房菜》

原文地址:https://www.cnblogs.com/sparkdev/p/11200395.html

时间: 2024-08-27 14:31:05

Linux 文件系统相关的基本概念的相关文章

linux文件系统相关资料

linux下文件系统通常是通过虚拟文件系统(VFS)蔽下层具体文件系统操作的差异,为上层的操作提供一个统一的接口.文件系统底层都是用系统IO缓存层提供的块读写接口,实现逻辑块到物理块的映射.作为应用程序底层的存储逻辑,通用文件系统的目的是提供目录/文件形式的逻辑到物理磁盘的映射.  文件系统本质上是磁盘块的逻辑组织方式. ext2文件系统使用组描述符,块位图,索引节点位图,索引节点表,数据区等组织磁盘空间,每个索引节点代表一个文件,存有该文件占用的磁盘块的位置.在Ext2中,目录是一种特殊的文件

Linux文件系统相关知识整理

1.      磁盘的物理结构 盘面:磁盘是由一叠盘面组成 磁头(Heads):每个磁头对应一个盘面,负责该盘面上的数据的读写 磁道(Track):每个盘面会围绕圆心划分出多个同心圆圈,每个圆圈叫做一个磁道 柱面(Cylinders):所有盘片上的同一位置的磁道组成的立体叫做一个柱面 扇区(Sector):以磁道为单位管理磁盘仍然太大,所以计算机前辈们又把每个磁道划分出了多个扇区 磁盘容量的大小一般和磁道的密集程度有关,扇区数一般是不变的 2.      磁盘I/O的过程 首先是磁头径向移动来寻

linux文件系统相关命令

1. df 用来查看文件系统的磁盘空间占用情况,全称disk free. -h:以人们较易阅读的GB.MB.KB等格式显示 2. du 用来查看文件和目录的大小 显示当前目录下的子目录大小和当前目录大小: 查看指定目录所占大小: -s:只显示总计大小 查看文件大小: 参考: 每天一个linux命令(34):du 命令 3. dumpe2fs 描述:dump ext2/ext3/ext4 filesystem information 提到文件系统,肯定要说inode.关于inode.硬链接.软链接

Linux文件系统相关权限及正则表达式相关命令grep、egrep的使用说明

一.总结本次课程中所涉及命令的使用方法及相关实例展示 1.权限管理相关命令: (1)修改文件权限:chmod(用户类别:u,g,o,a) chmod 用户类别=MODE file...(修改某类用户或某些类用户权限) chmod 用户类别+|-MODE file,...(修改某类用户的某位或某些位权限) -R : 递归               --reference=/path/to/file ,...(复制某文件的权限)    (实例):创建用户mysql01,设置其家目录及内部的文件,属

Linux文件系统十问---深入理解文件存储方式

Linux文件系统十问 --关于文件系统,你知道吗? 文章来源:文件系统十问 关于文件系统,相信大家都不陌生.身为攻城狮的我们几乎天天都会与之打交道,但是细深剖一下,其中又有多少是我们理解深度不够的呢.那么让我们一起来看一下下面这一组Linux文件系统相关的问题吧: 1.机械磁盘随机读写时速度非常慢,操作系统是采用什么技巧来提高随机读写的性能的? 2.touch一个新的空文件占用磁盘空间吗? 占用的话占用多少? 3.新建一个空目录占用磁盘空间吗?占用多少?和新建一个文件相比,哪个占用的更大? 4

Linux文件系统十问,你知道吗?

关于文件系统,相信大家都不陌生.身为攻城狮的我们几乎天天都会与之打交道,但是细深剖一下,其中又有多少是我们理解深度不够的呢.那么让我们一起来看一下下面这一组Linux文件系统相关的问题吧: 1.机械磁盘随机读写时速度非常慢,操作系统是采用什么技巧来提高随机读写的性能的? 2.touch一个新的空文件占用磁盘空间吗? 占用的话占用多少? 3.新建一个空目录占用磁盘空间吗?占用多少?和新建一个文件相比,哪个占用的更大? 4.你知道文件名是记录在磁盘的什么地方吗? 5.文件名最长多长?受什么制约? 6

linux --> 文件系统十问

文件系统十问 参考:http://djt.qq.com/article/view/620 关于Linux文件系统相关的问题: 1.机械磁盘随机读写时速度非常慢,操作系统是采用什么技巧来提高随机读写的性能的? 2.touch一个新的空文件占用磁盘空间吗? 占用的话占用多少? 3.新建一个空目录占用磁盘空间吗?占用多少?和新建一个文件相比,哪个占用的更大? 4.你知道文件名是记录在磁盘的什么地方吗? 5.文件名最长多长?受什么制约? 6.文件名太长了会影响系统性能吗?为什么会产生影响? 7.一个目录

Linux文件系统应用---系统数据备份和迁移(用户角度)

1   前言 首先承诺:对于从Windows系统迁移过来的用户,困扰大家的  “Linux系统下是否可以把系统文件和用户文件分开到C盘和D盘中” 的问题也可以得到完满解决. 之前的文章对Linux的文件系统有过粗略的介绍,但是了解文件系统结构后,有什么用途呢?在本章节将围绕 "基于用户角度的Linux下的数据备份和迁移" 的场景,对Linux文件系统相关知识进行实地应用,产生生产力 . 在了解Linux文件系统之后,就可以 艺高人胆大 玩转Linux的文件目录了. 本文案例 --- &

linux文件系统(1)---概述

一.目的 本系列博文将介绍linux文件系统相关的命令. linux文件系统分为4个层面:用户空间程序.系统调用.内核虚拟文件系统以及实际文件系统:本系列文章只涉及用户空间程序的操作及使用方法,旨在掌握linux文件系统的常用命令,至于文件系统的系统调用和内核实现方法等内容并不涉及. 本文将选取ubuntu14.04发行版做为描述基础. 二.命令分类 linux文件系统相关的命令主要分为两个方面:文件系统相关的命令和文件相关的命令. 文件系统相关的命令有df.du.mount等,这里重点关注的是