Linux学习之文件系统详解

本文和大家分享的主要是 linux文件系统 相关内容,一起来看看吧,希望对大家学习使用这部分内容有所帮助。 
 1 、 linux 文件系统分配策略: 
块分配 (blockallocation) 和扩展分配 (extentallocation) : 
块分配:磁盘上的文件块根据需要分配给文件,避免了存储空间的浪费。但当文件扩充时,会造成文件中文件块的不连续,从而导致过多的磁盘寻道时间。 
每一次文件扩展时,块分配算法就需要写入文件块的结构信息,也就是 meta-dada 。 meta-data 总是与文件一起写入存储设备,改变文件的操作要等到所有 meta-data 的操作都完成后才能进行,因此, meta-data 的操作会明显降低整个文件系统的性能。 
扩展分配:文件创建时,一次性分配一连串连续的块,当文件扩展时,也一次分配很多块。 meta-data在文件创建时写入,当文件大小没有超过所有已分配文件块大小时,就不用写入 meta-data ,直到需要再分配文件块的时候。 
扩展分配采用成组分配块的方式,减少了 SCSI 设备写数据的时间,在读取顺序文件时具有良好的性能,但随机读取文件时,就和块分配类似了。 
文件块的组或块簇 (blockcluster) 的大小是在编译时确定的。簇的大小对文件系统的性能有很大的影响。 
注: meta-data 元信息:和文件有关的信息,比如权限、所有者以及创建、访问或更改时间等。 
 2 、文件的记录形式 
 linux 文家系统使用索引节点 (inode) 来记录文件信息。索引节点是一种数据结构,它包含了一个文件的长度、创建及修改时间、权限、所属关系、磁盘中的位置等信息。 
一个文件系统维护了一个索引节点的数组,每个文件或目录都与索引节点数组中的唯一的元素对应。每个索引节点在数组中的索引号,称为索引节点号。 
 linux 文件系统将文件索引节点号和文件名同时保存在目录中,所以,目录只是将文件的名称和它的索引节点号结合在一起的一张表,目录中每一对文件名称和索引节点号称为一个连接。 
对于一个文件来说,有一个索引节点号与之对应;而对于一个索引节点号,却可以对应多个文件名。 
连接分为软连接和硬连接,其中软连接又叫符号连接。 
硬连接:原文件名和连接文件名都指向相同的物理地址。目录不能有硬连接;硬连接不能跨文件系统 (不能跨越不同的分区 ) ,文件在磁盘中只有一个拷贝。 
由于删除文件要在同一个索引节点属于唯一的连接时才能成功,因此硬连接可以防止不必要的误删除。
软连接:用 ln-s 命令建立文件的符号连接。符号连接是 linux 特殊文件的一种,作为一个文件,它的数据是它所连接的文件的路径名。没有防止误删除的功能。 
 3 、 linux 文件系统分类: 
 ext2 :早期 linux 中常用的文件系统 
 ext3 : ext2 的升级版,带日志功能 
 RAMFS :内存文件系统,速度很快 
 NFS :网络文件系统,由 SUN 发明,主要用于远程文件共享 
 MS-DOS : MS-DOS 文件系统 
 VFAT : Windows95/98 操作系统采用的文件系统 
 FAT : WindowsXP 操作系统采用的文件系统 
 NTFS : WindowsNT/XP 操作系统采用的文件系统 
 HPFS : OS/2 操作系统采用的文件系统 
 PROC: 虚拟的进程文件系统 
 ISO9660 :大部分光盘所采用的文件系统 
 ufsSun:OS 所采用的文件系统 
 NCPFS : Novell 服务器所采用的文件系统 
 SMBFS : Samba 的共享文件系统 
 XFS :由 SGI 开发的先进的日志文件系统,支持超大容量文件 
 JFS : IBM 的 AIX 使用的日志文件系统 
 ReiserFS: 基于平衡树结构的文件系统 
 udf: 可擦写的数据光盘文件系统 
 4 、虚拟文件系统 VFS 
 linux 支持的所有文件系统称为逻辑文件系统,而 linux 在传统的逻辑文件系统的基础上增加料一个蓄念文件系统 (VitualFileSystem,VFS) 的接口层。虚拟文件系统 (VFS) 位于文件系统的最上层,管理各种逻辑文件系统,并可以屏蔽各种逻辑文件系统之间的差异,提供统一文件和设备的访问接口。 
 5 、文件的逻辑结构 
文件的逻辑结构可分为两大类:字节流式的无结构文件和记录式的有结构文件。 
由字节流(字节序列)组成的文件是一种无结构文件或流式文件,不考虑文件内部的逻辑结构,只是简单地看作是一系列字节的序列,便于在文件的任意位置添加内容。 
由记录组成的文件称为记录式文件,记录是这种文件类型的基本信息单位,记录式文件通用于信息管理。 
 6 、文件类型 
普通文件:通常是流式文件 
目录文件:用于表示和管理系统中的全部文件 
连接文件:用于不同目录下文件的共享 
设备文件:包括块设备文件和字符设备文件,块设备文件表示磁盘文件、光盘等,字符设备文件按照字符操作终端、键盘等设备。 
管道 (FIFO) 文件 : 提供进程建通信的一种方式 
套接字 (socket) 文件:该文件类型与网络通信有关 
 7 、文件结构: 
包括索引节点和数据 
索引节点:又称 I 节点,在文件系统结构中,包含有关相应文件的信息的一个记录,这些信息包括文件权限、文件名、文件大小、存放位置、建立日期等。文件系统中所有文件的索引节点保存在索引节点表中。
数据:文件的实际内容。可以是空的,也可以非常大,并且拥有自己的结构。 
 8 、 ext2 文件系统 
 ext2 文件系统的数据块大小一般为 1024B 、 2048B 或 4096B 
 ext2 文件系统采用的索引节点 (inode) :索引节点采用了多重索引结构,主要体现在直接指针和 3 个间接指针。直接指针包含 12 个直接指针块,它们直接指向包含文件数据的数据块,紧接在后面的 3 个间接指针是为了适应文件的大小变化而设计的。 
 e.g :假设数据块大小为 1024B ,利用 12 个直接指针,可以保存最大为 12KB 的文件,当文件超过12KB 时,则要利用单级间接指针,该指针指向的数据块保存有一组数据块指针,这些指针依次指向包含有实际数据的数据块,假如每个指针占用 4B ,则每个单级指针数据块可保存 1024/4 = 256 个数据指针,因此利用直接指针和单级间接指针可保存 1024*12 + 1024*256 = 268KB 的文件。 
当文件超过 268KB 时,再利用二级间接指针,直到使用三级间接指针。利用直接指针、单级间接指针、二级间接指针、三级间接指针可保存的最大文件大小为:1024*12+1024*256+1024*256*256+1024*256*256*256 = 16843020KB ,约 16GB ,若数据块大小为2048B ,指针占 4B ,则最大文件大小为: 2048*12+2048*512+2048*512*512+2048*512*512*512 =268,960,792KB 约 268GB 
若数据块大小为 4096B ,指针占 4B ,则最大文件大小为:4096*12+4096*1024+4096*1024*1024+4096*1024*1024*1024 = 4,299,165,744KB ,约 4TB 
注:命令 tune2fs-l/dev/sda5 可查看文件系统, ext2 文件系统最大文件名长度: 255 个字符 
 ext2 文件系统的缺点: 
 ext2 在写入文件内容的同时并没有同时写入文件 meta-data ,其工作顺序是先写入文件的内容,然后等空闲时候才写入文件的 meta-data 。若发生意外,则文件系统就会处于不一致状态。在重新启动系统的时候, linux 会启动 fsk(filesystemcheck) 的程序,扫描整个文件系统并试图修复,但不提供保证。 
 9 、 ext3 文件系统: 
 ext3 基于 ext2 的代码,所以磁盘格式与 ext2 相同,使用相同的元数据。 
 ext2 文件系统无损转化为 ext3 文件系统: tune2fs-j/dev/sda6 
日志块设备 (Journalingblockdevicelayer,JBD) 完成 ext3 文件系统日志功能。 JBD 不是 ext3 文件系统所特有的,它的设计目标是为了向一个块设备添加日志功能。当一个文件修改执行时, ext3 文件系统代码将通知 JBD ,称为一个事务 (transaction) 。发生意外时,日志功能具有的重放功能,能重新执行中断的事务。 
日志中的 3 种数据模式: 
 1)data=writeback :不处理任何形式的日志数据,给用户整体上的最高性能 
 2)data=odered :只记录元数据日志,但将元数据和数据组成一个单元称为事务 (transaction) 。此模式保持所句句的可靠性与文件系统的一致性,性能远低于 data=writeback 模式,但比 data=journal 模式快 
 3)data=journal :提供完整的数据及元数据日志,所有新数据首先被写入日志,然后才被定位。意外发生过后,日志可以被重放,将数据与元数据带回一致状态。这种模式整体性能最慢,但数据需要从磁盘读取和写入磁盘时却是 3 种模式中最快的。 
 ext3 文件系统最大文件名长度: 255 个字符 
 ext3 文件系统的优点:可用性、数据完整性、速度、兼容性 
 10 、 ReiserFS 文件系统 
 ReiserFS 文件系统是由 HansReiser 和他领导的开发小组共同开发的,整个文件系统完全是从头设计的,是一个非常优秀的文件系统。也是最早用于 Linux 的日志文件系统之一。 
 ReiserFS 的特点:先进的日志机制 
 ReiserFS 有先进的日志 (Journaling/logging) 功能机制。日志机制保证了在每个实际数据修改之前,相应的日志已经写入硬盘。文件与数据的安全性有了很大提高。 
高效的磁盘空间利用 
 Reiserfs 对一些小文件不分配 inode 。而是将这些文件打包,存放在同一个磁盘分块中。而其它文件系统则为每个小文件分别放置到一个磁盘分块中。 
独特的搜寻方式。 
 ReiserFS 基于快速平衡树 (balancedtree) 搜索,平衡树在性能上非常卓越,这是一种非常高效的算法。 ReiserFS 搜索大量文件时,搜索速度要比 ext2 快得多。 Reiserfs 文件系统使用 B*Tree 存储文件,而其它文件系统使用 B+Tree 树。 B*Tree 查询速度比 B+Tree 要快很多。 Reiserfs 在文件定位上速度非常快。在实际运用中, ReiserFS 在处理小于 4k 的文件时,比 ext2 快 5 倍;带尾文件压缩功能(默认)的ReiserFS 比 ext2 文件系统多存储 6% 的数据。 
支持海量磁盘 
 ReiserFS 是一个非常优秀的文件系统,一直被用在高端 UNIX 系统上,可轻松管理上百 G 的文件系统, ReiserFS 文件系统最大支持的文件系统尺寸为 16TB 。这非常适合企业级应用中。 
 linux 文件系统分类优异的性能:由于它的高效存储和快速小文件 I/O 特点,使用 ReiserFs 文件系统的PC ,在启动 X 窗口系统时,所花的时间要比在同一台机器上使用 ext2 文件系统少 1/3 。另外, ReiserFS文件系统支持单个文件尺寸为 4G 的文件,这为大型数据库系统在 linux 上的应用提供了更好的选择。

来源:运维部落

时间: 2024-10-23 00:01:43

Linux学习之文件系统详解的相关文章

linux 下跟文件系统详解

什么是根文件系统 根文件系统首先是一种文件系统,但是相对于普通的文件系统,它的特殊之处在于,它是内核启动时所mount的第一个文件系统,内核代码映像文件保存在根文件系统中,而系统引导启动程序会在根文件系统挂载之后从中把一些基本的初始化脚本和服务等加载到内存中去运行. 我们首先从主机上所安装的Linux操作系统中了解一些根文件系统的信息.比如在笔者工作的Linux桌面系统中可以得到下面的结果: # mount /dev/hda2 on / type ext3 (rw) none on /proc

Linux系统的文件系统详解

Linux系统文件系统: 1.文件系统介绍 文件系统是linux的一个十分基础的知识,同时也是学习linux的必备知识. 本文将站在一个较高的视图来了解linux的文件系统,主要包括了linux磁盘分区和目录.挂载基本原理.文件存储结构.软链接硬链接.和常见目录的介绍.相信有了这些知识对于深入的学习linux会有一定的帮助. Linux文件管理从用户的层面介绍了Linux管理文件的方式.Linux有一个树状结构来组织文件.树的顶端为根目录(/),节点为目录,而末端的叶子为包含数据的文件.当我们给

Linux ext2/ext3文件系统详解

转载: Linux ext2/ext3文件系统使用索引节点来记录文件信息,作用像windows的文件分配表.索引节点是一个结构,它包含了一个文件的长度.创建及修改时间.权限.所属关系.磁盘中的位置等信息.一个文件系统维护了一个索引节点的数组,每个文件或目录都与索引节点数组中的唯一一个元素对应.系统给每个索引节点分配了一个号码,也就是该节点在数组中的索引号,称为索引节点号. linux文件系统将文件索引节点号和文件名同时保存在目录中.所以,目录只是将文件的名称和它的索引节点号结合在一起的一张表,目

[鸟哥linux视频教程整理]02_03_Linux根文件系统详解

一.根文件系统详解: FHS:Linux /boot: 系统启动的相关文件,如内核.initrd,以及grub(bootloader) /dev: 设备文件 块设备:随机访问 字符设备:线性访问,按字符为单位. 设备号:主设备号(major)和次设备号(minor) /etc:配置文件 /home:用户的家目录,每个用户的家目录通常默认为/home/USERNAME /root: /lib:库文件 /lib/modules:内核模块文件 动态库:.dll .so(share object) 静态

linux学习之linux的hostname修改详解《转》

linux的hostname是一个kernel变量,可以通过hostname命令来查看本机的hostname.也可以直接cat /proc/sys/kernel/hostname查看. #hostname #cat /proc/sys/kernel/hostname 上面两种输出结果相同. 修改运行时Linux系统的hostname,即不需要重启系统 hostname命令可以设置系统的hostname #hostname newname newname即要设置的新的hostname,运行后立即生

[转帖]Linux文件系统详解

Linux文件系统详解 https://www.cnblogs.com/alantu2018/p/8461749.html 贼复杂.. 从操作系统的角度详解Linux文件系统层次.文件系统分类.文件系统的存储结构.不同存储介质的区别(RAM.ROM.Flash).存储节点inode.本文参考: http://blog.chinaunix.net/uid-8698570-id-1763151.html http://www.iteye.com/topic/816268 http://soft.ch

Linux学习笔记--Linux文件管理类名利详解

Linux文件管理类命令详解 目录管理: ls.cd.pwd.mkdir.rmdir.tree 文件管理: touch.stat.file.rm.cp.mv.nano 日期管理: touch.clock.hwclock.cal 查看文本: cat.tac.more.less.head.tail cat:连接并显示 -n:在显示时显示每一行的行号 -E:在每行结束处显示 $ Ctrl+C:结束命令 分屏显示: more.less more:向后翻 less: q退出命令 head:查看前n行 ta

Linux开机启动程序详解

我们假设大家已经熟悉其它操作系统的引导过程,了解硬件的自检引导步骤,就只从Linux操作系统的引导加载程序(对个人电脑而言通常是LILO)开始,介绍Linux开机引导的步骤. 加载内核LILO启动之后,如果你选择了Linux作为准备引导的操作系统,第一个被加载的东西就是内核.请记住此时的计算机内存中还不存在任何操作系统,PC(因为它们天然的设计缺陷)也还没有办法存取机器上全部的内存.因此,内核就必须完整地加载到可用RAM的第一个兆字节之内.为了实现这个目的,内核是被压缩了的.这个文件的头部包含着

【转】linux中inittab文件详解

原文网址:http://www.2cto.com/os/201108/98426.html linux中inittab文件详解 init的进程号是1(ps -aux | less),从这一点就能看出,init进程是系统所有进程的起点,Linux在完成核内引导以后,就开始运行init程序. init程序需要读取配置文件/etc/inittab.inittab是一个不可执行的文本文件,它有若干行指令所组成. 理解Runlevel: runlevel用来表示在init进程结束之后的系统状态,在系统的硬