Linux文件空洞与稀疏文件 转

1、Linux文件空洞与稀疏文件

2、文件系统数据存储

3、文件系统调试

文件空洞

  1. 在UNIX文件操作中,文件位移量可以大于文件的当前长度
    在这种情况下,对该文件的下一次写将延长该文件,并在文件中构成一个空洞。位于文件中但没有写过的字节
    都被设为 0。
  2. 如果 offset 比文件的当前长度更大,下一个写操作就会把文件“撑大(extend)”
    在文件里创造“空洞(hole)”。
    没有被实际写入文件的所有字节由重复的 0 表示。空洞是否占用硬盘空间是由文件系统(file system)决定

稀疏文件(Sparse File)

  1. 稀疏文件与其他普通文件基本相同,区别在于文件中的部分数据是全0,且这部分数据不占用磁盘
    空间。
    下面是稀疏文件的创建与查看
[[email protected] ~]# dd if=/dev/zeroof=sparse-file bs=1 count=1 seek=1024k
[[email protected] ~]# ls -l sparse-file
-rw-r--r-- 1 root root 1048577 Oct 15 17:50 sparse-file
[[email protected] ~]# du -sh sparse-file
8.0K sparse-file
[[email protected] ~]# cat anaconda-ks.cfg >> sparse-file
[[email protected] ~]# du -sh sparse-file
12K sparse-file
[[email protected] ~]# du -sh anaconda-ks.cfg
12K anaconda-ks.cfg
[[email protected] ~]#

Linux文件系统inode数据块存储

索引节点采用了多重索引结构,主要体现在直接指针和3个间接指针。直接指针包含12个直接指
针块,它们直接指向包含文件数据的数据块,紧接在后面的3个间接指针是为了适应文件的大小
变化而设计。

Linux稀疏文件inode数据块存储

文件系统存储稀疏文件时,inode索引节点中,只给出实际占用磁盘空间的Block 号,
数据全零且不占用磁盘空间的文件Block并没有物理磁盘Block号。

Linux稀疏文件inode数据块存储

  • 文件空洞部分不占用磁盘空间
  • 文件所占用的磁盘空间仍然是连续的

实例:

[[email protected] mnt]# du -sh sparse-file
20K sparse-file
[[email protected] mnt]# ls -lh sparse-file
-rw-r--r-- 1 root root 1.1G Oct 15 10:36 sparse-file
[[email protected] mnt]#
debugfs: stat sparse-file
Inode: 49153 Type: regular Mode: 0644 Flags:
0x0 Generation: 3068382963
User: 0 Group: 0 Size: 1073742848
File ACL: 0 Directory ACL: 0
Links: 1 Blockcount: 40
Fragment: Address: 0 Number: 0 Size: 0
ctime: 0x507b76af -- Mon Oct 15 10:36:31 2012
atime: 0x507b765f -- Mon Oct 15 10:35:11 2012
mtime: 0x507b76af -- Mon Oct 15 10:36:31 2012
BLOCKS:
(IND):106496, (256):106497, (DIND):106504,
(IND):106505, (262144):106506
TOTAL: 5

Linux文件系统数据块存储多重索引

  • Linux文件系统数据存放采用inode多
    重索引结构,有直接指针和3个间接指
    针。
    类似于编程中的变量定义:
    unsigned long blk;
    unsigned long *blk;
    unsigned long **blk;
    unsigned long ***blk;
  • 直接指针直接指向保存数据的Block
    号。
  • 一级指针指向一个Block,该Block中
    的数据是Block指针,指向真正保存数
    据的Block。
    ?二级三级指针以此类推。

  1. 前12个直接指针,直接指向存储的数据区域
    如Blocks大小为4096,则前12个直接指针就可以保存48KB文件。
  2. 一级指针可存储文件大小计算
    假设每个指针占用4个字节,则一级指针指向的Block可保存4096/4个
    指针,可指向1024个Blocks。一级指针可存储文件数据大小为1024*4096 =
    4MB。
  3. 二级指针可存储文件大小计算
    同样按照Blocks大小为4096,则二级指针可保存的Block指针数量为(4096/4) *
    (4096/4) = 1024*1024。则二级指针可保存的文件数量大小为(1024*1024)*4096
    = 4GB。
  4. 三级指针可存储文件大小计算
    以一级、二级指针计算方法类推,三级指针可存储的文件数据大小为
    (1024*1024*1024)*4096 = 4TB。

Linux_File_Hole_And_Sparse_Files

时间: 2024-08-17 08:54:45

Linux文件空洞与稀疏文件 转的相关文章

linux下压缩并分割稀疏文件

稀疏文件是指一个文件中大部分内容都是空字符的文件. 如虚拟机创建的100G的磁盘文件是,但系统不会马上分割出100G的空间,而是仅标识出虚拟硬盘文件是稀疏文件,待到数据存储时,再分配空间,这样可以大大的节约磁盘利用率. 稀疏文件在进行cp/scp/split/cat时,会由标识的稀疏文件变为非稀疏文件文件,而导致占用大量的空间. 这不是我们要的结果,可以用下面的方式来复制/移动/分割稀疏文件. 创建测试用稀疏文件,大小1G: dd if=/dev/zero of=test_sparse.log

第17章 内存映射文件(3)_稀疏文件(Sparse File)

17.8 稀疏调拨的内存映射文件 17.8.1 稀疏文件简介 (1)稀疏文件(Sparse File):指的是文件中出现大量的0数据,这些数据对我们用处不大,但是却一样的占用空间.NTFS文件系统对此进行了优化,那些无用的0字节被用一定的算法压缩起来.例如声明一个很大的稀疏文件(如100GB),这个文件实际上并不需要占用那么大的空,内部都是一些无用的0数据,那么NTFS就会利用算法释放这些无用的0字节空间,这是对磁盘占用空间的一种优化.但要注意FAT32并不支持稀疏文件的压缩. (2)与稀疏文件

Linux系统学习笔记:文件I/O

Linux支持C语言中的标准I/O函数,同时它还提供了一套SUS标准的I/O库函数.和标准I/O不同,UNIX的I/O函数是不带缓冲的,即每个读写都调用内核中的一个系统调用.本篇总结UNIX的I/O并和标准I/O进行对比. 文件描述符 内核通过文件描述符引用打开的文件,它是一个非负整数.按惯例,shell中使用0与进程的标准输入关联,1与标准输出关联,2与标准错误输出关联.依照POSIX,这些幻数应替换为符号常量 STDIN_FILENO . STDOUT_FILENO .STDERR_FILE

Unix系统编程()文件空洞

如果程序的文件偏移量已然跨越了文件结尾,然后再执行IO操作,将会发生什么情况? read调用将会返回0,表示文件结尾.令人惊讶的是,write函数可以在文件结尾后的任意位置写入数据. 从文件结尾后到新写入数据的这段空间被称为文件空洞. 从编程的角度来看,文件空洞是存在字节的,读取空洞将返回以0(空字节)填充的缓冲区. 然而,文件空洞不占用任何磁盘空间.知道后续某个时间点,在文件空洞中写入了数据,文件系统才会为之分配磁盘块. 文件空洞的优势在于,与为实际需要的空字节分配磁盘块相比,稀疏的填充文件会

Linux之SElinux安全上下文件(1)

Linux之SElinux安全上下文件(1) SELinux:Secure Enhanced Linux,是美国国家安全局(NSA=The National Security Agency)和SCC(Secure Computing Courporation)开发的LInux的一个强制控制的安全模块.2000年以GNU GPL发布,Linux内核2.6版本后继承在内核中. 访问控制类别: DAC:Discretionary Access Control 自由访问控制 MAC:Mandatory

linux系统编程笔记:文件编程

1.创建文件: 创建文件可以使用Linux系统调用create,其原型为:int creat(const char*filename,mode_t mode) filename:你要创建的文件名(包含路径,缺省为在当前路径下创建文件) mode_t:创建模式,表示你创建的文件的权限. S_IRUSR  可读 S_IWUSR  可写 S_IXUSR  可执行 S_IRWXU  可读可写可执行 也可以直接用数字来表示,比如mode_t取0666时表示创建的文件对于文件所有者和文件所有者所在的组以及其

Linux 是如何管理目录文件?

Linux 是使用级层式的树状结构来管理文件目录,如下图所示(只列出了部分目录文件): 在 Linux 中,所有的文件和目录都由根目录(/)开始.它是所有目录和文件的源头,然后再一个一个分支下去.所以我们表示一个目录文件就从根开始一级级写. 如上图的,rc.sysinit 文件,表示该文件的路径是: /etc/rc.d/rc.sysinit  我们系统查找文件也是从根目录开始一级级往下找的. 我们表示一个目录文件的位置有两种方式: 1.  绝对路径: 表示一个文件时,它的开头一般是"/"

Linux脚本——使用echo从一个文件写入另一个文件末尾

echo $(cat 你需要的文件) >> ./目的文件 使用cat获取你想要的文件内容,然后使用echo写入.问题在于cat获取的\n可能失效.如果单纯的作为ACM输入测试数据使用,还是有些价值的.--当然也可以直接生成:Python生成测试数据 $?用于返回上一个程序的执行结果: diff file file2用于判断两个文件是否相同--如果相同,返回0.可以用上一个命令查看. echo和cat的简单区别: 1. 想看一个文件的内容是什么,可以用cat,比如 cat /etc/reslov

securecrt在linux与windows之间传输文件(转)

摘自:http://blog.csdn.net/rangf/article/details/6096365 SecureCRT这款SSH客户端软件同时具备了终端仿真器和文件传输功能.比ftp命令方便多了,而且服务器不用再开FTP服务了.rz,sz是便是Linux/Unix同Windows进行ZModem文件传输的命令行工具. windows端需要支持ZModem的telnet/ssh客户端,SecureCRT就可以用SecureCRT登陆到Unix/Linux主机(telnet或ssh均可).