Unix系统编程（）文件空洞

如果程序的文件偏移量已然跨越了文件结尾，然后再执行IO操作，将会发生什么情况？

read调用将会返回0，表示文件结尾。令人惊讶的是，write函数可以在文件结尾后的任意位置写入数据。

从文件结尾后到新写入数据的这段空间被称为文件空洞。

从编程的角度来看，文件空洞是存在字节的，读取空洞将返回以0（空字节）填充的缓冲区。

然而，文件空洞不占用任何磁盘空间。知道后续某个时间点，在文件空洞中写入了数据，文件系统才会为之分配磁盘块。

文件空洞的优势在于，与为实际需要的空字节分配磁盘块相比，稀疏的填充文件会占用较少的磁盘空间。

核心转储文件（core dump）是包含文件空洞常见的例子。

对于文件空洞不占用磁盘空间的说法要稍微限定一下。在大多数的文件系统中，文件空间的分配是以块为单位的。块的大小取决于文件系统，通常是1024字节，2048字节，4096字节。如果空洞的边界落在块内，而非恰好落在块边界上，则会分配一个完整的块来存储数据，块中与空洞相关的部分则以空字节填充。

不支持文件空洞的文件系统会显式地将空字节写入文件。

空洞的存在意味着一个文件名义上的大小可能要比其占用的磁盘存储总量要大。

向文件空洞中写入字节，内核需要为其分配存储单元，即使文件大小不变，系统的可用磁盘空间也将减少。

不太理解的是空洞落在块内和落在块的边界上，我倒是理解了，但是不知道对不对。

原文地址：https://www.cnblogs.com/tuhooo/p/8642039.html

时间： 2024-11-07 23:23:37

Unix系统编程（）文件空洞的相关文章

《Linux/Unix系统编程手册》读书笔记7 （/proc文件的简介和运用）

<Linux/Unix系统编程手册>读书笔记目录第11章这章主要讲了关于Linux和UNIX的系统资源的限制. 关于限制都存在一个最小值,这些最小值为<limits.h>文件中的常量. 通过cat 命令查看: [email protected]:~/Code/tlpi$ cat /usr/include/limits.h /* Copyright (C) 1991, 1992, 1996, 1997, 1998, 1999, 2000, 2005 Free Software

《Linux/Unix系统编程手册》读书笔记8 （文件I/O缓冲）

<Linux/Unix系统编程手册>读书笔记目录第13章这章主要将了关于文件I/O的缓冲. 系统I/O调用(即内核)和C语言标准库I/O函数(即stdio函数)在对磁盘进行操作的时候都会发生缓冲.通过缓冲可以在一定程度上将用户空间与实际的物理设备分离,还可以减少内核访问磁盘的次数. 先来看看关于内核缓冲区高速缓冲:read和write调用在对磁盘文件进行操作的时候不会直接访问磁盘,如下图所示. 例如:write(fd, "abc", 3) write调用会将"

《Linux/Unix系统编程手册》读书笔记9（文件属性）

<Linux/Unix系统编程手册>读书笔记目录在Linux里,万物皆文件.所以文件系统在Linux系统占有重要的地位.本文主要介绍的是文件的属性,只是稍微提及一下文件系统,日后如果有更深入的研究一定会写出来. 下图为磁盘分区与文件系统的关系文件系统中的文件(目录)在i-node表上都有唯一的记录(i-node).i-node通过数据块指针指向数据块,这些数据块就是该i-node对应的文件的数据. i-node与数据块的关系如下: 因为Linux支持很多类型的文件系统,但是每种文件系统的

Linux/Unix系统编程手册--SOCKET章节读书笔记

SOCKET章节读书笔记强烈推荐Linux/Unix系统编程手册,号称超越APUE的神书. backlog含义 #include <sys/socket.h> int listen(int socketfd, int backlog) backlog参数限制未决连接(未accept)的数量,在这个数量之内,connect会立刻成功. Linux上上限为128,定义在 udp已连接socket udp socket也是可以调用connect()的,这种叫已连接socket,内核会记录这个soc

读《UNIX系统编程》关键字解释第一章

第一次看这本书的时候好混乱啊,这次准备再看一遍,仔仔细细的看一遍.并且把自己感觉要记的关键字找出. 版本1.01 Songsong整理第一章:UNIX基础知识 1.内核:.“内核”指的是一个提供硬件抽象层.磁盘及文件系统控制.多任务等功能的系统软件.一个内核不是一套完整的操作系统.一套基于Linux内核的完整操作系统叫作Linux操作系统,或是GNU/Linux. 硬件抽象层是位于操作系统内核与硬件电路之间的接口层,其目的在于将硬件抽象化.它隐藏了特定平台的硬件接口细节,为操作系统提供虚拟硬

Linux/UNIX系统编程手册 PDF下载

网盘下载地址:Linux/UNIX系统编程手册 PDF下载 – 易分享电子书PDF资源网作者: Michael Kerrisk 出版社: 人民邮电出版社原作名: The Linux Programming Interface: A Linux and UNIX System Programming Handbook 译者: 孙剑许从年董健 / 孙余强郭光伟陈舸出版年: 2014-1 页数: 1176 定价: 158 装帧: 平装内容简介 · · · · · · <linux/un

unix环境编程文件操作

1. 文件的打开读写关闭 int open(const char *pathname,int flag,-) 打开一个文件成功则返回文件描述符,若出现则返回-1 flag可以取下面的常量 O_RDONLY 只读打开 O_WRONLY 只写打开 O_RDWR 读写打开其它的常量 O_APPEND,O_CREAT,O_EXCL,O_TRUNC,O_NOCTTY,O_NONBLOCK是可选的. int create(const char *pathname,mode_t mode

TLPI（liunx/unix系统编程手册）笔记（三）文件IO：通用的IO模型

读下来总的就是介绍了四个IO的API--open,read,write,close. 大家都是知道的,everything is file,在linux系统里面一切都是看作文件来操作的,学习linux就得先学好文件IO,也可以看见TLPI这本书的介绍完一些概念之后就开始介绍文件IO了. IO,大概的分为磁盘文件IO,buffering(缓冲)IO.貌似缓冲的水很深,之后会写博客. ------------------------------------ (1)文件描述符. 在进行IO操作之前,总

TLPI（liunx/unix系统编程手册）笔记（四）深入探究文件I/O

本章的重点我想就是原子操作,避免在几个进程在打开同一文件的时候造成的错误,了解一下时间片的概念会对本章有所帮助. (1)独占方式打开文件.(open <-O_CREAT) 知道,open,可以创建文件并返回fd.当我们的进程运行到open这个函数时间片到了,另一个进程也对这个路径的文件open,那么时间片结束后两个进程都会认为自己是这个文件的拥有者.并未是独占创建打开的.在open 函数的第二个参数中有 O_EXCL 这种打开方式,可以解决独占的问题.另外可以在多进程对一个文件写的时候,