Unix文件操作

一、概述

Unix文件操作常用函数包括openclosecreatlseekdupdup2fcntl等,

其中open、creat、 fcntl函数需要包含头文件<fcntl.h>,

其余几个函数需要包含头文件<unistd.h>。

由于在Linux操作系统 中使用man命令可以非常方便的查找函数原型及示例,这里就不帖出函数原型了,只讲一下使用时需要注意的地方。

二、文件描述符

每一个在程序中打开的文件都有一个相应的文件描述符(file descriptor),Unix操作系统中的文件描述符保存在/dev/fd目录下。

每一个进程对该目录读取到的结果都不想同(视该进程正在使用的文件 数而定)。

如果由open函数直接读取该路径下的文件,将视为在此进程中对该文件描述符所对应的文件进行dup操作,在大多数操作系统中将忽略打开方式, 而部分操作系统要求打开方式为所涉及文件原先打开方式的子集。

三、Flags

当使用O_APPEND方式打开文件时,每次调用write函数会在文件最后面写入新数据,调用write函数后读取当前文件偏移量 (current offset)可以很清楚的看到该值与文件最大偏移量相等。

如果使用了O_RDWR | O_APPEND方式打开文件,程序可以对该文件在任意位置实现读取操作(read),但写入操作(write)会使文件偏移量被重置,如果读取与写入混 合使用,可能会导致读取位置出现偏差。

四、函数细说

4. 1 creat & open  

  creat函数与

open(pathname, O_WRONLY | O_CREAT | O_TRUNC, mode);

  等同,使用creat函数的缺陷在于如果需要在创建的同时读写该文件,需要在创建后将文件关闭,重新以读写方式open该文件,相对而言,下面的调用方式更为简单:

open(pathname, O_RDWR | O_CREAT | O_TRUNC, mode);

  其中,O_TRUNC表示:如果此文件存在,而且为只读或只写成功打开,则将其长度截短为0(即会清空文件内容)

4.2 lseek

  在lseek函数中,偏移量(offset)是一个长整型,可正可负。如果偏移量大于文件最大偏移量,对该位置进行写入操作,将对文件进行扩展,文件中的空洞(从原文件最大偏移量到写入位置)被填充为0,但并不占用磁盘块

  例如:

fd = creat("file.txt", S_IRWXU);
lseek(fd,102400,SEEK_SET);
write(fd,"abcdefg",7);

  程序执行后,使用"ls -ls file.txt"命令可以看出,文件file.txt所占块数为8.

 4.3 read

  使用read函数时,遇到以下情况会使read函数提前返回:

  • 文件读取遇到EOF。
  • 从终端中读取到一行内容。(STDIN_FILENO)
  • 当从网络读时,网络中的缓冲机构可能造成返回值小于所要求读的字节数。
  • 从管道或FIFO中读取到全部内容。
  • 某些面向记录的设备,例如磁带,一次最多返回一个记录。
  • 接收到中断信号。

五、File Sharing

5.1 说明

  在进程中,一个进程所打开的所有文件描述符存放在一个table中,table中的每条记录包括文件描述符falgs(file descriptor flags)和指向文件表的指针(fils pointer)。

  一个文件表包含一个文件的状态标志(file status flags),当前偏移量(offset),一个指向v-node表的指针。一个v-node表包括v-node信息,i-node信息,文件大小等。如 图1所示:

图1. Unix文件表(进程中)

  在多个进程中,可能出现多个文件描述符指向同一个文件,此时如图2所示:

图2. 多个进程中同时打开同一个文件

  当使用dup、dup2函数后,文件描述符将被复制,此时如图3所示:

图3. dup后多个文件描述符指向同一个file table

5.2 控制多进程对文件的访问

  在进行多进程或多线程编程时,由于无法控制CPU对进程和线程的调度,如果不加以控制,可能会在任意两条程序控制语句中间出现中断,导致数据被污染。

  可以使用原语来保证在特定操作中数据不会被污染,使数据同步。

  原语形式的文件读写函数为 pread和pwrite。

  也正因为数据可能被污染的原因,虽然dup2(file1,file2)与close(file2); fcntl(file1, F_DUPFD, file2)等价,但第一个函数不会导致数据被污染,我们应该使用第一个函数。

5.3 文件更新

  在操作系统中,向文件中写入数据往往只是暂时写入至操作系统缓存中,由操作系统控制磁盘中文 件的更新时间。使用sync、fsync、fdatasync函数可以实现磁盘中文件的实时更新。

  使用sync函数时,文件表中的所有文件将被更新。

  fsync函数只更新制定文件。

  fdatasync函数只更新指定文件中的数据内容,而不更新相应的文件属性。

  如果file status flags中O_SYNC标志被设置,程序中每次对该文件的write操作都将导致文件被更新;如果O_DSYNC被设置,程序中每次对该文件的write操作都将导致文件中的数据部分被更新。

 5.4 fcntl

  fcntl函数可以修改已打开文件的属性。

  当使用fcntl函数获取文件状态标记(file status flags)时,由于O_RDONLY、O_WRONLY、O_RDWR标记具有排外型,无法被直接识别,需要由O_ACCMODE掩码转换后才可以被识 别。

  示例代码如下:

#include <fcntl.h>
int
main(int argc, char *argv[])
{
int val;
if (argc != 2)
    err_quit("usage: a.out <descriptor#>");
if ((val = fcntl(atoi(argv[1]), F_GETFL, 0)) < 0)
    err_sys("fcntl error for fd %d", atoi(argv[1]));
switch (val & O_ACCMODE) {
    case O_RDONLY:
    printf("read only");
    break;
case O_WRONLY:
    printf("write only");
    break;
case O_RDWR:
    printf("read write");
    break;
default:
    err_dump("unknown access mode");
}
if (val & O_APPEND)
    printf(", append");
if (val & O_NONBLOCK)
    printf(", nonblocking");
#if defined(O_SYNC)
if (val & O_SYNC)
    printf(", synchronous writes");
#endif
#if !defined(_POSIX_C_SOURCE) && defined(O_FSYNC)
if (val & O_FSYNC)
printf(", synchronous writes");
#endif
putchar(‘\n‘);
exit(0);
}
时间: 2024-12-29 23:25:35

Unix文件操作的相关文章

unix文件操作函数

1. fopen函数 1 #include <stdio.h> 2 FILE *fopen(const char *path, const char *mode) 返回:文件顺利打开后,指向该流的文件就会被返回.如何文件打开失败则返回NULL,并把错误代码存在 errno 中. 参数说明: mode: 1)r        以只读方式打开文件,该文件必须存在.     2) r+     以可读写方式打开文件,该文件必须存在.    3) rb+   以读写打开一个二进制文件,允许读写数据,文

unix环境编程 文件操作

1.  文件的打开读写 关闭 int open(const char *pathname,int flag,-)   打开一个文件 成功则返回文件描述符,若出现则返回-1 flag可以取下面的常量 O_RDONLY  只读打开 O_WRONLY  只写打开 O_RDWR    读写打开 其它的常量 O_APPEND,O_CREAT,O_EXCL,O_TRUNC,O_NOCTTY,O_NONBLOCK是可选的. int create(const char *pathname,mode_t mode

Unix/Linux环境C编程入门教程(41) C语言库函数的文件操作详解

?? 上一篇博客我们讲解了如何使用Linux提供的文件操作函数,本文主要讲解使用C语言提供的文件操作的库函数. 1.函数介绍 fopen(打开文件) 相关函数 open,fclose 表头文件 #include<stdio.h> 定义函数 FILE * fopen(const char * path,const char * mode); 函数说明 参数path字符串包含欲打开的文件路径及文件名,参数mode字符串则代表着流形态. mode有下列几种形态字符串: r 打开只读文件,该文件必须存

Unix/Linux环境C编程入门教程(40) 初识文件操作

?? 1.函数介绍 close(关闭文件) 相关函数 open,fcntl,shutdown,unlink,fclose 表头文件 #include<unistd.h> 定义函数 int close(int fd); 函数说明 当使用完文件后若已不再需要则可使用close()关闭该文件,二close()会让数据写回磁盘,并释放该文件所占用的资源.参数fd为先前由open()或creat()所返回的文件描述词. 返回值 若文件顺利关闭则返回0,发生错误时返回-1. 错误代码 EBADF 参数fd

unix环境高级编程——文件操作

一.阻塞io操作和非阻塞io操作 对于阻塞io操作:当cpu得不到需要的文件数据的时候,则将自己挂起,直到有了数据,才能执行下面的操作. 非阻塞io:  当cpu得不到文件时候,其一直在轮询cpu,直达得到数据. 二.文件描述符 对于内核而言,所有打开的文件,都用文件描述符来引用.所有的文件操作都是由内核态完成的,当一个用户的进程创建一个文件时候,内核会给其返回一个文件描述符. 而当用户进程,对文件进行各类读写操作的时候,也是给内核传入文件描述符.这样,就可以对其文件进行操作了. 三.open函

LINUX/UNIX的文件操作函数

本文用于记录在LINUX编程中,常用的文件操作函数,包括系统调用和库函数,以备查阅. 针对输入输出操作,直接使用底层系统调用的一个问题是它们的效率十分低,原因在于: 1.使用系统调用会影响系统的性能,与函数调用相比,系统调用的开销要大些,因为在执行系统调用时,Linux必须从运行用户代码切换到执行内核代码,然后再返回用户代码. 2.硬件会限制对底层系统调用一次所能读写的数据块大小.比如,磁带机通常一次能写的数据块长度是10K,所以若你试图写的数据量不是10K的整数倍,磁带机还是以10K为单位卷绕

python文件操作

文件操作:os.mknod("test.txt")        创建空文件fp = open("test.txt",w)     直接打开一个文件,如果文件不存在则创建文件 关于open 模式: w     以写方式打开,a     以追加模式打开 (从 EOF 开始, 必要时创建新文件)r+     以读写模式打开w+     以读写模式打开 (参见 w )a+     以读写模式打开 (参见 a )rb     以二进制读模式打开wb     以二进制写模式打

C/C++文件操作

1 基于C的文件操作 在ANSI C中,对文件的操作分为两种方式,即流式文件操作和I/O文件操作 2 一.流式文件操作 3 4 1.fopen() 5 FILE *fopen(const char *filename,const char *mode) 6 "r" 以只读方式打开文件 7 "w" 以只写方式打开文件 8 "a" 以追加方式打开文件 9 "r+" 以读/写方式打开文件,如无文件出错 10 "w+&quo

字符编码、文件操作、函数定义

一.字符编码 字符串是一种数据类型,但是,字符串比较特殊的是还有一个编码问题. 因为计算机只能处理数字,如果要处理文本,就必须先把文本转换为数字才能处理.最早的计算机在设计时采用8个比特(bit)作为一个字节(byte),所以,一个字节能表示的最大的整数就是255(二进制11111111=十进制255),如果要表示更大的整数,就必须用更多的字节.比如两个字节可以表示的最大整数是65535,4个字节可以表示的最大整数是4294967295. 由于计算机是美国人发明的,因此,最早只有127个字符被编