Linux IO函数的使用和区别

Linux系统中的IO函数主要有read、write、recv、send、recvmsg、sendmsg、readv、writev,本篇主要介绍他们的使用以及区别。

read函数:

#include <unistd.h>ssize_t read(int fd,void *buf,size_t count);

read函数从文件描述符fd对应的文件中,读取count字节,放在buf缓冲区。如果count为0,read返回为0,不进行其他操作;如果count的值大于SSIZE_MAX,结果不能预料。在读取成功的时候,文件对应的读取位置指针,,向后移动位置,大小为成功读取的字节数。

如果read执行成功,访回读取的字节数;当返回为-1时候,读取函数有错误发生。如果已经达到文件的末尾,返回0;其中,ssize数据类型是不同于int、long类型,它是符号数,具体实现时,可能是int,也可能是long。

write函数:

#include <unistd.h>ssize_t write(int fd,const void *buf,size_t count);

参数含义与read类似。

recv函数:

#include <sys/types.h>#include <sys/socket.h>ssize_t recv(int s,void *buf,size_t len,int flags);

recv函数用于接受数据,该函数从套接字s中接收数据放到缓冲区buf中,buf长度为len,操作的方式由flags指定,第一个参数s是套接字文件描述符,它是由系统调用socket函数返回。第二个参数buf是一个指针,指向接收网络的缓冲区。第三个参数len表示缓冲区的大小,以字节为单位。第四个参数flags用于设置接收数据的方式:

recv()函数flasgs的值及含义
MSG_DONTWAIT 非阻塞,立即返回,不等待
MSG_ERRQUEUE 错误消息从套接字错误队列中接收
MSG_OOB 接收外部数据
MSG_PEEK   查看数据,不进行数据缓冲区的清空
MSG_TRUNC 返回所有数据,即使指定的缓冲区过小
MSG_WAITALL 等待所有消息

MSG_DONTWAIT:这个标志将单个IO操作设为非阻塞,而不需要在套接字上打开非阻塞标志,执行IO,然后关闭非阻塞标志。

MSG_ERRQUEUE:该错误的传输依赖于所使用的协议。

MSG_OOB:这个标志可以接收带外的数据,而不是接收一般数据。

MSG_PEEK:这标志查看可读的数据,在recv函数执行后,内核不会将这些数据丢弃。

MSG_TRUNC:在接收数据后,如果用户的缓冲区大小不足以完全复制缓冲区里的数据,则将数据截掉,仅靠复制用户缓冲区大小的数据,其他的数据将丢弃。

MSG_WAITALL:告诉内核在没有读到请求的字节数之前不要读操作返回。如果系统支持这个标志,可以去掉readn()函数而用下面的替代:

#define readn(fd,ptr,n) recv(fd,ptr,n,MSG_WAITALL).

即使设置了MSG_WAITALL,如果发生以下情况:a扑捉一个信号;b连接终止;c在套接字上发生错误,这个函数返回的字节数仍然比请求的少。

当指定MSG_WAITALL标志时,函数会复制与用户指定的长度相等的数据。如果内核中的数据不能满足要求,会一直等待到数据足够的时候才返回。

函数recv()的返回值是成功接收到的字节数,当返回值为-1时错误发生。

recv函数errno的值及含义
EAGAIN 套接字定义为非阻塞,而操作采用了阻塞方式;或者定义了超时时间到了,而没有接收到数据
EBADF 参数s不是合法的描述符
ECONNREFUSED 远程主机不允许此操作
EFAULT 接收缓冲区的指针,在此进程之外
EINTR 接收到中断信号
EINVAL 传递了不合法的参数
ENOTCONN 套接字s表示流式套接字,此套接字没有连接
ENOTSOCK 参数不是套接字描述符

recv()通常用于TCP,UDP使用recvfrom函数接收数据,当然在数据报套接字绑定了地址和端口后,也可以使用recv函数接收数据。

recv()从内核的接收缓冲区中复制数据到用户指定的缓冲区,当内核中的数据比指定的缓冲区小时,一般情况下(没有采用MSG_WAITALL标志)会复制缓冲区中的所有数据到用户缓冲区,并返回数据的长度。当内核中的数据比指定的缓冲区多时,会将用户指定的长度的接收缓冲区中的数据复制到用户指定地址,其余的数据需要下次调用接收函数时再复制,内核在复制用户指定的数据后,会销毁已经复制完毕的数据,并进行调整。

send函数:

#include <sys/types.h>
#include <sys/socket.h>
ssize_t send(int s,const void*buf,size_t len,int flags);

send函数将缓冲区buf中的大小为len的数据,通过套接字文件描述符s按照flasg指定的方式发生出去(其中的含义与recv()中一致),它的返回值是成功发生的字节数。

由于用户缓冲区buf中的数据通过send发送,不一定能够全部发送出去,所以要检查send()返回值。当send()的返回值小于len时,表面缓冲区中仍有部分数据没有发送成功,这时需要重新发送剩余部分的数据。通常的剩余数据发送方式是对原来的buf中的数据位置进行偏移,偏移的大小为已经发送成功的字节数。

当send()返回-1时,就错误了。

函数send()只能用于套接字处于连接状态的描述符,之前必须用connect()函数或者其他函数进行连接。对于send和write之间的差别是表示发送方式flag,当flag为0时,send()和write()完全一样的,且send(s,buf,len,flags)和sendto(s,buf,len,flags,NULL,0)是等价的。

readv函数:

#include <sys/uio.h>
ssize_t readv(int s,const struct iovec*vector,int count);

read()可以接收多个缓冲区的数据。readv函数从套接字描述符s中读取count块的数据放在缓冲区向量vector中。返回值为成功接收到的数据的字节数,当-1时,错误发生。

其中的参数vector为一个向量的指针,结构struct iover在文件<sys/uio.h>定义:

1 struct iovec
2 {
3     void*iov_base;                             // 向量的缓冲区地址
4     size_t iov_len;                             // 大小,字节为单位
5 }

在调用readv的时候必须指定iovec的iov_len长度,将值放在iov_len中。参数vector指向一块结构vector的内存,大小count定。如下图,其中阴影部分是需要设置的。

writev函数:

#include <sys/uio.h>
ssize_t writev(int s,const struct iovec*vector,int count);
//// 是不是觉得和readv一样

总结:

下表总结了各个函数的区别、特点:O标记的为具备此种属性

时间: 2024-10-06 22:28:09

Linux IO函数的使用和区别的相关文章

Linux网络编程--IO函数以及示例

网络数据能够正确到达用户并被用户接收是进行网络数据传输的基本目的, 网络数据的接受和发送有很多种方案,例如:直接发送和接收,通过向量发送和接收,使用消息发送和接收等.本篇文章主要介绍常用的IO函数以及用法,如:最常用的read()/write()函数,和其他标准的套接字专用函数recv()/send(),readv()/writev(),recvmsg()/sendmsg(). 各个函数原型以及介绍如下: ssize_t read(int fd, void *buf, size_t count)

Linux C _exit函数与exit函数的联系与区别

一.联系 1.功能上,_exit和exit函数都是让进程正常退出,即关闭进程所打开的文件描述符,释放已占用内存和其他资源. 二.区别 1._exit函数在头文件unistd.h中声明,而exit在头文件stdlib.h中声明. 2.执行_exit函数后,控制权立即返回给内核,而exit函数要先执行一些清除操作,然后才将控制权交给内核. 3._exit函数不会刷新I/O缓冲区,可能造成数据丢失,而exit函数是在_exit函数之上的一个封装,它在调用_exit函数之前,会先刷新I/O缓冲区,保证了

文件IO函数和标准IO库的区别

摘自 http://blog.chinaunix.net/uid-26565142-id-3051729.html 1,文件IO函数,在Unix中,有如下5个:open,read,write,lseek,close.称之为不带缓存的IO(unbuffered I/O).不带缓存指的是每个read,write都调用内核中的一个系统调用. 2,标准IO库,由ANSI C标准说明.标准IO库处理很多细节.例如缓存分配,以优化长度执行IO等.标准的IO提供了三种类型的缓存. (1)全缓存:当填满标准IO

Linux中的系统IO函数

一.整体大纲 二. 系统IO函数1. 一些概念    文件描述符     PCB     C库函的IO缓冲区 1) 文件描述符            int 类型            一个进程最多可打开多少文件     2) pcb           进程控制块           在其中有一个文件描述符表 -- 数组[1024] C库IO函数工作流程: pcb和文件描述符: 2. 虚拟地址空间 虚拟地址空间就是程序启动起来之后从硬盘上会有一块虚拟内存分配出来. cpu 为什么要使用虚拟地址

Linux IO模型与Java NIO

概述看Java NIO一篇文章的时候又看到了"异步非阻塞"这个概念,一直处于似懂非懂的状态,想解释下到底什么是异步 什么是非阻塞,感觉抓不住重点.决定仔细研究一下.本文试图研究以下问题: web server原理,bio的connector与nio的connector在架构上到底什么区别? NIO的优势到底在哪里,是如何应用到实践中的? 同步/异步.阻塞/非阻塞到底是什么概念,引出的IO模型同步阻塞.同步非阻塞.异步阻塞.异步非阻塞的具体使用场景,适用的场景是怎样的? bio nio也

Linux IO模式及 select、poll、epoll详解

注:本文是对众多博客的学习和总结,可能存在理解错误.请带着怀疑的眼光,同时如果有错误希望能指出. 同步IO和异步IO,阻塞IO和非阻塞IO分别是什么,到底有什么区别?不同的人在不同的上下文下给出的答案是不同的.所以先限定一下本文的上下文. 本文讨论的背景是Linux环境下的network IO. 一 概念说明 在进行解释之前,首先要说明几个概念: - 用户空间和内核空间 - 进程切换 - 进程的阻塞 - 文件描述符 - 缓存 I/O 用户空间与内核空间 现在操作系统都是采用虚拟存储器,那么对32

Linux io Model

socket阻塞与非阻塞,同步与异步 作者:huangguisu 1. 概念理解 在进行网络编程时,我们常常见到同步(Sync)/异步(Async),阻塞(Block)/非阻塞(Unblock)四种调用方式: 同步: 所谓同步,就是在发出一个功能调用时,在没有得到结果之前,该调用就不返回.也就是必须一件一件事做,等前一件做完了才能做下一件事. 例如普通B/S模式(同步):提交请求->等待服务器处理->处理完毕返回 这个期间客户端浏览器不能干任何事 异步: 异步的概念和同步相对.当一个异步过程调

Linux IO模式和select,poll,epoll解释

一些概念: 虚拟空间:是进程所看到的所有地址组成的空间.虚拟空间某个进程对所有分配给它的所有物理地址的重新映射. 寻址返回与计算机的位数有关系.分为内核空间与用户空间.针对32位的Linux系统,最高的1G字节为内核空间.最低的3G字节为用户空间. 进程阻塞:这是进程自身的一种主动行为.当进程进入阻塞状态的时候,不占用CPU资源. 文件描述符fd:非负整数,是一个索引值.指向内核为每一个进程所维护的该进程的打开文件记录表. 缓存IO:大多数文件系统的默认IO都是缓存IO.过程是:数据先被拷贝到操

深入剖析Linux IO原理和几种零拷贝机制的实现

深入剖析Linux IO原理和几种零拷贝机制的实现 来源 https://zhuanlan.zhihu.com/p/83398714 零壹技术栈      公众号[零壹技术栈] 前言 零拷贝(Zero-copy)技术指在计算机执行操作时,CPU 不需要先将数据从一个内存区域复制到另一个内存区域,从而可以减少上下文切换以及 CPU 的拷贝时间.它的作用是在数据报从网络设备到用户程序空间传递的过程中,减少数据拷贝次数,减少系统调用,实现 CPU 的零参与,彻底消除 CPU 在这方面的负载.实现零拷贝