总结C语言中的getchar()和EOF

希望本文可以对初学C的朋友有帮助,也希望能和其他朋友进行交流。本文属于半原创半转帖,参考了chinaunix.net的一位博友的文章,链接地址分别 为:http://blog.chinaunix.net/u2/66435/showart_1351359.html。本人重写 了这篇文章(加入了自己的理解,并修改了一些我认为不恰当的表述),同时对文中例子做了一些更详细的解释。

大师级经典的著作,要字斟句酌的去读,去理解。以前在看K&R的The C Programming Language(Second
Edition)中第1.5节的字符输入/输出,很迷惑getchar()和EOF的行为。因此,感觉很有必要总结一下,不然,很多琐碎的知识点长时间过后就会淡忘的,只有写下来才是最好的方法。

一、对getchar的两点总结:

1.
getchar是以行为单位进行存取的。
    
当调用getchar函数读取输入时,只有当输入字符为换行符‘/n‘或文件结束符EOF时,getchar才会停止执行,整个程序将会往下执行。并且,
如果输入行是以EOF结束的(EOF之前不是换行符),则EOF会被“吃掉”(即不会被getchar读取到)。譬如下面程序段:

while((c = getchar()) != EOF){
putchar(c);
}

执行程序,输入:abc,然后回车。则程序就会去执行puchar(c),然后输出abc和一个回车。然后可以继续输入,再次遇到换行符的时候,程序又会把
那一行的输入的字符输出在终端上。令人迷惑的是,getchar不是以字符为单位读取的吗?那么,既然我输入了第一个字符a,肯定满足while循环(c
= getchar()) !=
EOF的条件,那么应该执行putchar(c)在终端输出一个字符a。但是程序就偏偏不这样执行,而是必需读到一个换行符或者文件结束符EOF才进行一次输出。

造成这种结果的一种解释是,输入
终端驱动处于一次一行
的模式下。也就是虽然getchar()和putchar()确实是按照每次一个字符进行的。但是终端驱动处于一次一行的模式,它的输入只有到‘/n‘或
者EOF时才结束。在本例中,程序段调用了getchar函数,则控制权从程序段转移到getchar函数,而getchar函数要依赖于操作系统的驱动
来读取输入,没遇到
换行符或者EOF
,驱动不会通知getchar函数,getchar函数处于“阻
塞”状态。而遇到
换行符或者EOF后,
getchar函数解除“阻塞”,读取一个字符,控制权返回程
序段,执行putchar函数,循环执行。直到遇到EOF字符或者这行输入全部处理完。

2. getchar()的返回值一般情况下是非负
值,但也可能是负值,即返回EOF。这个EOF在函数库里一般定义为-1。正确的定义方法如下(K&R C中特别提到了这个问题):

int
c;
c = getchar();

二、EOF的两点总结(主要指普通终端中的EOF)
1. EOF作为文件结束符时的情况:

EOF虽然是文件结束符,但并不是在任何情况下输入Ctrl+D(Windows下Ctrl+Z)都能够实现文件结束的功能,只有在下列的条件下,才作为文件结束符。
(1)遇到getcahr函数执行时,要输入第一个字符时就直接输入Ctrl+D;
(2)在前面输入的字符为换行符时,
接着输入Ctrl+D;
(3)在前面有字符输入且不为换行符时,要连着输入两次Ctrl+D,这时第二次输入的Ctrl+D起到文件结束符的功能,至于第一次的
Ctrl+D作为行结束符(如1.1所讲)。

其实,这三种情况都可以总结为只有在getchar()提示新的一次输入时,
直接输入Ctrl+D才相当于文件结束符。

2. EOF作为行结束符时的情况,这时候输入Ctrl+D作为行结束的标志能结束getchar()的“阻塞”,使getchar()逐个字符读入,但是EOF会被“吃掉”,并不会被读取。

以上面的代码段为例,
如果执行时输入abc,然后 Ctrl+D,程序输出结果为:
abcabc

注意:第一组abc是你从终端输入的,然后输入Ctrl+D,getchar逐个字符读取并逐个输出打印出第二组abc,同时光标停在
第二组字符的c后面,然后可以进行新一次的输入。这时如果再次输入Ctrl+D,就会起到了文件结束符的作用,因为EOF是一行输入的第一个字符。如果输
入abc之后,然后回车,输入换行符的话,则终端显示为:
abc‘/n‘
abc‘/n‘
//第三行

其中第一行为你是终端输入的,第二行是终端输出(含换行符),光标停在了第三行处,等待新一次的终端输入。从这里也
可以看出Ctrl+D和换行符分别作为行结束符时,输出的不同结果。

时间: 2024-08-25 04:12:32

总结C语言中的getchar()和EOF的相关文章

C语言中的getchar和putchar详解

首先给出<The_C_Programming_Language>这本书中的例子: #include <stdio.h> int main(){    int c;     c = getchar();     while (c != EOF)    {          putchar();              c= getchar();      }    return 0;} 这里主要解释下为什么要用int型来接受getchar函数. 很多时候,我们会写这样的两行代码:c

c语言中char* 代表什么

1 c语言中,char* 代表 字符指针类型,当其指向一个字符串的第一个元素时,它就可以代表这个字符串了 2 示例 #include<stdio.h> int main(){ char* str = "learn c"; printf("%s\n", str); getchar(); return 0; } /*运行结果是 learn c */ 3 分析 在char* str="learn c";中,"learn c&quo

C语言中,为什么字符串可以赋值给字符指针变量

转载于:http://www.cnblogs.com/KingOfFreedom/archive/2012/12/07/2807223.html 本文是通过几篇转帖的文章整理而成的,内容稍有修改: 一. char *p,a='5';p=&a;                     //显然是正确的,p="abcd";              //但为什么也可以这样赋值?? 问:一直理解不了为什么可以将字串常量赋值给字符指针变量,请各位指点! 答: 双引号做了3件事:  1.

C语言中malloc()和calloc()c函数用法

C语言中malloc()和calloc()c函数用法 函数malloc()和calloc()都可以用来动态分配内存空间,但两者稍有区别. malloc()函数有一个参数,即要分配的内存空间的大小: void *malloc(size_t size); calloc()函数有两个参数,分别为元素的数目和每个元素的大小,这两个参数的乘积就是要分配的内存空间的大小. void *calloc(size_t numElements,size_t sizeOfElement); 如果调用成功,函数mall

在Swift语言中,关于Any,AnyObject,AnyClass的区别与联系

在Swift语言中,协议定义类或结构体应该遵守的变量和方法集合,如下所示,这个一个标准的协议的声明: protocol NSObjectProtocol { func isEqual(object: AnyObject?) -> Bool var hash: Int { get } var superclass: AnyClass? { get } func `self`() -> Self! func isProxy() -> Bool func isKindOfClass(aClas

GO语言中import的规则和用法

GO语言中引入包使用import,我将在本文讲解下规则和用法. 一些规则: 1.包中不能有main方法. 2.同文件夹中可以直接用方法名调用. 3.main函数建议放在package main里4.main不能调用同个目录下的其它文件中的方法. 5.还可以把包放在上级的目录中,如: /src/myFolder/foo/bar1.go #package foo /src/myFolder/foo/bar2.go #package foo /src/myFolder/foo/bar3.go #pac

Java语言中String累的总结

String类 1.Java.lang包简介 java.lang包是java内置的一个基础包,其中包含了一系列程序中经常要用到的类: 在默认情况下,每个java程序都会自动导入该包,因此无需在程序中显式地声明. 2.String类 Java语言中,字符串是String类的对象: Java语言中,String是引用数据类型: 可以通过使用String类提供的方法来完成对字符串的操作: 创建一个字符串对象之后,将不能更改构成字符串的字符: 每当更改了字符串版本时,就创建了一个新的字符串对象,并在其内

C语言中,头文件和源文件的关系(转)

简单的说其实要理解C文件与头文件(即.h)有什么不同之处,首先需要弄明白编译器的工作过程,一般说来编译器会做以下几个过程: 1.预处理阶段 2.词法与语法分析阶段 3.编译阶段,首先编译成纯汇编语句,再将之汇编成跟CPU相关的二进制码,生成各个目标文件 (.obj文件)4.连接阶段,将各个目标文件中的各段代码进行绝对地址定位,生成跟特定平台相关的可执行文件,当然,最后还可以用objcopy生成纯二进制码,也就是去掉了文件格式信息.(生成.exe文件) 编译器在编译时是以C文件为单位进行的,也就是

C语言中,定义的含义?声明的含义?它们之间的区别是什么?

在C语言中,对于定义和声明,也许我们非常的熟悉,但不一定真正的了解! 定义的含义:所谓定义,就是创建(编译器)一个对象,为这个对象分配一块内存空间并取名,也就是我们平常所说的变量名或对象名,一旦这个名字和这块内存空间匹配,那么在定义的这个对象或变量的生命周期中,所创建的这个变量名将不能再被改变,并且内存空间的位置也不会改变.在一个区域内(函数内,全局),一个名字只能被定义一次,不能重复定义. 声明的含义:声明有两重含义 第一重含义:告诉编译器,这个名字已经匹配到了一块内存空间上,后面的代码所用到