很多node入门的书里面都会在介绍node特性的时候说:单线程,异步式I/O,事件驱动。
Node不是一门语言,它是运行在服务器端的开发平台,官方指定语言为javascript。
阻塞和线程:
线程在执行中如果遇到磁盘读写或网络通信(统称为 I/O 操作),通常要耗费较长的时间,这时操作系统会剥夺这个线程的 CPU 控制权,使其暂停执行,全力执行这个I/O操作,同时将资源让给其他的工作线程,这种线程调度方式称为阻塞。当其他完成之后,系统再恢复它对cpu的控制权,继续执行,这就是同步I/O或者阻塞式I/O。
所以这个模式之下,一个线程只能处理一个任务,要么是计算操作,要么是I/O操作等等。每当有多的请求发过来的时候,必须多加线程用来响应。
同样的,在异步式或者非阻塞式,系统对所有的I/O操作部阻塞,而是将这个耗费时间和资源的操作报告给OS,就继续执行下一条语句。当OS执行完毕这个I/O操作之后,以事件的形式通知原来请求挂载I/O操作的线程,线程会在特定的时间处理这个事情。所以,必线程必须有事件循环,不断检查有没有未处理的事件。
所以这个模式下,cpu的核心利用率永远是100%,I/O以事件形式通知。
总结:多线程同步式I/O阻塞模式通过加开线程响应更多的请求,好处是在多核cpu的情况下利用更多的核。
单线程模式异步式I/O非阻塞式一个线程永远在执行计算操作,这个线程使得cpu的核心利用率为100%。通过功能划分利用多核CPU。
这不是殊途同归吗?node采用后者的原因是什么呢?
单线程的牛逼之处在于不用创建更多的线程,也就是可以节省掉创建线程所浪费的资源。理论依据是加开一个新线程是非常耗费资源的。
关于异步式I/O(磁盘读写或网络通信)和事件驱动:
Node维护一个事件队列。
普通方式查询数据库操作:
res=db.query(‘select * from *’);
res.output();
node解决方案:
db.query(‘select * from *’, function (res){
res.output();
});
上面用到回调函数。实现非阻塞的方式请求。
弊端:一个完整的逻辑拆分为一个个事件,增加开发调试的难度;解决方案在后面提及。
两个通过node读取文件的例子fs.readFile api(异步式(回调函数来实现)和同步式):
var fs = require(‘fs‘);
fs.readFile(‘file.txt‘, ‘utf-8‘, function(err, data) {
if (err) {
console.error(err);
} else {
console.log(data);
}
});
console.log(‘end.‘);
var fs = require(‘fs‘);
var data = fs.readFileSync(‘file.txt‘, ‘utf-8‘);
console.log(data);
console.log(‘end.‘);
两者输出数据的顺序不同。但是功能上没有什么区别。
关于模块:
node提供了exports和require两个对象。exports是模块公开的接口,require是用于获取这个模块的接口。
实例:
创建两个文件,一个当做外面的模块进行加载module.js,另一个是程序的入口文件getmodule.js.
module.js:
var name;
exports.setname=function(name){
name=name;
};
exports.sayhello(){
console.log(‘hello’+name);
};
getmodule.js:
var test=require(‘./module.js’);
test.setname(‘zhou’);
test.sayhello();
node getmodule.js
hellozhou
这就实现了接口的封装。module.js通过exports对象吧两个函数作为间接接口,在getmodule.js中通过require加载一个模块,之后就可以直接访问module中的exports对象的成员函数。
创建包:
包是模块基础上更深一步的抽象。
下面,可以将一个文件夹somepckage封装成一个模块。这个文件里里面要有一个index.js的文件,像module.js一样。然后在getmodule.js的文件里面,可以直接用var a=require(./package);
之后就可以通过a.xxxx来访问index.js里面的函数了。亲测可行。
题外话:关于全局安装依赖包和选择目录安装依赖包的优缺点。
全局的好处是可以提高程序重复利用的程度。避免同样的内容存在于多个副本。坏处是难以处理不同的版本依赖。
本地的好处是不会有不同程序依赖不同版本包的问题。同时减轻了包作者的API兼容性压力,但是缺陷是要一个个安装,非常繁琐。
node有全局和本地两种方式选择。
我们选择全局安装的理由有:本地安装不会注册path环境变量。例如在一个工程下安装的supervisor不会再另一个工程中发挥作用。
但是,使用全局安装下的包不可以通过require访问,这是一个悲伤的事。本地安装的可以通过require访问,但是不注册path环境变量;全局安装的不可以通过require访问,但是注册path环境变量。
总而言之,当我们要把某个包作为工程运行时的一部分时,通过本地模式获取,如果要
在命令行下使用,则使用全局模式安装。
还有就是怎样发布自己的npm包供全世界的人使用。
下面介绍node的核心模块。(全局变量,常用工具,事件机制,文件系统,http服务器和客户端)
全局变量
全局对象:可以在程序的任何部分访问的对象就是全局变量,类似于上面所说的全局安装。增加了path环境变量。
全局对象及其所有的属性就是全局变量,可以任意访问。
在浏览器javascript中,window就是全局变量,我们可以在任何地方使用window.open……
node中,全局对象是global。所有全局变量,都是global的属性。包括console,process等。
process:(全局变量,global的一个属性)
作用:用于描述当前node进程的对象,提供了一个与操作系统的简单接口。
process.argv:命令行参数数组,可以返回命令行的参数为一个数组,数组第一个元素为node,第二个为文件目录,以后为运行参数;
process.stdout:标准输出流,process.stdout.write()比console.log();更加接近底层;
process.stdin:标准输入流;
process.nextTick(callback):为事件循环设置一项任务,node会在下次事件循环相应的时候调用callback。比setTimeout(fn,0)更加高效。
console:用于提供控制台标准输出
console.log():
console.log (‘Hello world‘);
console.log(‘byvoid%diovyb‘);
console.log(‘byvoid%diovyb‘, 1991);
输出:
Hello world
byvoid%diovyb
byvoid1991iovyb
console.error():向标准的错误流输出
console.trace():向标准错误流输出当前的调用栈。
常用工具
var util = require(‘util‘);
util.inherits
util.inherits(constructor, superConstructor)是一个实现对象间原型继承的函数。
util.inherits(Sub, Base);
sub继承自base;
util.inspect
util.inspect(object,[showHidden],[depth],[colors])是一个将任意对象转换为字符串的方法,通常用于调试和错误输出。它至少接受一个参数 object,即要转换的对象。
depth:最大递归层数,默认两层,null不限次数直到遍历完成。
事件驱动模块events
events是node最重要的模块。被几乎所有的模块依赖。
事件发射器
events模块只提供了一个对象:events.EventEmitter。核心就是事件发射与事件监听器的封装。
var events = require(‘events‘);
var emitter = new events.EventEmitter();
相关API:
emitter.on(event,listener):为enent事件注册一个监听器,接受字符串event和一个回调函数listener;
emitter.emit(event,[arg1],[arg2],[arg3],[arg4]):发射event事件,传递若干可选参数到事件监听器的参数表;emitter.emit(‘error‘);当 error 被发射时,EventEmitter 规定如果没有响应的监听器,Node.js 会把它当作异常,退出程序并打印调用栈。
EventEmitter.once(event, listener) 为指定事件注册一个单次监听器,即监听器最多只会触发一次,触发后立刻解除该监听器。
EventEmitter.removeListener(event, listener) 移除指定事件的某个监听器,listener 必须是该事件已经注册过的监听器。
EventEmitter.removeAllListeners([event]) 移除所有事件的所有监听器,如果指定 event,则移除指定事件的所有监听器。
相当抽象,来个例子好了:
var events = require(‘events‘);
var emitter = new events.EventEmitter();
emitter.on(‘someEvent‘, function(arg1, arg2) {//为someEvent事件注册了一个监听器——一个匿名回调函数。
console.log(‘listener1‘, arg1, arg2);
});
emitter.on(‘someEvent‘, function(arg1, arg2) {/为someEvent事件又注册了一个监听器——一个匿名回调函数。
console.log(‘listener2‘, arg1, arg2);
});
emitter.emit(‘someEvent‘, ‘byvoid‘, 1991);//发射enent事件,传递两个参数到事件监听器的参数表
结果:
listener1 byvoid 1991
listener2 byvoid 1991
总结:emitter使用.on为someEvent事件注册了两个事件监听器,然后使用.enit发射事件someEvent,并传递两个参数给事件监听器。于是这两个事件监听器回调函数先后被调用。
文件操作模块(fs):
node给文件操作同时提供了异步和同步的两种方式。
异步方式:
fs.readFile(filename,[encoding],[callback(err,data)])
文件名,编码方式(缺省为二进制),回调函数。data为文件内容。
var fs = require(‘fs‘);
fs.readFile(‘content.txt‘, function(err, data) {
if (err) {
console.error(err);
} else {
console.log(data);
}
});
输出(假设源文件是utf-8编码):
<Buffer 54 65 78 74 20 e6 96 87 e6 9c ac e6 96 87 e4 bb b6 e7 a4 ba e4 be 8b>
指定编码方式:
var fs = require(‘fs‘);
fs.readFile(‘content.txt‘, ‘utf-8‘, function(err, data) {
if (err) {
console.error(err);//如果运行出错,err将是Error的对象。
} else {
console.log(data);
}
});
输出:
Text 文本文件示例
关于回调函数的补充:
Node.js 的异步编程接口习惯是以函数的最后一个参数为回调函数,通常一个函数只有一个回调函数。回调函数是实际参数中第一个是 err,其余的参数是其他返回的内容。如果没有发生错误,err 的值会是 null 或undefined。如果有错误发生,err 通常是 Error 对象的实例。
同步方式:
fs.readFileSync(filename,
[encoding])。
fs.open
fs.open(path,
flags, [mode], [callback(err, fd)])
路径,flag是确认文件的打开方式(读写,只读只写,创建与否),mode默认0666,回调函数传回一个文件描述符fd。
fs.read
fs.read(fd,
buffer, offset, length, position, [callback(err, bytesRead,buffer)])
比fs.readFile 提供了更底层的接口。
(文件描述符,写入buffer指向,buffer写入偏移量,读取字节数,读取起始位置,回调函数传递两个参数——字节数和缓冲区对象)
参考资料:《node.js开发指南》
(未完待续,欢迎指出错误)