当前位置:Gxlcms > JavaScript > 详解nodejs 文本操作模块-fs模块(二)

详解nodejs 文本操作模块-fs模块(二)

时间:2021-07-01 10:21:17 帮助过:3人阅读

前一篇学习了文件的打开和关闭,文件操作总不能只包含打开和关闭吧,这里就开始文件的读写操作。

fs模块方法

1:read和readSync方法

该方法,是从文件的指定位置处读取文件,一直读取到文件底部,然后江都区到的内容输出到一个缓存区,使用方法如下:

fs.read(fd,buffer,offset,length,position,callback); 

在read方法中,支持6个参数:

  • fd参数,是文件描述符,是open方法的回调函数中获取到的,是一个数字。
  • buffer,是一个buffer对象,用于指定将文件数据读取到那个缓存区,如果不定义,则会生成一个新的缓存区,进行存放新读取到的数据。
  • offset,是一个整数值,用于指定向缓存区中写入数据时的开始位置,以字节为单位。其实也就是,读入到缓存中的数据,从buffer对象的第几个元素开始写入。
  • length,是一个整数值,表示读入的数据,多少数据写入到buffer对象中去,要保证不能超出buffer的容纳范围,否则会抛出一个范围异常。
  • position,是一个整数值,表示,从文件中的哪个位置,开始读取数据,如果设置为非0的整数,则从该整数所示的位置,读取长度为length的数据到buffer对象中。
  • callback,回调函数,当读取文件成功之后,把执行该函数,该回调函数支持三个参数:
function (err,bytesRead,buffer){ 
 //err为读取文件操作失败时,触发的错误对象 
 //bytesRead为读取到的字节数,如果文件的比较大,则该值就是length的值, 
 //如果文件的大小比length小,则该值为实际中读取到的字节数。 
 //buffer为读取到的内容,保存到了该缓存区,如果在使用read时, 
 //传入了buffer对象,则此处的buffer就是传入的buffer对象。 
 //如果在read时没有传入buffer,则此处的buffer为新创建的buffer对象 
} 

上面把参数的含义以及回调函数的定义,都说明了一下,这里就看一个示例吧:

var fs = require("fs"); 
 
fs.open("fs.txt","r",function(err,fd){ 
 //读取fs.text,文件的内容为“123456789”,长度为9 
 var buffer = new Buffer([0,0,0,0,0,0,0,0,0,0]); 
 //创建一个长度为10,初始值为0的buffer对象。 
 //数据比较少,就直接写了,否则还是使用fill方法吧。 
 console.log(buffer); 
 //<Buffer 00 00 00 00 00 00 00 00 00 00> 
 //初始时的buffer对象 
  
 fs.read(fd,buffer,4,6,4,function(err,bytesRead,buffer1){ 
  //读取到的数据,从buffer对象的第5个元素开始保存,保存6个字节的元素 
  //读取文件,是从文件的第5个字节开始,因为文件中内容长度为9, 
  //那么,读取到的内容就是56789,所以buffer的最后一位仍然为初始值。 
  //由于想要读取的字节长度为6,但是文件内容过短,只读取了5个字节的有效数据 
  //就到了文件的结尾了,所以,bytesRead的值不是6,而是5。 
  //而buffer对象,为被写入新数据之后的对象。 
  console.log(bytesRead); //5 
    console.log(buffer1);  
  //<Buffer 00 00 00 00 35 36 37 38 39 00> 
    console.log(buffer); 
  //<Buffer 00 00 00 00 35 36 37 38 39 00> 
  //它们俩是完全相同的。其实质是,它们俩占据的内存也是相同的, 
  //它们就是同一个缓存区。 
 }); 
}); 

一般情况下,异步调用时,回调函数中,只有两个参数存在,第一个参数为err对象,第二个参数为操作之后的数据,可是,这里有三个数据,那么在同步时,什么才是返回值呢?

所以,要做如下的测试:

var fs = require("fs"); 
 
fs.open("fs.txt","r",function(err,fd){ 
 //读取fs.text,文件的内容为“123456789”,长度为9 
 var buffer = new Buffer([0,0,0,0,0,0,0,0,0,0]); 
  
 var bytesRead = fs.readSync(fd,buffer,4,6,4); 
 console.log(bytesRead); 
}); 

返回的是bytesRead的值,并没有返回buffer对象,可以想象,因为buffer对象是原本传入的buffer对象,依然可以通过传入的buffer对象,直接访问到重写数据之后的buffer对象。

但是,有个问题就来了,如果没有传入buffer对象呢?这又要如何呢?这个问题暂且别过,因为这个问题,并没有在一些API文档中说明,在书中也没有看到这个用法,但是接下来,我们去分析一下源码,就能发现,除了上述的两种常用的方法之外,还有其他的使用方式。

OK,先看下read方法的源码:

fs.read = function(fd, buffer, offset, length, position, callback) { 
 if (!util.isBuffer(buffer)) { 
 //如果传入的第二个参数不是一个buffer对象,则做一些自适应的处理 
 // legacy string interface (fd, length, position, encoding, callback) 
 var cb = arguments[4], 
  encoding = arguments[3]; 
 //本来read方法是有6个参数的,当buffer没有传入的时候, 
 //则相应的offset也变得没有意义,所以变为了4个参数。 
 //而这个时候,参数的形式就变成了前面英文部分的样子。5个参数,加入了encoding参数。 
  
 assertEncoding(encoding); 
 //判断传入的encoding是否是当前支持的编码方式 
 //如果不是,则抛出异常 
 
 position = arguments[2]; 
 length = arguments[1]; 
 buffer = new Buffer(length); 
 offset = 0; 
 //设置对应的值,新建buffer对象 
 
 //把callback做一个代理,根据传入的编码方式,把结果按照指定的编码,传入回调函数 
 callback = function(err, bytesRead) { 
  if (!cb) return; 
  //如果回调函数不存在,则直接退出 
  
  var str = (bytesRead > 0) ? buffer.toString(encoding, 0, bytesRead) : ''; 
 
  //注意,当读取文件成功后,执行了wrapper的回调,从wrapper中, 
  //执行到该callback回调时,并没有传入buffer对象, 
  //并且,调用read中的回调的三个参数是:err,str(按照指定编码之后的字符串), 
  //bytesRead(读取字节数),并没有buffer对象传入 
  (cb)(err, str, bytesRead); 
 }; 
 } 
 
 function wrapper(err, bytesRead) { 
 // Retain a reference to buffer so that it can't be GC'ed too soon. 
 // 由这里可以看出,在C++读取文件时,回调函数只有两个值 
 //err对象和真实读取的字节数,至于buffer对象,则是nodejs代理之后 
 //给添加上的 
 callback && callback(err, bytesRead || 0, buffer); 
 } 
 
 //创建一个实例,定义oncomplete属性 
 //该实例,按照猜测,应该是分段读取文件的一个对象 
 //当读取文件完成之后,会执行oncomplete方法 
 var req = new FSReqWrap(); 
 req.oncomplete = wrapper; 
 
 //调用C++的接口,开始读取文件 
 binding.read(fd, buffer, offset, length, position, req); 
}; 

看了上面的源码分析,那么也就发现了另外一种使用read的方法了,即,不输入buffer和offset,添加encoding的5个参数的使用,举一个最简单的实例吧。

var fs = require("fs"); 
 
fs.open("fs.txt","r",function(err,fd){ 
 //读取fs.text,文件的内容为“123456789”,长度为9 
 var buf1 = new Buffer([0,0,0,0,0,0,0,0,0,0]); 
  
 fs.read(fd,6,4,null,function(err,str,bytesRead){ 
  console.log(err); 
  //null 
  console.log("str="+str); 
  //str=56789 
  console.log("bytesRead="+bytesRead); 
  //bytesRead=5 
 }); 
  
}); 

注意,当不传入buffer对象时,回调函数中的三个参数也相应的有了变化,详情请看前面的实例代码中,回调函数的参数以及源码中的注释。

继续看下readSync的源码,在本文的前面,也给出了一个readSync的示例,当传入buffer对象时,返回值是读取到真是字节数,那么,既然read方法可以省略buffer对象,改为返回读取到的字符串,那么readSync方法呢?这个就让我们看下源码中,是如何处理这些数据的。

fs.readSync = function(fd, buffer, offset, length, position) { 
 var legacy = false; 
 if (!util.isBuffer(buffer)) { 
 // legacy string interface (fd, length, position, encoding, callback) 
 //该部分的处理,和read方法内部,完全相同,不再注释。 
 //唯一区别,legacy标识符,标志是否传入了buffer,为false时,表示传入了 
 legacy = true; 
 var encoding = arguments[3]; 
 
 assertEncoding(encoding); 
 
 position = arguments[2]; 
 length = arguments[1]; 
 buffer = new Buffer(length); 
 
 offset = 0; 
 } 
 
 //C++的read方法,如果传入了第六个参数,则属于读取成功之后,执行的回调相关的对象 
 //如果不传入,则返回值为读取到的真是字节数,该数小于等于length 
 var r = binding.read(fd, buffer, offset, length, position); 
 if (!legacy) { 
 //如果,传入了buffer对象,则直接返回读取到的真是字节数 
 return r; 
 } 
 
 var str = (r > 0) ? buffer.toString(encoding, 0, r) : ''; 
 //如果没有传入buffer对象,那么返回一个数组,该数组包含两个元素, 
 //字符串和读取到的字节数 
 return [str, r]; 
}; 

那么接下来看下,如果不传入buffer对象时的一个示例吧:

var fs = require("fs"); 
 
fs.open("fs.txt","r",function(err,fd){ 
 //读取fs.text,文件的内容为“123456789”,长度为9 
 var buf1 = new Buffer([0,0,0,0,0,0,0,0,0,0]); 
  
 var arr = fs.readSync(fd,6,4,null); 
 console.log(arr); 
 //["56789",5] 
}); 

OK,到这里,关于read和readSync方法的使用及一些原理性东西,也基本说完了。

2:write和writeSync方法

有读取的方法,那么就必然有写入的方法了,要么flag=w不就无用了么。并且看到了前面的关于read的一些使用,那么接下来,对于write的使用,看起来就变得更加的简单了,现在直接看下示例:

var fs = require("fs"); 
 
fs.open("fs.txt","a+",function(err,fd){ 
 //读取fs.text,文件的内容为“123456789”,长度为9 
 var buf1 = new Buffer("我喜爱Nodejs"); 
 console.log(buf1); 
 //显示buf1的buffer数据 
 //计算buf1的长度,把该数据全部写入到fs.txt文件中 
 fs.write(fd,buf1,0,buf1.length,0,function(err,len,buf){ 
  console.log("len="+len); 
  //写入的长度 
   
  //写入的buf,其实和buf1完全相等 
  console.log(buf); 
  fs.read(fd,len,9,"utf8",function(err,str,len2){ 
   console.log("len2="+len2); 
   //读取从9开始的数据 
   console.log("str="+str); 
   //读取相应得到的字符串 
   //我喜爱Nodejs 
  }); 
 }); 
}); 

从上面这个示例可以看出,write方法和read方法,使用基本是完全一样的,只是一个是在读取文件一个是在写入文件,前提也是需要你在open打开文件时,使用的flag打开文件方式,要支持读写才行。

既然,write和read是相同的使用方法,那么也可以不定义buffer的直接写入数据,所以,可以继续看下面的这个示例:

var fs = require("fs"); 
 
fs.open("fs.txt","a+",function(err,fd){ 
 //读取fs.text,文件的内容为“123456789”,长度为9 
  
 //复杂的写法,和简单的写法,就看个人喜好了,0代表的是字符串的开始位置 
 //fs.write(fd,"我喜爱Nodejs",0,"utf8",function(err,len,str) 
 fs.write(fd,"我喜爱Nodejs",function(err,len,str){ 
  console.log("len="+len); //len=15 
  //写入的长度 
   
  //当直接写入字符串时,返回的也不再是buffer对象,而是字符串 
  console.log("str="+str); //我喜爱Nodejs 
  fs.read(fd,len,9,"utf8",function(err,str,len2){ 
   console.log("len2="+len2); //len2=15 
   //读取从9开始的数据 
   console.log("str="+str); 
   //读取相应得到的字符串 
   //我喜爱Nodejs 
  }); 
 }); 
}); 

这里就不再分析源码了,基本上write的源码和read的源码处理方式类似,只是在最后调用C++接口不同而已,所以这里也就不再占用空间了。有兴趣的可以直接去nodejs的github源码中,查看:fs.js。

关于writeSync的用法,用法和write是相同的,只是不需要回调函数,并且也不需要返回写入的数据,所以,和readSync的区别,也就是,readSync在不传入buffer时,会返回一个长度为2的数组,而writeSync不受buffer对象的影响,只要写入成功,就会返回写入的真实字节数。
不加示例,不加源码分析,请参考上面的read方法,readSync方法和write方法,也可以参考nodejs的API文档:Nodejs的API中文版。

总结

本篇的read和write是文档操作的基础,是属于最基本的操作,也是最重要的操作,本篇也是属于fs模块中的基本使用方法,对于以后学习其他方法,以及更好的了解fs模块有重要的作用,好好学习,天天向上。

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持脚本之家。

人气教程排行