java中的mmap实现--转

    • 什么是mmap
    • mmap对于c程序员很熟悉,对于java程序员有点陌生。简而言之,将文件直接映射到用户态的内存地址,这样对文件的操作不再是write/read,而是直接对内存地址的操作。

      在c中提供了三个函数来实现
      [list]
  • mmap 进行映射
  • munmap 取消映射
  • msync 进程在映射空间的对共享内容的改变并不直接写回到磁盘文件中,往往在调用munmap()后才执行该操作。

具体参照http://blog.chinaunix.net/uid-24517893-id-164217.html

  • java中的map

java中的FileChannel,提供了map和force方法,map创建文件和内存的映射,

Java代码  

  1. MappedByteBuffer buffer = fc.map(MapMode.READ_WRITE, 0, 1000);

返回一个MappedByteBuffer,这是一个DirectBuffer,其中包含一个内存地址,然后可用就做一些读写操作。 
    还有另外一个方法是force,是将内存的更新的内容刷到磁盘中。 
    在这里抛出一个问题,force是必须调用的,如果不调用force会怎样。 
    我试着写了一段小程序来试验

Java代码  

  1. MappedByteBuffer buffer = fc.map(MapMode.READ_WRITE, 0, 1000);
  2. for (int i = 0;i< 100000;i++){
  3. buffer.put((byte)65);
  4. }
  5. System.out.println("write completed!");
  6. System.in.read();

然后观察文件发现文件中是有1000个B的,那么就是说不调用force,内容也会落到磁盘中的。既然不用force内容也可以落到磁盘中,那force的作用什么呢?带着这个问题我查看了openJdk的force和map的实现和linux中mmap的实现。

  • JDK的force和map的实现

通过FileChannel->FileChannelImpl的native知道,对linux平台调用应该在D:\git\openjdk\jdk\src\solaris\native\sun\nio\ch下的FileChannelImpl.c

Java代码  

  1. NIEXPORT jlong JNICALL
  2. Java_sun_nio_ch_FileChannelImpl_map0(JNIEnv *env, jobject this,
  3. jint prot, jlong off, jlong len)
  4. mapAddress = mmap64(
  5. 0,                    /* Let OS decide location */
  6. len,                  /* Number of bytes to map */
  7. protections,          /* File permissions */
  8. flags,                /* Changes are shared */
  9. fd,                   /* File descriptor of mapped file */
  10. off);                 /* Offset into file */

Java代码  

  1. JNIEXPORT jint JNICALL
  2. Java_sun_nio_ch_FileChannelImpl_force0(JNIEnv *env, jobject this,
  3. jobject fdo, jboolean md)
  4. {
  5. jint fd = fdval(env, fdo);
  6. int result = 0;
  7. if (md == JNI_FALSE) {
  8. result = fdatasync(fd);
  9. } else {
  10. result = fsync(fd);
  11. }
  12. return handle(env, result, "Force failed");
  13. }

原来force是调用的fdatasync(fsync),这不是linux中buffered IO,write(2)以后需要调用的方法吗,难道mmap也是走的BufferdIO那一套,首先写到page cache,然后由pdflush定时刷到磁盘中,那这么说mmap只是在进程空间分配一个内存地址,真实的内存还是使用的pagecache。所以force是调用fsync将dirty page刷到磁盘中,但mmap还有共享之类的实现起来应该很复杂。

  • 验证

为了验证上面的假设,我做了一个实验。在linux下起两个终端,A终端通过上面的程序向a.txt写入数据,B终端使用tailf a.txt观察数据的写入。奇怪的是A终端执行完,B终端立马就成看到数据,而不是等30s以后pdflush刷到磁盘以后才能看到,难道前面的假设错了?或者另一种可能tailf查看到也是在page cache中读取的。那只需查看下文件的page是不是dirty就知道了。

Java代码  

  1. cat /proc/$(pidof java)/smaps|grep a.txt -A 10 -B 10

就可以查看一个文件的page是否是dirty。 
重新实现使用如上脚本观察

Java代码  

  1. 2aaab30c4000-2aaab31b9000 rw-s 00000000 fd:00 81887299                   /opt/zhanghailei/a.txt
  2. Size:               980 kB
  3. Rss:                980 kB
  4. Shared_Clean:         0 kB
  5. Shared_Dirty:         0 kB
  6. Private_Clean:        0 kB
  7. Private_Dirty:      980 kB
  8. Swap:                 0 kB
  9. Pss:                980 kB

果然是dirty的,然后继续等待一段时间再次执行发现已经是clean,被刷到磁盘中。

Java代码  

  1. 2aaab30c4000-2aaab31b9000 rw-s 00000000 fd:00 81887299                   /opt/zhanghailei/a.txt
  2. Size:               980 kB
  3. Rss:                980 kB
  4. Shared_Clean:         0 kB
  5. Shared_Dirty:         0 kB
  6. Private_Clean:      980 kB
  7. Private_Dirty:        0 kB
  8. Swap:                 0 kB
  9. Pss:                980 kB
  • 结论

1. mmap,底层还是走的BufferedIO,好处大概是减少了内核态和用户态的内存拷贝,这点不太确定,对内核不熟。 
2. force,参数为true调用fsync,false调用fdatasync,fdatasync只刷数据不刷meta数据 
3. 即使不调用force,内核也会定期将dirty page刷到磁盘,默认是30s。

原文来自:http://xiaoz5919.iteye.com/blog/2093323

java中的mmap实现--转

时间: 2024-11-07 15:00:31

java中的mmap实现--转的相关文章

java中的三元运算符详解

最近在带领实习生中遇到很多新手问与三元运算符有关的java题目,多数为代码结果题,少数为应用题.鉴于很多资料上对于java三元运算的讲解过于简单,网上的资料与题目也不是很完善,对于结果答案分析不一,故在此总结,当然仅为个人观点,水平有限,不足之处,还请大家多多指出,互相交流学习. 什么是java三元运算符呢?无疑其操作元有三个,第一个是条件表达式,剩余两个为值,条件表达式为真时运算取第一个值,为假时取第二个值. 其示例代码如下:boolean a = 20 < 45 ? true : false

java中BigDecimal的学习

干着java的活,但是看的都是一些偏底层的东西(或者我根本就没有看),有点荒废了java的学习. 最近一直在用到一个类是BigDecimal,但都是模棱两可地在那儿用,并没有深入研究这个类的细节,感觉不能再拖了. BigDecimal,从名字来看就是进行大数运算的,不光这样,还广泛用于小数的精确运算. 当你接触到和钱有关的计算的时候,这个类还是很有用滴. 先来看一个例子 1 package com.tuhooo.bigdecimal; 2 3 /** 4 * Created by tuhooo

Java 中几个重要的关键字

Java中的关键字特别多,大致如下: 访问控制 private protected public 类,方法和变量修饰符 abstract class extends final implements interface native new static strictfp synchronized transient volatile 程序控制 break continue return do while if else for instanceof switch case default 异常

深入剖析Java中的装箱和拆箱

阅读目录 一.什么是装箱?什么是拆箱?二.装箱和拆箱是如何实现的三.面试中相关的问题 自动装箱和拆箱问题是Java中一个老生常谈的问题了,今天我们就来一些看一下装箱和拆箱中的若干问题.本文先讲述装箱和拆箱最基本的东西,再来看一下面试笔试中经常遇到的与装箱.拆箱相关的问题. 回到顶部 一.什么是装箱?什么是拆箱? 我们知道 Java为每种基本数据类型都提供了对应的包装器类型,至于为什么会为每种基本数据类型提供包装器类型在此不进行阐述,有兴趣的朋友可以查阅相关资料.在Java SE5之前,如果要生成

JAVA中只有值传递

今天,我在一本面试书上看到了关于java的一个参数传递的问题: 写道 java中对象作为参数传递给一个方法,到底是值传递,还是引用传递? 我毫无疑问的回答:"引用传递!",并且还觉得自己对java的这一特性很是熟悉! 结果发现,我错了! 答案是: 值传递!Java中只有按值传递,没有按引用传递! 回家后我就迫不及待地查询了这个问题,觉得自己对java这么基础的问题都搞错实在太丢人! 综合网上的描述,我大概了解了是怎么回事,现在整理如下,如有不对之处望大神提出! 先来看一个作为程序员都熟

Java中如何优雅正确的终止线程

Java中终止线程的方式主要有三种: 1.使用stop()方法,已被弃用.原因是:stop()是立即终止,会导致一些数据被到处理一部分就会被终止,而用户并不知道哪些数据被处理,哪些没有被处理,产生了不完整的"残疾"数据,不符合完整性,所以被废弃.So, forget it! 2.使用volatile标志位 看一个简单的例子: 首先,实现一个Runnable接口,在其中定义volatile标志位,在run()方法中使用标志位控制程序运行 public class MyRunnable i

Java中I/O流之数据流

Java 中的数据流: 对于某问题:将一个 long 类型的数据写到文件中,有办法吗?    转字符串 → 通过 getbytes() 写进去,费劲,而且在此过程中 long 类型的数需要不断地转换. 现在,Java 中的数据流能够很好的解决这个问题(不需要转换,直接写进去) 1. DataInputStream 与 DataOutputStream 分别继承自 InputStream.OutputStream, 它属于处理流,需要分别套接在 InputStream.OutputStream 类

java中Random随机种子使用

在java中,通过Random生成随机数时,如果设置随机种子,则相同的种子,产生的随机数相同.若不设置则每次随机的不同. Random rnd = new Random(); rnd.setSeed(10);//用于设置种子. rnd.nextInt();// 用于产生随机数. rnd.nextInt(10); // 产生(0-9)数字.

java中的反射机制和javaBean

反射 反射:就是通过一个类加载进方法区时加载到栈内存中的Class字节码文件对这个类进行解剖 通过反射可以获取到一个类的构造方法,成员方法,成员变量 反射将一个类的各个部分映射成相应的类 反射获取构造方法 Class类中方法 Constructor<?>[] getConstructors() 返回当前字节码文件对象的所有public修饰的构造方法 Constructor<T> getConstructor(Class<?>...parameterTypes)返回指定了