VFS分析(一)挂载(持续更新)

基础知识在<深入linux内核架构>第8章,自行脑补.

看下几个关键的过程:

do_add_mount里有重要函数lock_mount, lock_mount函数的输入是struct path, 输出是struct mountpoint:

    struct path {
        struct vfsmount *mnt;
        struct dentry *dentry;
    };
    struct mountpoint {
        struct hlist_node m_hash;
        struct dentry *m_dentry;
        struct hlist_head m_list;
        int m_count;
    };
struct vfsmount {
    struct dentry *mnt_root;    /* root of the mounted tree */
    struct super_block *mnt_sb; /* pointer to superblock */
    int mnt_flags;
};

path 由 filename_lookup 得到, 其中vfsmount是当前文件系统的挂载信息, dentry是通过文件名得出的最后一级目录的dentry(比如,/mnt/dir1/dir2/,那么此时dentry对应的就是dir2的dentry.

函数: m_hash(struct vfsmount *mnt, struct dentry *dentry)

二元组<mnt, dentry>可以确定什么东西? 这个二元组可以唯一确定当前目录树中的一个目录[感觉直接用一个dentry也可以得到啊! 但是用两个参数可能散列效果更好?] ,这样可以直接得到一个下标(下标是mount_hashtable的下标). mount_hashtable是个什么事情?

这个就是函数m_hash的输出了:mount_hashtable[tmp & m_hash_mask].

我们发现,原来所有mount结构体都是通过链接元素mnt_hash链接到mount_hashtable[**]中去的,所以当我们发现了这个链表之后,就可以通过这个链表得到在这个开链上的所有的mount结构体!这里就得到了一个很重要的信息[所有的mount信息都在一个散列表mount_hashtable上维护]

这样我们就可以找到一个挂载点的所有的挂载信息了!

lookup_mnt还算是比较复杂的, 涉及到一个挂载点上挂载了多个"磁盘", lookup会找到最早的挂载的磁盘, 这个可以以后看, 现在我们只需要知道lookup_mnt发到了vfsmount结构体就可以了!

另一个函数:lookup_mountpoint(struct dentry *dentry), 这个函数在是通过dentry项, 找到全局数组&mountpoint_hashtable中的一个开链:mountpoint_hashtable[tmp & mp_hash_mask];

这里也得到一个很重要的信息:

[所有的mountpoing信息都是在一个全局的散列表mountpoint_hashtable上维护]

mountpoint 和 vfsmount有什么区别?

struct mountpoint {
    struct hlist_node m_hash;
    struct dentry *m_dentry;
    struct hlist_head m_list;
    int m_count;
};

mountoint只和dentry相关,

所以说lock_mount到最后就是得到一个mountpoint,

-------------------------

无关:

函数vfs_kern_mount(struct file_system_type *type, int flags,  const char *name, void *data)

首先根据文件名, 分配 mount 结构体, alloc_vfsmnt(name),

然后调用mount_fs函数得到fs相对根目录dentry,

根据dentry,初始化mount结构体, 然后根据返回mount结构提中的vfsmount成员.

--------------------------

attach_recursive_mnt是最终把这些散乱的东西链接在一起的函数

static int attach_recursive_mnt(struct mount *source_mnt,

                struct mount *dest_mnt, 

                struct mountpoint *dest_mp,

                struct path *parent_path)

各参数中, source_mnt当前新的挂载信息, dest_mnt是父挂载信息, dest_mp是挂载点的信息, parent_path是路径的信息

内核代码中这个函数头的注释我也是醉了, 好大一长串, (其中涉及到mount的属性:shared, private, slave, unbindable 等等), 之所以这么复杂, 是因为考虑到namespace的东西,这个也是将来要看的,看下docker到底是个神马东西!

===========

mount这一块确实有看头哈,看下到底怎么通过挂载点把资源给隔离开!

主要看函数:mnt_set_mountpoint (struct mount *mnt, struct mountpoint *mp, struct mount *child_mnt)

首先,mountpoint是怎么来的? mountpoint通过dentry而来, 上来之后,先把

mp->m_count++; 然后设置子mount 的 mnt_parent 为 父mount , 子mount的mnt_mountpoint点设置成mp->m_dentry, mountpoint中有一个串联所有mount信息的一个链叫做m_list, 这个链里面会把该mountpoint下面所有的mount链接在一起.

===========

3.6 commit_tree()

1.将当前文件系统的名字空间设置为父名字空间,父vfsmount通过当前vfsmount中的mnt_parent获取;再将其连接到父名字空间链表中。

2.将当前vfsmount加入到对应哈希值的冲突链表当中,哈希值通过hash()计算。其中,mnt_hash作为链表元素。

3.将当前vfsmount加入到父vfsmount对应的子文件系统链表mnt_mounts中。其中,mnt_child作为链表元素。

从整个挂载的处理流程上看,挂载的本质就是将源文件系统的vfsmount结构连接到目的文件系统对应的vfsmount结构中,即具体涉及到两个vfsmount中字段的指向问题。两个vfsmount具体父子等级关系,这也对应着内核中目录树的父子等级关系。

关键函数:commit_tree(struct mount *mnt, struct mount *shadows)

1 将子文件系统的命名空间设置成父命名空间, 父vfsmount通过当前vfsmount中的mnt_parent获取; 再将其联街道父命名空间列表中去.

2 将当前vfsmount加入到对应哈希值的冲突链表中去,

3 将当前vfsmount加入到父vfsmount对应的子文件系统链表mnt_mounts中去,

时间: 2024-08-19 08:16:32

VFS分析(一)挂载(持续更新)的相关文章

GNU GRUB 2.00 源码分析笔记,持续更新

前言 很多运维类书籍或文章仅从系统管理者的角度讲解了 grub 的安装以及使用, 本篇博文则从 gnu grub 2.00 的源码入手,从开发者,以及系统底层运行机制的角度,分析 grub 是如何作为跨平台的"全面统一的引导加载程序",来引导操作系统,加载 Linux 内核的过程等等, 部分内容参考了<深度探索 Linux 操作系统>一书中相关的内容(ISBN 978-7-11143901-1 )以及 gnu grub 项目官方站点的文档,并且加入自己分析源码时的笔记. (

为了解决mysqlbing翻译表字段问题而分析frm文件(持续更新)

出处:kelvin19840813 的博客 http://www.cnblogs.com/kelvin19840813/ 您的支持是对博主最大的鼓励,感谢您的认真阅读.本文版权归作者所有,欢迎转载,但请保留该声明. 很多人都知道mysqlbinlog 解释出来的binlog的 insert , update 是位置相反的 , 还有表字段都是@1 ... @数字 , 很恶心!!! 但没看到有人在 mysql8.0 功能需求时提问题出来 , 自己也没有提出来  唯有自己解释 frm 文件,获取表字段

android开源应用(主要是博客上带有分析的)收集 【持续更新】

2014.5.24更新: (android高仿系列)今日头条    http://blog.csdn.net/vipzjyno1/article/details/26514543 CSDN Android客户端的制作    http://blog.csdn.net/lmj623565791/article/details/26676137 LookAround开元之旅         http://blog.csdn.net/lancees/article/details/17696805 如果

各种投资产品的整理分析(持续更新)

各种投资产品的整理分析(持续更新) 1.指数基金 1.1.定义 指数基金是以特定指数(如沪深300指数.标普500指数.纳斯达克100指数.日经225指数等)为标的指数,并以该指数的成份股为投资对象,通过购买该指数的全部或部分成份股构建投资组合,以追踪标的指数表现的基金产品. 可以这么理解,指数基金紧贴所跟踪的指数(大盘)的走势,大盘涨它就涨,大盘跌它就跌. 1.2.和主动型管理基金作比较 指数基金是被动管理基金,但是从长远看,大部分指数基金能够跑赢主动管理基金.数据表明,很大一部分的主动管理基

自己总结的 iOS ,Mac 开源项目以及库,知识点------持续更新

自己在 git  上看到一个非常好的总结的东西,但是呢, fork  了几次,就是 fork  不到我的 git 上,干脆复制进去,但是,也是认真去每一个每一个去认真看了,并且也是补充了一些,感觉非常棒,所以好东西要分享,为啥用 CN 博客,有个好处,可以随时修改,可以持续更新,不用每次都要再发表,感觉这样棒棒的 我们 自己总结的iOS.mac开源项目及库,持续更新.... github排名 https://github.com/trending,github搜索:https://github.

Linux系统各发行版镜像下载(持续更新)

Linux系统各发行版镜像下载(持续更新) http://www.linuxidc.com/Linux/2007-09/7399.htm Linux系统各发行版镜像下载(2014年10月更新),如果直接下载不了,请使用迅雷下载.并且注意,我的下载地址,在  迅雷 里才起作用. 包括Ubuntu,Fedora,SUSE,Red Hat Enterprise Linux,CentOS等. 中国大陆开源镜像站汇总 1.企业贡献: 搜狐开源镜像站:http://mirrors.sohu.com/网易开源

android开发开源宝贝——持续更新。。。

2016年11月11日更新 http://www.apkbus.com/forum-417-1.html http://p.codekk.com/detail/Android/hejunlin2013/LivePlayback www.codekk.com https://github.com/Trinea/android-open-project Android 开源项目分类汇总 我们的微信公众号:codekk.二维码如下: 专注于 Android 开源分享.源码解析.框架设计.Android

C 语言的若干问题(持续更新中)

mnesia在频繁操作数据的过程可能会报错:** WARNING ** Mnesia is overloaded: {dump_log, write_threshold},可以看出,mnesia应该是过载了.这个警告在mnesia dump操作会发生这个问题,表类型为disc_only_copies .disc_copies都可能会发生. 如何重现这个问题,例子的场景是多个进程同时在不断地mnesia:dirty_write/2 mnesia过载分析 1.抛出警告是在mnesia 增加dump

干货!IT小伙伴们实用的网站及工具大集合!持续更新!

干货!IT小伙伴们实用的网站及工具大集合!持续更新! Other  崔庆才  4个月前 (12-24)  6720℃  7评论 1.Git 还在担心自己辛辛苦苦写的代码被误删了吗?还在担心自己改错了代码不能挽回吗?还在苦恼于多人开发合作找不到一个好的工具吗?那么用Git就对了,Git是一个开源的分布式版本控制系统,用以有效.高速的处理从很小到非常大的项目版本管理.有了它,代码托管不是问题,版本控制不再苦恼,多人开发变得简单易行. 链接:http://git-scm.com/ 2.GitHub 学