想要了解Docker Volume,首先我们需要知道Docker的文件系统是如何工作的。Docker镜像是由多个文件系统(只读层)叠加而成。当我们启动一个容器的时候,Docker会加载只读镜像层并在其上(即镜像栈顶部)添加一个读写层。如果运行中的容器修改了现有的一个已经存在的文件,那该文件将会从读写层下面的只读层复制到读写层,该文件的只读版本仍然存在,只是已经被读写层中该文件的副本所隐藏。当删除Docker容器,并通过该镜像重新启动时,之前的更改将会丢失。在Docker中,只读层及在顶部的读写层的组合被称为Union File System(联合文件系统)。
为了能够保存(持久化)数据以及共享容器间的数据,Docker提出了Volume的概念。简单来说,Volume就是目录或者文件,它可以绕过默认的联合文件系统,而以正常的文件或者目录的形式存在于宿主机上。
总结:Volume可以将容器以及容器产生的数据分离开来,这样,当你使用docker rm my_container删除容器时,不会影响相关的数据。
我们可以通过两种方式来初始化Volume,这两种方式有些细小而又重要的差别。我们可以在运行时使用-v来声明Volume:
docker管理数据的方式有两种:
· 数据卷
· 数据卷容器
数据卷是为一个或多个容器专门指定绕过Union File System的目录,为持续性或共享数据提供一些有用的功能:
· 数据卷可以在容器间共享和重用
· 数据卷数据改变是直接修改的
· 数据卷数据改变不会被包括在容器中
· 数据卷是持续性的,直到没有容器使用它
数据卷的使用,类似于 Linux 下对目录进行 mount
挂载一个主机目录作为数据卷
你想在容器中使用主机上的某个目录,你可以通过-v参数来指定(注:注意冒号前面的和后面的内容):
docker run -v /host/path:/some/path ...
这明确地告诉Docker使用指定的主机路径来代替Docker自己创建的根路径并挂载到容器内指定的路径(以上例子为/some/path)。需要注意的是,如果主机上的路径不存在,目录将自动在给定的路径中创建。
在用 docker run 命令的时候,可以指定挂载一个本地主机的目录到容器中去,可以使用多次-v选项为一个 docker 容器运行挂载多个本地主机目录。
下面创建一个 web 容器,并加载一个宿主机目录到容器的 /var/www/html/目录
在宿主机上创建/web/webapp1目录,并创建一个index.html文件,内容如下:
[[email protected] ~]# mkdir -p /web/webapp1 [[email protected] ~]# vim /web/webapp1/index.html
<html>
<title> du yu heng </title>
<body>
<h1> huanying duyuheng xian sheng </h1>
</body >
</html>
查看镜像:
[[email protected] ~]# docker images
REPOSITORY TAG IMAGE ID CREATED SIZE
centos http 3266e843418b 3 days ago 298.6 MB
docker.nmgkj.com latest 3266e843418b 3 days ago 298.6 MB
docker.io/centos centos6 cf2c3ece5e41 13 months ago 194.6 MB
使用镜像创建容器:
[[email protected] ~]# docker run -dit -p 80:80 -p 10122:22 -v /web/webapp1/:/var/www/html/ docker.nmgkj.com
a07b2b866c12e41dac29b32e7177d56d806be5119cd200518cde3790e7008c30
[[email protected] ~]# docker ps
CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES
a07b2b866c12 docker.nmgkj.com "/bin/bash /run.sh" 12 seconds ago Up 5 seconds 0.0.0.0:80->80/tcp, 0.0.0.0:10122->22/tcp nauseous_yonath
上面的命令加载主机的 /web/webapp1 目录到容器的 /var/www/html 目录。这个功能在进行测试的时候十分方便,
比如用户可以放置一些程序到本地目录中,来查看容器是否正常工作。本地目录的路径必须是绝对路径,如果目录不存在 Docker 会自动为你创建它。
/web/webapp1目录的文件都将会出现在容器内。这对于在主机和容器之间共享文件是非常有帮助的,例如挂载需要编译的源代码。为了保证可移植性(并不是所有的系统的主机目录都是可以用的),挂载主机目录不需要从Dockerfile指定。
挂载的目录可以通过docker inspect 容器ID
[[email protected] ~]# docker inspect a07b2b866c12
查看主要内容
"Mounts": [
{
"Source": "/web/webapp1",
"Destination": "/var/www/html",
"Mode": "",
"RW": true,
"Propagation": "rprivate"
}
进入容器内查看
[[email protected] ~]# docker exec -it a07b2b866c12 /bin/bash [[email protected] /]# cat /var/www/html/index.html
<html>
<title> du yu heng </title>
<body>
<h1> huanying duyuheng xian sheng </h1>
</body >
</html>
在浏览器中,输入宿主IP和端口号,即可访问测试页
-v选项除了可以挂载当前主机的一个目录到容器中也可以添加一个或多个数据卷
创建一个数据卷
Volume可以使用以下两种方式创建:
1.在Dockerfile中指定VOLUME /some/dir
2.执行docker run -v /some/dir命令来指定
无论哪种方式都是做了同样的事情。它们告诉Docker在主机上创建一个目录(默认情况下是在/var/lib/docker/volumes下),然后将其挂载到指定的路径(例子中是:/some/dir)。当删除使用该Volume的容器时,Volume本身不会受到影响,它可以一直存在下去。
如果在容器中不存在指定的路径,那么该目录将会被自动创建。
创建数据卷绑定到到新建容器,新建容器中会创建 /data 数据卷
[[email protected] ~]# docker run -dit -v /data docker.nmgkj.com
0284f2e276445e5000ed2058fbedc3160bb599aedf2de40d841981c32033ed40
[[email protected] ~]# docker ps
CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES
0284f2e27644 docker.nmgkj.com "/bin/bash /run.sh" 55 seconds ago Up 52 seconds 22/tcp, 80/tcp suspicious_turing
注意:也可以在 dockerfile 中使用 volume 来添加一个或者多个新的卷到由该 image 创建的任意容器,例如:
FROM debian:wheezy
VOLUME /data
进入容器,查看给容器添加的数据卷
[[email protected] ~]# docker exec -it 0284f2e27644 /bin/bash [[email protected] /]# df -hT
Filesystem Type Size Used Avail Use% Mounted on
rootfs rootfs 10G 318M 9.7G 4% /
/dev/mapper/docker-253:0-135547753-2cc3d998758089ddd7e770b41208c01cc8a83da571bdd40bda8de17f084ed493
xfs 10G 318M 9.7G 4% /
tmpfs tmpfs 917M 0 917M 0% /dev
tmpfs tmpfs 917M 0 917M 0% /sys/fs/cgroup
/dev/mapper/centos-root
xfs 50G 6.5G 44G 13% /data
/dev/mapper/centos-root
创建的数据卷可以通过docker inspect获取宿主机对应路径
[[email protected] ~]# docker inspect 0284f2e27644
查看主要内容
"Mounts": [
{
"Name": "f4e6492eec68a33a7c77413bad6e79158a2488f38ad9df34f19c6732a153321d",
"Source": "/var/lib/docker/volumes/f4e6492eec68a33a7c77413bad6e79158a2488f38ad9df34f19c6732a153321d/_data",
"Destination": "/data",
"Driver": "local",
"Mode": "",
"RW": true,
"Propagation": ""
}
],
这说明Docker把在/var/lib/docker下的某个目录挂载到了容器内的/data目录下。
注:docker版本及运行的宿主机系统不同,数据卷的查看和对应的具体路径会有差异。
让我们从主机上添加文件到此文件夹下:
[[email protected] ~]# cd /var/lib/docker/volumes/f4e6492eec68a33a7c77413bad6e79158a2488f38ad9df34f19c6732a153321d/_data [[email protected] _data]# touch test-file
进入我们的容器内可以看到:
[[email protected] _data]# docker exec -it 0284f2e27644 /bin/bash [[email protected] /]# ls /data test-file
也可以使用docker attach 容器名|容器ID
注1:Docker 挂载数据卷的默认权限是读写,用户也可以通过 :ro 指定为只读。
加了 :ro 之后,就挂载为只读了。
数据卷容器
如果要授权一个容器访问另一个容器的Volume,我们可以使用--volumes-from参数来执行
如果你有一些持久性的数据并且想在容器间共享,可以创建一个数据卷容器,然后从此容器上挂载数据。
常见的使用场景是使用纯数据容器来持久化数据库、配置文件或者数据文件等。
例如:
docker run --name dbdata postgres echo "Data-only container for postgres"
该命令将会创建一个已经包含在Dockerfile里定义过Volume的postgres镜像(如:VOLUME /var/lib/postgresql/data),运行echo命令然后退出。当我们运行docker ps命令时,echo可以帮助我们识别某镜像的用途。我们可以用--volumes-from命令来识别其它容器的Volume:
docker run -d --volumes-from dbdata --name db1 postgres
现在就来创建一个命名的数据卷容器:
#docker run -dit -v /test --name data镜像
[[email protected] ~]# docker run -dit -v /test --name data docker.nmgkj.com
d0b0cdd70c4a383b7fe039c4716c8a157af360132ed43e34b07b39872cbe7207
使用--volumes-from选项在另一个容器中挂载 /test 卷。不管 data 容器是否运行,其它容器都可以挂载该容器数据卷,当然如果只是单独的数据卷是没必要运行容器的。
然后,你可以在其他容器中使用 --volumes-from 来挂载/test 卷
#docker run -dit --volumes-from data --name test1镜像
[[email protected] ~]# docker run -dit --volumes-from data --name test1 docker.nmgkj.com
af64a284b2225114249e3878a2d45c34a1450849d4cf7c789cc1a05ddbf1d97b
添加另一个容器
#docker run -dit --volumes-from data --name test2 镜像
[[email protected] ~]# docker run -dit --volumes-from data --name test2 docker.nmgkj.com
7e76c88bff7b0862a6dae63bd50ffe191ab9c94acc9fa62c80d7aa66b806a754
注:还可以使用多个 --volumes-from 参数来从多个容器挂载多个数据卷
执行docker ps查看
[[email protected] ~]# docker ps
CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES
7e76c88bff7b docker.nmgkj.com "/bin/bash /run.sh" 25 seconds ago Up 23 seconds 22/tcp, 80/tcp test2
af64a284b222 docker.nmgkj.com "/bin/bash /run.sh" 3 minutes ago Up 3 minutes 22/tcp, 80/tcp test1
d0b0cdd70c4a docker.nmgkj.com "/bin/bash /run.sh" 4 minutes ago Up 4 minutes 22/tcp, 80/tcp data
进入test1、test2容器,执行df查看
[[email protected] ~]# docker exec -it af64a284b222 /bin/bash [[email protected] /]# df
Filesystem 1K-blocks Used Available Use% Mounted on
rootfs 10474496 325476 10149020 4% /
/dev/mapper/docker-253:0-135547753-fcc63bc6fd02b744d3689a456d58bc5a4602e4c8db8d585264fe1c5a2b2e73fb
10474496 325476 10149020 4% /
tmpfs 938312 0 938312 0% /dev
tmpfs 938312 0 938312 0% /sys/fs/cgroup
/dev/mapper/centos-root
52403200 6732000 45671200 13% /test
/dev/mapper/centos-root
[[email protected] ~]# docker exec -it 7e76c88bff7b /bin/bash [[email protected] /]# df
Filesystem 1K-blocks Used Available Use% Mounted on
rootfs 10474496 325476 10149020 4% /
/dev/mapper/docker-253:0-135547753-94a04d03bcf63d6e60d49c9fb033cb0abf2705c77c61091b2db2906ec0dc8940
10474496 325476 10149020 4% /
tmpfs 938312 0 938312 0% /dev
tmpfs 938312 0 938312 0% /sys/fs/cgroup
/dev/mapper/centos-root
52403200 6732612 45670588 13% /test
也可以继承其它挂载有 /test 卷的容器
[[email protected] ~]# docker run -dit --volumes-from test1 --name test3 docker.nmgkj.com 119ba8da454f6c3b2fa8be27b9db5d4f9a195b9dc3e3a663364ff208371d5c2e [[email protected] ~]# docker exec -it 119ba8da454f /bin/bash [[email protected] /]# df
Filesystem 1K-blocks Used Available Use% Mounted on
rootfs 10474496 325476 10149020 4% /
/dev/mapper/docker-253:0-135547753-8a578c53e83e4fdc1f6c3c912e9bb950a47d41f888c2f3042678c9c612553066
10474496 325476 10149020 4% /
tmpfs 938312 0 938312 0% /dev
tmpfs 938312 0 938312 0% /sys/fs/cgroup
/dev/mapper/centos-root
52403200 6740388 45662812 13% /test
如果删除了挂载的容器(包括 data、db1 和 db2),数据卷并不会被自动删除。如果要删除一个数据卷,必须在删除最后一个还挂载着它的容器时使用 docker rm -v 命令来指定同时删除关联的容器。
利用 Data Volume Container 来备份、恢复、移动数据
先进data容器里面创建测试文件
[[email protected] ~]# docker exec -it d0b0cdd70c4a /bin/bash [[email protected] /]# cd /test/ [[email protected] test]# ls [[email protected] test]# touch duyuheng1 [[email protected] test]# touch duyuheng2 [[email protected] test]# touch duyuheng3 [[email protected] test]# exit
备份
数据卷另外一个功能是使用他们来备份、恢复、移动数据,如果你在用数据容器,那做备份是相当容易的。
使用 --volume 标记来创建一个加载了卷的新的容器,命令如下:
该示例应该会将Volume里所有的东西压缩为一个tar包
[[email protected] ~]# docker run --rm --volumes-from data -v $(pwd):/backup docker.nmgkj.com tar cvf /backup/backup.tar /test
/test/
/test/duyuheng1
/test/duyuheng2
/test/duyuheng3
tar: Removing leading `/‘ from member names
这里我们创建了一个容器,先从 data 容器来挂载数据卷。然后从本地主机挂载当前目录到容器的 /backup 目录。最后,使用 tar 命令来将 data 卷备份为 backup.tar 。当命令执行完、容器停止之后,我们就备份了 data 数据卷
执行完成之后删除容器--rm,此时备份就在当前的目录下,名为backup.tar
宿主机当前目录下产生了 test 卷的备份文件 test.tar
[[email protected] ~]# ls
anaconda-ks.cfg backup backup.tar Desktop Documents Downloads Music Pictures Public sshd_dockerfile Templates Videos
[[email protected] ~]# tar tf backup.tar
test/
test/duyuheng1
test/duyuheng2
test/duyuheng3
恢复
[[email protected] ~]# docker run --volumes-from data -v $(pwd):/backup docker.nmgkj.com tar xvf /backup/backup.tar -C /
test/
test/duyuheng1
test/duyuheng2
test/duyuheng3
或
[[email protected] ~]# docker run --volumes-from data -v $(pwd):/backup docker.nmgkj.com tar xvf /backup/backup.tar
test/
test/duyuheng1
test/duyuheng2
test/duyuheng3
附:
权限与许可
通常你需要设置Volume的权限或者为Volume初始化一些默认数据或者配置文件。要注意的关键点是,在Dockerfile的VOLUME指令后的任何指令都不能改变该Volume,比如:
FROM debian:wheezy
RUN useradd foo
VOLUME /data
RUN touch /data/x
RUN chown -R foo:foo /data
该Docker file不能按预期那样运行,我们本来希望touch命令在镜像的文件系统上运行,但是实际上它是在一个临时容器的Volume上运行。如下所示:
FROM debian:wheezy
RUN useradd foo
RUN mkdir /data && touch /data/x
RUN chown -R foo:foo /data
VOLUME /data
所以,牢记Dockerfile中VOLUME指令的位置(VOLUME是设置指令)
如果你没有通过RUN指令设置权限,那么你就需要在容器启动时使用CMD或ENTRYPOINT指令来执行
删除 Volumes
Volume 只有在下列情况下才能被删除:
· docker rm -v删除容器时添加了-v选项
例如:你可以告诉Docker同时删除容器和其Volume:
docker rm -v my_container
· docker run --rm运行容器时添加了--rm选项
即使用以上两种命令,也只能删除没有容器连接的Volume。连接到用户指定主机目录的Volume永远不会被docker删除。
否则,会在/var/lib/docker/volumes目录下得到一些僵尸文件和目录,并且还不容易说出它们到底代表什么。