在不使用Maven的那些项目中,我们往往就能发现命名为lib/的目录,各个项目lib/目录下的内容存在大量的重复,例如大部分项目都用到了log4j,有一小部分用到了Spring
FrameWork,还有另外一小部分用到了struts2,在每个需要的项目中都放置一份重复的log4j或者struts2显然不是最好的解决方案,这样做不仅造成了磁盘空间的浪费,而且也难于统一管理,文件的复制等操作也会降低构建的速度。
得益于上述博文讲到的坐标机制,任何Maven项目使用任何一个构件的方式都是完全相同的。再此基础上,Maven可以在某个位置统一存储所有Maven项目共享的构建,这个统一的位置就是仓库。实际的Maven项目将不再各自存储其依赖文件,它们只需要声明这些依赖的坐标,在需要的时候,Maven会自动根据坐标找到仓库中的构件,并使用它们。为了实现重用,项目构建完毕后生成的构件也可以安装或者部署到仓库中,供其他项目使用。
对于Maven来说,仓库只分为两类:本地仓库和远程仓库。当Maven根据坐标寻找构件的时候,它首先会查看本地仓库,如果本地仓库存在此构件,则直接使用;如果本地仓库不存在此构件,或者需要查询是否有更新的构件版本,Maven就会去远程仓库查找,发现需要的构件之后,下载到本地仓库再使用。如果本地仓库和远程仓库都没有需要的构建,Maven就会保存。
在这个最基本的分类的基础上,还有必要介绍一些特殊的远程仓库。中央仓库是Maven核心自带的远程仓库,它包含了绝大部分开源的构件。在默认配置下,当本地仓库没有Maven需要的构件的时候,它就会尝试从中央仓库下载。私服是另一种特殊的远程仓库,为了节省带宽和时间,应该在局域网内架设一个私有的仓库服务器,用其代理所有外部的远程仓库,内部的项目还能部署到私服上供其他项目使用。
一、本地仓库
一般来说,在Maven项目目录下,没有诸如Lib/这样用来存放依赖文件的目录。当Maven在执行编译或者测试时,如果需要使用依赖文件,它总是基于坐标使用本地仓库的依赖文件。
默认情况下,不管是在windows还是Linux下,每个用户在自己的用户目录下都有一个路径名为.m2/repository/的仓库目录。这是Maven默认的仓库路径,当然,我们也可以自定义本地仓库目录地址。只需要修改~/.m2/settings.xml,设置localRepository元素的值为想要的仓库地址即可,例如:
二、远程仓库
安装好Maven后,如果不执行任何Maven命令,本地仓库目录时不存在的。当用户输入第一条Maven命令之后,Maven才会创建本地仓库,然后根据配置和需要,从远程仓库下载构件至本地仓库。如下图:
(一)中央仓库
由于最原始的本地仓库是空的,Maven必须知道至少一个可用的远程仓库,才能在执行Maven命令的时候下载到需要的构件。中央仓库就是这样一个默认的远程仓库,Maven的安装文件自带了中央仓库的配置。
(二)私服
由上图可以看到没有私服时的Maven使用过程。下面来说一说加上私服会怎么样。私服是一种特殊的远程仓库,它是架设在局域网内的仓库服务,私服代理广域网上的远程仓库,供局域网的Maven用户使用。当Maven需要下载构件的时候,它从私服请求,如果私服上不存在该构件,则从外部的远程仓库下载,缓存在私服上之后,再为Maven的下载请求提供服务。
知道原理之后,有些读者可能会想,为什么需要在局域网内使用私服呢?主要有以下几个特点:
1.节省自己的外网带宽。建立私服同样可以减少组织自己的开支,大量的对于外部仓库的重复请求会消耗很大的带宽,利用私服代理外部仓库之后,对外的重复构件下载便得以消除,即降低外网带宽的压力。
2.加速Maven构建。不停地连接请求外部仓库是十分耗时的,但是Maven的一些内部机制(如快照更新检查)要求Maven在执行构建的时候不停地检查远程仓库数据。因此,当项目配置了很多外部远程仓库的时候,构建的速度会被大大降低。使用私服可以很好地解决这一问题。
3.部署第三方构件。当某个构件无法从任何一个外部远程仓库获得,怎么办?建立私服之后,便可以将这些构建部署到这个内部的仓库中,供内部的Maven项目使用。
4.提高稳定性,增强控制。Maven构建高度依赖于远程仓库,因此当Internet不稳定的时候,Maven构建也会变得不稳定,甚至无法构建。使用私服后,既是暂时没有Internet连接,由于私服中已经缓存了大量构件,Maven也仍然可以正常运行。
说了这么多,其实归根到死,Maven仓库就分为两种:本地仓库和远程仓库。其中远程仓库中的私服,它在Maven项目中起到了至关重要的作用。