Git 简介
Git 是什么?大家肯定会说不就是版本控制器嘛,是的Git是目前世界上最先进的分布式版本控制系统(没有之一)。
1.那什么是版本控制器呢?
举个简单的例子,比如我们用Word写文章,那你一定有这样的经历:比如增加一个段落你得复制一份,你删除一个段落你又得复制一份,防止下次又要修改保留上次你要删除的段落。最后一个接一个的版本,你复制了很多版本,最后可能你自己都不知道修改了哪些?嘿嘿,然后你只能一个一个的找,太麻烦了,若是有东西帮你管理那应该多好。
2.分布式管理
你写的文章或书,你肯定会给你朋友或者其他人看,让他们给你建议并做相应的修改,然后他们用邮件或U盘再发给你,你再合并修改一下,真是麻烦,于是你想,如果有一个软件,不但能自动帮我记录每次文件的改动,还可以让朋友之间协作编辑,这样就不用自己管理一堆类似的文件了,也不需要把文件传来传去。如果想查看某次改动,只需要在软件看一眼就可以,岂不是很方便?这个软件用起来就应该像这个样子,能记录每次文件的改动:
版本 | 用户 | 说明 | 修改日期 |
1 | user1 | 增加一行内容 | 2014/4/10 10:22 |
2 | user2 | 修改一行内容 | 2014/4/10 13:12 |
3 | user3 | 删除几个字 | 2014/4/15 20:42 |
4 | user2 | 增加某个内容 | 2014/4/20 16:32 |
哈哈,这样你就从手工控制“版本”时代到软件自动管理的时代,而且还是分布式管理,至于什么是分布式管理我们下面将详细说明。
Git 的诞生(很传奇)
先简看一下,下面的图片,是不是很熟悉,嘿嘿!
简单说:Linus开发Linux内核,需要版本控制器,于是开发了Git。下面是开发周期:
- 2005/4/3 开发;
- 2005/4/6 发布;
- 2005/4/7 管理自身;
- 2005/6/16 管理Kernel2.6.12。
大牛是怎么定义的呢?大家可以体会一下。哈哈^_^…… Git 迅速成为最流行的分布式版本控制系统,尤其是2008年,GitHub网站上线了,它为开源项目免费提供Git存储,无数开源项目开始迁移至GitHub,包括jQuery,PHP,Ruby等等。至于Git与GitHub的关系,会再下面的文章里说明。
四、集中管理 vs 分布式管理
Linus一直痛恨的CVS及SVN都是集中式的版本控制系统,而Git是分布式版本控制系统,集中式和分布式版本控制系统有什么区别呢? 下面我们来看看两张图:
1.集中管理
集中式版本控制系统,版本库是集中存放在中央服务器的,而干活的时候,用的都是自己的电脑,所以要先从中央服务器取得最新的版本,然后开始干活,干完活了,再把自己的活推送给中央服务器。中央服务器就好比是一个图书馆,你要改一本书,必须先从图书馆借出来,然后回到家自己改,改完了,再放回图书馆。
缺点:
集中式版本控制系统最大的毛病就是必须联网才能工作,如果在局域网内还好,带宽够大,速度够快,可如果在互联网上,遇到网速慢的话,可能提交一个10M~20M的文件就需要10分钟甚至更多时间,这还不得把人给急死啊。
2.分布式管理
那分布式版本控制系统与集中式版本控制系统有何不同呢?首先,分布式版本控制系统没有“中央服务器”,每个人的电脑上都是一个完整的版本库,这样,你工作的时候,就不需要联网了,因为版本库就在你自己的电脑上。既然每个人电脑上都有一个完整的版本库,那多个人如何协作呢?比方说你在自己电脑上改了文件fiel,你的同事也在他的电脑上改了文件file,这时,你们俩之间只需把各自的修改推送给对方,就可以互相看到对方的修改了。
和集中式版本控制系统相比,分布式版本控制系统的安全性要高很多,因为每个人电脑里都有完整的版本库,某一个人的电脑坏掉了不要紧,随便从其他人那里复制一个就可以了。而集中式版本控制系统的中央服务器要是出了问题,所有人都没法干活了。
在实际使用分布式版本控制系统的时候,其实很少在两人之间的电脑上推送版本库的修改,因为可能你们俩不在一个局域网内,两台电脑互相访问不了,也可能今天你的同事病了,他的电脑压根没有开机。因此,分布式版本控制系统通常也有一台充当“中央服务器”的电脑,但这个服务器的作用仅仅是用来方便“交换”大家的修改,没有它大家也一样干活,只是交换修改不方便而已。如上图!
Git 特点
1.Git 总结
- 分布式
- 存储快照而非差异
- 本地有完全的版本库,几乎所有操作都在本地
- 有内在的一致性,SHA1
- 优秀的分支管理
- 支持各种协同模式
- 开源,有一些第三方软件可整合使用,几乎所有操作都是
2.与CVS/SVN,Git 的优势
- 支持离线开发,离线Repository(仓库)
- 强大的分支功能,适合多个独立开发者协作
- 速度块
六、Git 原理
1.四种基本类型
- BLOB:每个blob代表一个(版本的)文件,blob只包含文件的数据,而忽略文件的其他元数据,如名字、路径、格式等。
- TREE:每个tree代表了一个目录的信息,包含了此目录下的blobs,子目录(对应于子trees),文件名、路径等元数据。因此,对于有子目录的目录,git相当于存储了嵌套的trees。
- COMMIT:每个commit记录了提交一个更新的所有元数据,如指向的tree,父commit,作者、提交者、提交日期、提交日志等。每次提交都指向一个tree对象,记录了当次提交时的目录信息。一个commit可以有多个(至少一个)父commits。
- TAG:tag用于给某个上述类型的对象指配一个便于开发者记忆的名字, 通常用于某次commit。
2.工作区(Working Dir),提交区/暂存区(stage/index),版本库
注,大家对上面的原理不了解没关系,大家只要简单的看一下这几张图,在下面的文章中我们会深入了解。
七、总结