理解 Git

Git 如何保存文件

其它版本管理系统通常会保存所有文件及其历次提交的差异(diff / revision),通过 merge 原始文件与各阶段的差异就能获取任何版本的状态

而 Git 保存的是每一次提交时所有文件的快照(snapshot),对于发生改变(modified)的文件会生成新的快照,而对于未发生改变的文件,其新版本快照为上一个版本的快照的索引(图中虚线框所示),这样可以减小版本库的体积

这里比较费解的是:快照究竟是什么?

简单的理解:快照就是压缩文件,只不过 git 会将文件内容压缩为 blob 格式,例如仅含一段 hello world 的 txt 文件压缩后的内容为:

7801 4bca c94f 5230 3462 c848 cdc9 c957
28cf 2fca 49e1 0200 4411 0689

所有文件快照都会被储存在 .git 仓库文件夹下的 objects 目录中

经测试,一份 200k 的未经压缩的代码文件,其文件快照大小约 65k

文件名 eef...542 是根据内容生成的 40 位哈希字符串,文件名 + 文件本身就构成了一组键值对。所有文件都以这种形式保存,而 objects 目录就是一个以键值对形式保存文件的数据库

可以想象,随着版本不断迭代,.git 仓库目录的体积往往会超过工作区所有文件的体积之和,因为哪怕只做了一丁点的改变,git 都会重新生成快照。如下图所示,我仅仅删掉了 vue.runtime.js 的一行注释,然后执行 `git add -A`,.git 中就重新生成了一份快照

一个长期维护的代码库,其代码总量可能只有几 MB,但 .git 完全可能大到以 G 计

比起其它版本管理系统仅仅记录差异,git 的这种做法不是显得更浪费空间吗?git 之所这么设计,是出于“空间换时间”的考虑。用过 SVN 的人都知道要从一个几百 MB 的项目库开出一个分支是多么费时,而使用 git 开分支,无论体积有多大,都是一瞬间的事情

Git 如何保存文件版本

理解了 git 保存文件的方式,就很容易理解其保存版本的方式:采用一个树对象来表示目录结构与文件

root: {

sub1: {

hash

hash

...

}

sub2: {

hash

hash

...

}

}

根据文件索引就可以直接从数据库中取出文件,然后再按树对象表征的目录结构进行组合排列,就很容易恢复出一套文件版本

每次 commit 除了保存树对象以外,还会记录提交的作者、批注、上一次提交的索引等信息,每个 commit 都会根据内容生成一个 hash 作为其唯一的索引

可以看到,所有的 commit 形成了一个链表,而这个链表有一个形象的名称:分支

Git 开分支的原理

git 分支的本质,就是指向某个特定 commit 的指针,假设当前只有一个分支,默认就叫做 master,当前已经是第三个提交了:

{

master: commit-3

}

那么开一个分支,无非就是新创建一个指针:

{

master: commit-3

dev: commit-3

}

当前用户处于哪个分支,需要用另一个指针来表示:

{

HEAD: master

}

执行 `git checkout dev` 切换分支后:

{

HEAD: dev

}

在 dev 分支提交一次 commit 后:

{

master: commit-3

dev: commit-4

}

切回 master,执行 `git branch -d dev` 删除分支:

{

master: commit-3

}

master 分支其实并没有什么特殊之处,它和其它分支本质是一样的,只不过它是初始化项目时的默认分支,同时在项目开发中约定作为主分支

Git 合并分支的策略

两个分支的合并只有两种情况:无分叉、有分叉

无分叉的情形最简单,合并分支就把 master 指向的 commit 更换为最新的 commit

{

master: commit-3

dev: commit-4

}

merge:

{

master: commit-4

dev: commit-4

}

这种策略被称为 fast forward

有分叉的情况稍微麻烦一些,git 会将两个分支的分叉点和头部的 commit 做一次三方合并,然后形成一个新的 commit:

显然第一种方式最简便,那有没有办法在分叉的情况下仍然采用 fast forward 的策略呢,有

在 experiment 分支上执行 `git rebase master`,首先会计算出分叉点与 experiment 分支头部的两个 commit 的差异,然后以 C3 为新的基础,整合之前计算出的差异,得到一个新的 commit

var patch = C4 - C2

var C4` = C3 + patch

C4`.parent = C3

rebase 就是改变基础的意思。这下回到 master 分支执行 merge 操作,就可以实现 fast forward 了

原文地址:https://www.cnblogs.com/kidney/p/8469659.html

时间: 2024-10-08 11:18:46

理解 Git的相关文章

理解git常用命令原理

git不同于类似SVN这种版本管理系统,虽然熟悉常用的操作就可以满足大部分需求,但为了在遇到麻烦时不至于靠蛮力去尝试,了解git的原理还是很有必要. 文件 通过git管理的文件版本信息全部存放在根目录.git下,稍微看下: $ ls .git COMMIT_EDITMSG HEAD branches description index logs packed-refs FETCH_HEAD ORIG_HEAD config hooks info objects refs git除了提供给我们平时

彻底理解Git

Translated from http://maryrosecook.com/blog/post/git-from-the-inside-out. 本文原地址:https://github.com/pysnow530/git-from-the-inside-out/blob/master/README.md 彻底理解Git 本文主要解释git的工作原理.如果你是一个视频党,请移步youtube视频. 本文假设你已经了解Git,并可以使用它来对项目做版本控制.我们主要考察支撑Git的图结构和指导

使用git微命令深入理解git工作机制

首先,这篇不是真正意义上的翻译,所以大家在看的时候不要找对应的英文文章对应着看.这篇文章之所以归类为翻译,是因为最开始有一篇英文文章让我对git内部机制有了清楚的认识,它可以说是我git的启蒙老师吧.然后很久过去后,自己也有了很多的git项目实践,觉得有必要从自己的理解角度(微命令和常用命令对应分析)来整理下自己的理解,于是有了这篇博文. git是一种管理数据的工具,一种支持快速索引查找数据并管理数据变化的工具.它为数据添加一个头封装为对象块(本文称为git对象)然后保存为文件,并根据数据生成一

全面理解 git

正文 1.Git简介 Git的诞生确实是一个有趣的故事,我们知道,当年Linus创建了开源的Linux,从此,Linux系统不断发展,现在已经成为最大的服务器系统软件了.(请不要傻傻分不清Linus和Linux) 但是随着Linux的不断壮大,就需要各种版本控制了,起初Linus带着他的小弟们使用的是BitKeeper(商业版本控制系统),之后呢由于某种原因BitKeeper的公司不让他们使用了,于是Linus自己花了两周时间写出了Git并且开源了(BitKeeper已哭晕在厕所),阿弥陀佛,幸

理解git

为了真正了解git,我们从底部.底层开始,了解git核心,知其然并知其所以然. 为什么要进行版本控制呢? 因为编写文件不可能一次到位,文件总是有不同的状态需要保存下来,方便以后出错回滚. git 是目前最先进的版本控制软件(VCS,version control system),它是linux之父Linus Torvalds的第二个作品. 正如git所命名的那样,是“愚蠢或不开心的人”,Linus评价“git is a British English slang for a stupid or

Git暂存区之理解Git暂存区(stage)

前一篇blog在实践过程有意无意地透漏了"暂存区"的概念.为了避免用户被新概念吓坏,在暂存区出现的地方又同时使用了"提交任务"这一更易理解的概念,但是暂存区(称为stage或index)才是其真正的名称. 在版本库 .git 目录下有一个index文件,下面针对这个文件做一个有趣的试验.具体操作步骤如下: 1. 首先执行 git checkout 命令(后面再介绍此命令),撤销工作区中 welcome.txt 文件尚未提交的修改. $ git checkout --

git plumbing 更加底层命令解析-深入理解GIT

原文: http://rypress.com/tutorials/git/plumbing 本文详细介绍GIT Plumbing--更加底层的git命令,你将会对git在内部是如何管理和呈现一个项目repo有一个深入的理解. 除非你想通读Git源代码,你可能永远没有必要使用下面的命令.但是通过手工的操作一个repo将会让你对于GIT如何保存数据的概念细节有个深入理解,你也将对于git是如何工作的有更好的理解. 我们首先来检阅Git的object database,然后我们使用git的低级命令手工

使用plumbing命令来深入理解git add和git commit的工作原理

前言: plumbing命令 和 porcelain命令 git中的命令分为plumbing命令和porcelain命令: porcelain命令就是我们常用的git add,git commit等命令 plumbing命令可以理解为更底层的命令,实际上一个porcelain命令可以由若干个plumbing命令完成(见下文),plumbing命令可以帮助我们了解git底层的工作原理 阅读本文还需要了解.git目录的结构功能,以及git中的对象(commit对象.tree对象.blob对象等等)等

如何理解git checkout -- file和git reset HEAD -- file

http://www.liaoxuefeng.com/wiki/0013739516305929606dd18361248578c67b8067c8c017b000/001374831943254ee90db11b13d4ba9a73b9047f4fb968d000 首先需要知道工作区(working diretory)和暂存区(Stage)这两个概念.工作区的该概念不仅包含你实际操作.更改的文件还应当包括当前修改但未add存入暂存区的文件变化信息,暂存区的作用则是临时存储文件的变化信息,在gi