git术语解释staging，index，cache

当我在使用git的时候，有三个东西的出现，一度让我非常困扰，就如题所述，staging，index，和cache。

比如，当我阅读git官网提供的电子书《Pro Git》的时候，最初一章里，就提到，文件在git里面，有三种状态，working copy，staging area，和 in repository。而在读一些man pages的时候，比如git-reset命令，又会看到index，这非常让人困扰。而git-rm 指令又有一个参数叫 -cached，其作用是”unstage and remove paths only from the index”，更加奇怪了，同时提到了stage和index，而参数名竟然是cached！！！

这三者的来龙去脉到底怎么回事？搞清楚这些问题，对于喜欢刨根究底的我来说，极其重要。通过谷歌，我找到了一个叫Junio C Hamano的日本小哥，他是git的核心维护者之一，讲述了这三者的故事。本文主要内容从那个文章中解读出来，添加了一些自己的理解，不感冒的同学，请直接阅读原文。

读完原文后，我的基本感觉是，这些都是Linus大神当时的一念之差和命名的随意性搞出来的问题。

原来，Linus当年在维护Kernel的时候，使用了一种叫做“tarball and patches”的工作流模型(什么鬼？)，具体原理没搞懂，我理解的意思，他要研究每个Kernel的patch对Kernel到底有什么影响。例如，他有一个2.6.12的tarball，还有 patch-1，patch-2 两个，所以，他至少要弄出来三个新版本，2.6.12-patch1，2.6.12-patch2，2.6.12-patch1&2。区区两个patch就搞出了3个新版本，如果patch多了不堪重负。

于是，他发明了一个“目录缓存(directory cache)”，其实就是现今git中的tree的概念，这个tree上的每个节点，都是一个Kernel的整个目录结构和文件(用一种高度压缩的形式表示的)。构建这个tree的方法，就是将内容添加到“缓存cache”，或者“更新缓存cache中的内容”。

用来存储这个树状结构的目录，叫“.dircache”(现在叫“.git”)。这个目录里，有个文件叫index，在git源码里(用C写的)，操作这个index的各种变量名称，都有个前缀叫“cache”。这个index文件的作用，就是决定你要将什么文件，最终写入到那个树状结构里的，index就是暂存用的缓冲区。(可以看出来，这个树状结构，其根本作用就是维护海量的版本，其实就是git版本库本身了)(开发团队里的)每个人，都混用cache和index两个词，因为记录缓冲区(cache)内容的文件名，叫index。如果你给定文件路径，就能从index文件中找出来你要提交的内容(现在依旧如此)。

现在，越来越多的人，不需要通过阅读git的源码，就可以使用git了(因为有了文档和很多书籍，从应用层面介绍了很多的git知识，所以不需要从源码里找到所有秘密了：D)。所以，index这个名字变得越来越流行，因为这个文件会出现在.git目录里，而源代码里，cache开头的那些变量却不为人知。最终，我们(git开发团队)不再使用cache这个单词给小白用户(End User)解释问题了，但是当我们讨论git内部数据结构和git实现的时候，还是会用到cache这个词。

对于小白用户来说，现在 cache 这个词都以过去分词 cached 的形式出现，其词性是形容词了。表示要讨论的内容目前位于index文件中，而不是在工作目录(work tree)里面。(假如，我在工作目录里修改了一个文件，使用 git-add 命令，我修改的部分内容 —— 相当于一个patch —— 会在index里出现，但是在我的工作目录里，当然也还是有我修改的内容的，不过是叠加在版本库中的文件上的)。当然，我们也可以用 “indexed” 这个词，但是 “cached contents”，在英语里是个词组，早已存在，表达的就是这个意思，所以我们不需要再发明一个词来说明这个意思，就用了cached了(我了个去啊 >-

时间： 2024-12-28 01:36:24

git术语解释staging，index，cache

git术语解释staging，index，cache的相关文章

kafka深入研究之路(2) kafka简介与专业术语解释说明

刨根究底字符编码之二——关键术语解释(下)

【SSO单点系列】（6）：CAS4.0 单点流程序列图（中文版）以及相关术语解释（TGT、ST、PGT、PT、PGTIOU）

js术语解释

spss C# 二次开发学习笔记（二）——Spss以及统计术语解释（IT人眼中的统计术语）

刨根究底字符编码之一——关键术语解释(上)

听力|术语解释原则|转折原则|提问原则|并列

JAVA初步——环境搭建和专业术语解释，helloworld程序编写小结

IOS开发网络篇—SDK API IDE专业术语解释