题外话:在荒废了很久没有更新之后……某日突然收到读者的站内信!内容大体是询问GPT分区表信息的读取方式,笔者激动万分之下,决定继续解剖NTFS……其实GPT严格上不算是NTFS的内容, GPT和MBR类似,都属于像是“容器”的东西,容纳的都是一个个的分卷,可以是NTFS,可以是FAT32,等等。
上一节讲到了DPT与MBR的C实现,既然已经提到了GPT分区表,不妨这一节就解剖一下GPT分区表,MFT留待之后再述。好,继续……
GPT分区全名为Globally Unique Identifier Partition Table Format。关于GPT的优点,包括无限分区数量、更高的安全性、更大的分卷容量,等等这些都不详细叙述了,大部分电脑网站上一片GPT相关文章都有这些内容。我们主要讲如何用C实现它,在这个过程中,大家会详细的了解为什么会有这些优点。
开始的工作于之前相同,先用DiskGenius格式化一块硬盘,转换成GPT的分区表,并且建立5个分区,如图1。因为MBR只支持4个主分区-_-|||,所以为了显示GPT的优越性之一,我们建立5个分区。
图1 使用DiskGenius建立的5个分区,以及ESP和MSR分区
以GPT建立分区时,DiskGenius会询问是否建立ESP和MSR分区,在这里解释一下ESP和MSR。ESP分区是用于装系统时的UEFI引导分区,这也是GPT于MBR的区别之一,MS的系统启动方式分为老旧的BIOS和新的UEFI,BIOS启动方式只能用于MBR分区表的硬盘,UEFI则从原则上同时支持GPT和MBR,但MS限制只能用GPT启动UEFI。说到MS,顺便提一下各个版本的Windows对GPT的支持程度,从XP开始所有Windows都可以读写GPT分区,但32位XP不支持从GPT分区启动。而MSR,它是留给操作系统和别的东西用的,因为GPT不支持隐藏分区,操作系统一直使用的隐藏分区来保存关键数据的做法就没法用了,所以为了不在资源管理器里显示一个很小的磁盘并让用户误删除,直接标记一个MSR分区,并且使MSR不显示于资源管理器,是一个更好的做法。
值得注意的,MSP必须在第一次分区之前建立,也就是说我们要创建GPT分区,需要先创建MSR,然后在建立分区。磁盘逻辑上的顺序为:ESP,可选的OEM,MSR,分区1,分区2,……
更详细的有关操作系统的知识,网上文章超多,就不更多的介绍了。
GPT分区表结构如图2所示,在GPT分区中,每一个数据读写单元成为LBA(逻辑块地址),一个“逻辑块”相当于传统MBR分区中的一个“扇区”,之所以会有区别,是因为GPT除了要支持传统硬盘,还需要支持以NAND FLASH为材料的SSD硬盘,这些硬盘的一个读写单元是2KB或4KB,所以GPT分区中干脆用LBA来表示一个基础读写块,当GPT分区用在传统硬盘上时,通常,LBA就等于扇区号,有些物理硬盘支持2KB对齐,此时LBA所表示的一个逻辑块就是2KB的空间。
图2 GPT分区表结构
从图中可以看出,整个GPT分区表被分成了70个LBA,其中第0个LBA是“Protective MBR”,从字面意思是被保护的MBR信息,这个是为了和传统MBR分区表相兼容,以便一个识别程序可以顺利识别出一块硬盘是MBR分区结构还是GPT的。
如图3显示整个磁盘的物理0扇区数据,大部分是0,但这不影响我们看出他是一个MBR的分区表,这个分区表中只有一项主分区数据,可以看到0x1C2处记录的系统信息是0xEE,我们在GPT和MBR综合的程序中,将根据这个0xEE区分一块硬盘使用的是GPT还是MBR,函数如下:
1 #define PDT_GPT 0 2 3 #define PDT_MBR 0 4 5 ... 6 7 bool PartitionTableDetermination(unsigned char* SectorData) 8 9 { 10 11 if (SectorData[0x1C2] == 0xEE) 12 13 return PDT_GPT; 14 15 else 16 17 return PDT_MBR; 18 19 }
调用方法如下:
1 if (PartitionTableDetermination(SectorBuffer) == PDT_GPT) 2 3 { 4 5 printf("该硬盘是GPT分区表\n"); 6 7 } 8 9 else if (PartitionTableDetermination(SectorBuffer) == PDT_MBR) 10 11 { 12 13 printf("该硬盘是MBR分区表\n"); 14 15 }
运行结果如下:
图3 磁盘物理0扇区数据
LBA1,这是一个叫做Primary GPT Header的东西,中文大概叫“主GPT头”,它主要是给出了一些重要的信息,如下表所示:
字节偏移量 |
数据长度(字节) |
范例数值 |
数据项说明 |
0x00 |
8 |
45 46 49 20 50 41 52 54 |
固定字符串“EFI PART” |
0x08 |
4 |
00 00 01 00 |
GPT版本号,1.0版,所以是0100 |
0x0C |
4 |
5C 00 00 00 |
主GPT头大小,用了92字节 |
0x10 |
4 |
C2 B9 3D B6 |
主GPT头的CRC32校验数据,注意不是累加和校验 |
0x14 |
4 |
00 00 00 00 |
保留,4个00 |
0x18 |
8 |
01 00 00 00 00 00 00 00 |
主GPT头起始扇区号,LBA1 |
0x20 |
8 |
FF 67 6F 74 00 00 00 00 |
主GPT头备份位置扇区号 |
0x28 |
8 |
22 00 00 00 00 00 00 00 |
GPT分区起始扇区号,LBA34 |
0x30 |
8 |
DE 67 6F 74 00 00 00 00 |
GPT分区结束扇区号,LBA-34 |
0x38 |
16 |
83 34 0F 39 FC 11 91 41 A0 A3 9B F6 D6 E5 32 FE |
磁盘的GUID,唯一标识,这也意味着全硬盘复制是行不通的. |
0x48 |
8 |
02 00 00 00 00 00 00 00 |
分区表起始扇区号,LBA2 |
0x50 |
4 |
80 00 00 00 |
分区表项数目,MS强行给128 |
0x54 |
4 |
80 00 00 00 |
每个分区表占用字节数,128 |
0x58 |
4 |
C5 04 9E 76 |
分区表CRC校验数据 |
0x5C |
- |
00 …… |
保留空间,必须为0,填充满整个LBA块 |
根据这个表格我们可以写出两个结构体,分别来装主GPT头的数据和信息:
1 #pragma pack(1) 2 3 typedef struct 4 5 { 6 7 uint8_t EFIPARTSign[8]; //固定字符串“EFI PART” 8 9 uint8_t GPTVersion[4]; //GPT版本号 10 11 uint8_t PrimaryGPTHeaderLength[4]; //主GPT头大小 12 13 uint8_t PrimaryGPTHeaderCRC32[4]; //主GPT头的CRC32校验数据 14 15 uint8_t Reserve[4]; //保留 16 17 uint8_t PrimaryGPTHeaderStart[8]; //主GPT头起始扇区号 18 19 uint8_t PrimaryGPTHeaderBackup[8]; //主GPT头备份位置扇区号 20 21 uint8_t GPTPartitionStart[8]; //GPT分区起始扇区号 22 23 uint8_t GPTPartitionEnd[8]; //GPT分区结束扇区号 24 25 uint8_t DiskGUID[16]; //磁盘的GUID 26 27 uint8_t PartitionStart[8]; //分区表起始扇区号 28 29 uint8_t PartitionTables[4]; //分区表项数目 30 31 uint8_t BytesPerPartitionTable[4]; //每个分区表占用字节数 32 33 uint8_t PartitionTableCRC32[4]; //分区表CRC校验数据 34 35 uint8_t Reverse2[4]; //填充数据00 36 37 }GPT_Byte; 38 39 #pragma pack() 40 41 typedef struct 42 43 { 44 45 uint8_t GPTVersion[4]; //GPT版本号 46 47 uint32_t PrimaryGPTHeaderLength; //主GPT头大小 48 49 uint32_t PrimaryGPTHeaderCRC32; //主GPT头的CRC32校验数据 50 51 uint64_t PrimaryGPTHeaderStart; //主GPT头起始扇区号 52 53 uint64_t PrimaryGPTHeaderBackup; //主GPT头备份位置扇区号 54 55 uint64_t GPTPartitionStart; //GPT分区起始扇区号 56 57 uint64_t GPTPartitionEnd; //GPT分区结束扇区号 58 59 uint8_t DiskGUID[16]; //磁盘的GUID 60 61 uint64_t PartitionStart; //分区表起始扇区号 62 63 uint32_t PartitionTables; //分区表项数目 64 65 uint32_t BytesPerPartitionTable; //每个分区表占用字节数 66 67 uint32_t PartitionTableCRC32; //分区表CRC校验数据 68 69 }GPT_Info;
并且写出获取GPT信息并完成大小端模式转换的函数:
1 void GetGPTInfo(GPT_Info* GPTInfo) 2 3 { 4 5 GPT_Byte GPTbuffer; 6 7 HANDLE hdl = GetDiskHandle(PHYDRIVE);//获取一个指定物理驱动器句柄 8 9 ReadSectorData(hdl, 1, (char*)(void*)&GPTbuffer); 10 11 GPTInfoTransferLittleEnd(&GPTbuffer, GPTInfo); 12 13 } 14 15 16 17 void GPTInfoTransferLittleEnd(GPT_Byte* src, GPT_Info* dest) 18 19 { 20 21 memcpy(dest->GPTVersion, src->GPTVersion, 4); 22 23 dest->PrimaryGPTHeaderLength = ArrayToU32LittleEnd(src->PrimaryGPTHeaderLength); 24 25 dest->PrimaryGPTHeaderCRC32 = ArrayToU32LittleEnd(src->PrimaryGPTHeaderCRC32); 26 27 dest->PrimaryGPTHeaderStart = ArrayToU64LittleEnd(src->PrimaryGPTHeaderStart); 28 29 dest->PrimaryGPTHeaderBackup = ArrayToU64LittleEnd(src->PrimaryGPTHeaderBackup); 30 31 dest->GPTPartitionStart = ArrayToU64LittleEnd(src->GPTPartitionStart); 32 33 dest->GPTPartitionEnd = ArrayToU64LittleEnd(src->GPTPartitionEnd); 34 35 memcpy(dest->DiskGUID, src->DiskGUID, 16); 36 37 dest->PartitionStart = ArrayToU64LittleEnd(src->PartitionStart); 38 39 dest->PartitionTables = ArrayToU32LittleEnd(src->PartitionTables); 40 41 dest->BytesPerPartitionTable = ArrayToU32LittleEnd(src->PartitionTables); 42 43 dest->PartitionTableCRC32 = ArrayToU32LittleEnd(src->PartitionTableCRC32); 44 45 }
调用方式如下:
1 GPT_Info GPT; 2 3 GetGPTInfo(&GPT); 4 5 printf("GPT版本号:%.2X%.2X%.2X%.2X\n", GPT.GPTVersion[0], 6 7 GPT.GPTVersion[1], 8 9 GPT.GPTVersion[2], 10 11 GPT.GPTVersion[3]); 12 13 printf("主GPT头大小:%d\n", GPT.PrimaryGPTHeaderLength); 14 15 printf("主GPT头的CRC32校验数据:0x%.8X\n", GPT.PrimaryGPTHeaderCRC32); 16 17 printf("主GPT头起始扇区号:%d\n", GPT.PrimaryGPTHeaderStart); 18 19 printf("主GPT头备份位置扇区号:%d\n", GPT.PrimaryGPTHeaderBackup); 20 21 printf("GPT分区起始扇区号:%d\n", GPT.GPTPartitionStart); 22 23 printf("GPT分区结束扇区号:%d\n", GPT.GPTPartitionEnd); 24 25 printf("磁盘的GUID:%.2X%.2X%.2X%.2X%.2X%.2X%.2X%.2X%.2X%.2X%.2X%.2X%.2X%.2X%.2X%.2X\n", 26 27 GPT.DiskGUID[0], GPT.DiskGUID[1], 28 29 GPT.DiskGUID[2], GPT.DiskGUID[3], 30 31 GPT.DiskGUID[4], GPT.DiskGUID[5], 32 33 GPT.DiskGUID[6], GPT.DiskGUID[7], 34 35 GPT.DiskGUID[8], GPT.DiskGUID[9], 36 37 GPT.DiskGUID[10], GPT.DiskGUID[11], 38 39 GPT.DiskGUID[12], GPT.DiskGUID[13], 40 41 GPT.DiskGUID[14], GPT.DiskGUID[15]); 42 43 printf("分区表起始扇区号:%d\n", GPT.PartitionStart); 44 45 printf("分区表项数目:%d\n", GPT.PartitionTables); 46 47 printf("每个分区表占用字节数:%d\n", GPT.BytesPerPartitionTable); 48 49 printf("分区表CRC校验数据:0x%.4X\n", GPT.PartitionTableCRC32);
运行,可以看到结果如图4,与图5的DiskGenius显示的数据吻合,唯一有区别的是磁盘的GUID,但因为我们将它处理成数组格式,而DiskGenius处理为5个不等长度的小端数据:
图4 获取主GPT头信息
图5 DiskGenius显示的磁盘信息
GPT分区表先讲到这,本节主要解析了主GPT头的信息,关于LBA2之后的东西,下一节继续。
这一节总体上非常混乱,因为时隔9个多月重新捡起来,加上这段时间的编码水平略微提高,感觉之前的代码就是一坨[高雅],所以这一节也没有像第三节一样吧整个文件贴出来。准备抽时间把之前的代码重构一下,然后每一次直接发一个压缩包,也省的每次都对大段代码进行排版,大家都方便^_^。