《PNG文件格式》(二)PNG文件格式分析

欢迎查看系列博客:

《PNG文件格式》(一)PNG文件概述     《PNG文件格式》(二)PNG文件格式分析(本篇)

《PNG文件格式》(三)PNG文件实例剖析

摘自:

中文PNG格式说明:dev.gameres.com

PNG文件格式白皮书:www.w3.org

LZ77算法的JAVA实现:jazzlib.sourceforge.net

LZ77算法的JAVA实现,包括J2ME版本:www.jcraft.com

===============================正文=======================================

PNG文件结构

对于一个PNG文件来说,其文件头总是由位固定的字节来描述的,HEX: 89 50 4E 47 0D 0A 1A 0A

使用ultra打开一个png图片,结果如下:

其中第一个字节0x89超出了ASCII字符的范围,这是为了避免某些软件将PNG文件当做文本文件来处理。文件中剩余的部分由3个以上的PNG的数据块(Chunk)按照特定的顺序组成,因此,一个标准的PNG文件结构应该如下:

PNG文件标志 PNG数据块 …… PNG数据块

PNG数据块(Chunk)

PNG定义了两种类型的数据块,一种是称为关键数据块(critical chunk),这是标准的数据块,另一种叫做辅助数据块(ancillary chunks),这是可选的数据块。关键数据块定义了4个标准数据块,每个PNG文件都必须包含它们,PNG读写软件也都必须要支持这些数据块。你可以从“可选否”一栏查看是否必须支持的数据块。虽然PNG文件规范没有要求PNG编译码器对可选数据块进行编码和译码,但规范提倡支持可选数据块。

下表就是PNG中数据块的类别,其中,关键数据块部分我们使用深色背景加以区分。


PNG文件格式中的数据块

数据块符号

数据块名称 

多数据块 

可选否 

位置限制 
IHDR  文件头数据块  否  否  第一块 
cHRM  基色和白色点数据块  否  在PLTE和IDAT之前
gAMA  图像γ数据块  否  在PLTE和IDAT之前 
sBIT  样本有效位数据块  否  在PLTE和IDAT之前 
PLTE  调色板数据块  否  在IDAT之前 
bKGD  背景颜色数据块  否  在PLTE之后IDAT之前 
hIST  图像直方图数据块  否  在PLTE之后IDAT之前 
tRNS  图像透明数据块  否  在PLTE之后IDAT之前 
oFFs  (专用公共数据块)  否  在IDAT之前 
pHYs  物理像素尺寸数据块  否  在IDAT之前 
sCAL  (专用公共数据块)  否  在IDAT之前 
IDAT  图像数据块  否  与其他IDAT连续
tIME  图像最后修改时间数据块  否  无限制 
tEXt  文本信息数据块  无限制 
zTXt  压缩文本数据块  无限制 
fRAc  (专用公共数据块)  无限制 
gIFg  (专用公共数据块)  无限制 
gIFt  (专用公共数据块)  无限制 
gIFx  (专用公共数据块)  无限制 
IEND  图像结束数据  否  否  最后一个数据块 

这里要补充一个iCCP

数据块结构

PNG文件中,每个数据块(比如IHDR,cHRM,IDAT等)由4个部分组成,如下:

名称  字节数  说明 
Length (长度)  4字节  指定数据块中数据域的长度,其长度不超过(231-1)字节 
Chunk Type Code (数据块类型码)  4字节  数据块类型码由ASCII字母(A-Z和a-z)组成 
Chunk Data (数据块数据)  可变长度  存储按照Chunk Type Code指定的数据 
CRC (循环冗余检测)  4字节  存储用来检测是否有错误的循环冗余码 

CRC(cyclic redundancy check)域中的值是对Chunk Type Code域和Chunk Data域中的数据进行计算得到的。CRC具体算法定义在ISO 3309和ITU-T V.42中.

注意:Length值的是除:length本身,Chunk Type Code,CRC外的长度,也就是Chunk Data的长度。

下面,我们依次来了解一下各个【关键数据块】的结构

IHDR

文件头数据块IHDR(header chunk):它包含有PNG文件中存储的图像数据的基本信息,并要作为第一个数据块出现在PNG数据流中,而且一个PNG数据流(文件)中只能有一个文件头数据块。

文件头数据块由13字节组成,它的格式如下表所示:


域的名称 

字节数 

说明 
Width  4 bytes  图像宽度,以像素为单位 
Height  4 bytes  图像高度,以像素为单位 
Bit depth  1 byte  图像深度:

索引彩色图像:1,2,4或8

灰度图像:1,2,4,8或16

真彩色图像:8或16 

ColorType  1 byte  颜色类型:

0:灰度图像, 1,2,4,8或16

2:真彩色图像,8或16

3:索引彩色图像,1,2,4或8

4:带α通道数据的灰度图像,8或16

6:带α通道数据的真彩色图像,8或16 

Compression method  1 byte  压缩方法(LZ77派生算法) 
Filter method  1 byte  滤波器方法 
Interlace method  1 byte  隔行扫描方法:

0:非隔行扫描

1: Adam7(由Adam M. Costello开发的7遍隔行扫描方法) 

由于我们研究的是手机上的PNG,因此,首先我们看看MIDP1.0对所使用PNG图片的要求吧:

● 在MIDP1.0中,我们只可以使用1.0版本的PNG图片。并且,所以的PNG关键数据块都有特别要求:

IHDR

● 文件大小:MIDP支持任意大小的PNG图片,然而,实际上,如果一个图片过大,会由于内存耗尽而无法读取。

● 颜色类型:所有颜色类型都有被支持,虽然这些颜色的显示依赖于实际设备的显示能力。同时,MIDP也能支持alpha通道,但是,所有的alpha通道信息都会被忽略并且当作不透明的颜色对待。

● 色深:所有的色深都能被支持。

● 压缩方法:仅支持压缩方式0(deflate压缩方式),这和jar文件的压缩方式完全相同,所以,PNG图片数据的解压和jar文件的解压可以使用相同的代码。(其实这也就是为什么J2ME能很好的支持PNG图像的原因:))

● 滤波器方法:尽管在PNG的白皮书中仅定义了方法0,然而所有的5种方法都被支持!

● 隔行扫描:虽然MIDP支持0、1两种方式,然而,当使用隔行扫描时,MIDP却不会真正的使用隔行扫描方式来显示。

● PLTE chunk:支持

● IDAT chunk:图像信息必须使用5种过滤方式中的方式0 (None, Sub, Up, Average, Paeth)

● IEND chunk:当IEND数据块被找到时,这个PNG图像才认为是合法的PNG图像。

● 可选数据块:MIDP可以支持下列辅助数据块,然而,这却不是必须的。

bKGD cHRM gAMA hIST iCCP iTXt pHYs

sBIT sPLT sRGB tEXt tIME tRNS zTXt

关于更多的信息,可以参考www.w3.org

pHYs

物理像素数据块,它表示了图片的像素尺寸,或者是高宽比,它的结果如下

Pixels per unit, X axis 4 bytes (PNG unsigned integer)
Pixels per unit, Y axis 4 bytes (PNG unsigned integer)
Unit specifier 1 byte

unit specifier的定义如下:

0 unit is unknown
1 unit is the metre

PLTE

调色板数据块PLTE(palette chunk)包含有与索引彩色图像(indexed-color image)相关的彩色变换数据,它仅与索引彩色图像有关,而且要放在图像数据块(image data chunk)之前。

PLTE数据块是定义图像的调色板信息,PLTE可以包含1~256个调色板信息,每一个调色板信息由3个字节组成:


颜色


字节


意义


Red


1 byte


0 = 黑色, 255 = 红


Green


1 byte


0 = 黑色, 255 = 绿色


Blue


1 byte


0 = 黑色, 255 = 蓝色

因此,调色板的长度应该是3的倍数,否则,这将是一个非法的调色板。

对于索引图像,调色板信息是必须的,调色板的颜色索引从0开始编号,然后是1、2……,调色板的颜色数不能超过色深中规定的颜色数(如图像色深为4的时候,调色板中的颜色数不可以超过2^4=16),否则,这将导致PNG图像不合法。

真彩色图像和带α通道数据的真彩色图像也可以有调色板数据块,目的是便于非真彩色显示程序用它来量化图像数据,从而显示该图像。

IDAT

图像数据块IDAT(image data chunk):它存储实际的数据,在数据流中可包含多个连续顺序的图像数据块。

IDAT存放着图像真正的数据信息,因此,如果能够了解IDAT的结构,我们就可以很方便的生成PNG图像。

IEND

图像结束数据IEND(image trailer chunk):它用来标记PNG文件或者数据流已经结束,并且必须要放在文件的尾部。

如果我们仔细观察PNG文件,我们会发现,文件的结尾12个字符看起来总应该是这样的:00 00 00 00 49 45 4E 44 AE 42 60 82

不难理解,由于数据块结构的定义,IEND数据块的长度总是0(00 00 00 00,除非人为加入信息),数据标识总是IEND(49 45 4E 44),因此,CRC码也总是AE 42 60 82。

IHDR cHRM pHYs IEND

时间: 2024-10-13 22:51:32

《PNG文件格式》(二)PNG文件格式分析的相关文章

Java集合源码学习笔记(二)ArrayList分析

Java集合源码学习笔记(二)ArrayList分析 >>关于ArrayList ArrayList直接继承AbstractList,实现了List. RandomAccess.Cloneable.Serializable接口,为什么叫"ArrayList",因为ArrayList内部是用一个数组存储元素值,相当于一个可变大小的数组,也就是动态数组. (1)继承和实现继承了AbstractList,实现了List:ArrayList是一个数组队列,提供了相关的添加.删除.修

ECSHOP 2.7.2二次注入分析

这是一个很老的漏洞了.最近学习代码审计在乌云上看到的,作者只给了部分分析,和利用的exp. 0x1代码分析 漏洞出现在flow.php 在flow.php的372行有如下代码 { /* * 保存收货人信息 */ $consignee = array( 'address_id' => empty($_POST['address_id']) ? 0 : intval($_POST['address_id']), 'consignee' => empty($_POST['consignee']) ?

JSON数据格式:以及XML文件格式,YML文件格式,properties文件格式

JSON数据格式:以及XML文件格式,YML文件格式,properties文件格式 数据格式: json数据格式:属于轻量级数据格式,是javascript的一种描述数据的格式.具有易于解析,语法简单的特点,广泛应用与网络间的数据传输. {"name":"Li","age":"18"} XML数据格式:属于重量级数据格式,在以前主要是用XML进行数据的传输,但他的格式比较复杂,传输时存在大量冗余数据.目前主要作为配置文件使用

Android Dex文件格式(二)

第三块: 数据区 索引区中的最终数据偏移以及文件头中描述的map_off偏移都指向数据区, 还包括了即将要解析的class_def_item, 这个结构非常重要,下面就开始解析 class_def_item: 这个结构由dex文件头中的classDefsSize和classDefsOff所指向, 描述Dex文件中所有类定义信息, 每一个DexClassDef中包含一个DexClassData的结构(classDataOff), 每一个DexClassData中包含了一个Class的数据, Cla

(3) 深入理解Java Class文件格式(二)

好文转载:http://blog.csdn.net/zhangjg_blog/article/details/21487287 在上一篇文章 深入理解Java Class文件格式(一) 中, 介绍了class文件在整个Java体系结构中的位置和作用, 并对class文件的整体格式做了说明, 介绍了其中的魔数和版本号的相关内容, 并对常量池做了概述. 在本文章, 继续介绍class文件中的其他内容. class文件中的特殊字符串 首先说明一下, 所谓的特殊字符串出现在class文件中的常量池中,

dex文件格式二

一. dex文件头 (1) magic value 在DexFile.c   dexFileParse函数中 会先检查magic opt 啥是magic opt呢? 我们刚刚从cache目录拷贝出来的那个 前面的dey 036就是magic opt 在源码中会先解析magic opt,然后重设dexfile指针 重设magic opt指针后开始解析magic value 这 8 个 字节一般是常量.数组的值可以转换为一个字符串如下 : { 0x64 0x65 0x78 0x0a 0x30 0x3

Carbondata源码系列(二)文件格式详解

在上一章当中,写了文件的生成过程.这一章主要讲解文件格式(V3版本)的具体细节. 1.字典文件格式详解 字典文件的作用是在存储的时候将字符串等类型转换为int类型,好处主要有两点: 1.减少存储占用空间 2.用在需要group by的字段上比较合适,可以减少计算时的shuffle的数据量. 每一个字典列都有对应的三种文件.dict, .sortindex, .dictmeta文件,输出格式都是thrift格式 1.1 .dict文件 字典的值每满1000就作为一个chunk输出一次,具体的类是C

java虚拟机规范(se8)——class文件格式(二)

4.4 常量池 java虚拟机指令并不依赖类.接口.类实例或者数组的运行时布局.相反,指令依靠常量池中的符号信息. 所有的常量池条目都有如下的通用结构: cp_info { u1 tag; u1 info[]; } 常量池表中的每一个项目是以1比特的标识位开始,指示是哪种cp_info条目.info数组的内容由标志位来决定.有效的标识以及对应的值见表4.4-A.每个标识位后面必须跟2个或更多字节,这些字节给出了这些指定常量的信息.额外信息的格式由标识值来决定. 表4.4-A 常量池标识 Cons

Android 5.0 怎样正确启用isLoggable(二)__原理分析

前置文章 <Android 5.0 怎样正确启用isLoggable(一)__使用具体解释> 概要 在上文<Android 5.0 怎样正确启用isLoggable(一)__使用具体解释>中分析了isLoggable的用法,本文主要分析isLoggable实现原理以及user版系统root后永久enable isLoggable的原理,并使用脚本自己主动设置isLoggable相关属性. 本文来自http://blog.csdn.net/yihongyuelan 转载请务必注明出处

Spark SQL之External DataSource外部数据源(二)源代码分析

上周Spark1.2刚公布,周末在家没事,把这个特性给了解一下,顺便分析下源代码,看一看这个特性是怎样设计及实现的. /** Spark SQL源代码分析系列文章*/ (Ps: External DataSource使用篇地址:Spark SQL之External DataSource外部数据源(一)演示样例 http://blog.csdn.net/oopsoom/article/details/42061077) 一.Sources包核心 Spark SQL在Spark1.2中提供了Exte