根据文件头检测文件类型

文件签名一般都在文件的头部,如果你用十六进制方式查看文件,你就可以看到文件的一些签名信息。如用uestudio以十六进制方式查看zip格式的文件,其文件内容头部有50 4B 03 04这样的十六进制信息。同理jpg文件状况有FF D8 FF E0 xx xx 4A 46这样的十六进制信息,其实这此十六进制都是表示一些特殊字条。

php怎么样验证文件类型?先来看一个简单的方法:

	function checkFileType($fileName){
        $file = fopen($fileName, "rb");
        $bin = fread($file, 2); //只读2字节
        fclose($file);
老品牌娱乐城		// C为无符号整数,网上搜到的都是c,为有符号整数,这样会产生负数判断不正常
        $strInfo  = @unpack("C2chars", $bin);
        $typeCode = intval($strInfo[‘chars1‘].$strInfo[‘chars2‘]);
        $fileType = ‘‘;  

		switch( $typeCode )
		{
			case ‘255216‘:
				return $typeCode. ‘ : ‘ .‘jpg‘;
				break;
			case ‘7173‘:
				return $typeCode. ‘ : ‘ .‘gif‘;
				break;
			case ‘13780‘:
				return $typeCode. ‘ : ‘ .‘png‘;
				break;
			case ‘6677‘:
				return $typeCode. ‘ : ‘ .‘bmp‘;
				break;
			case ‘7790‘:
				return $typeCode. ‘ : ‘ .‘exe‘;
				break;
			case ‘7784‘:
				return $typeCode. ‘ : ‘ .‘midi‘;
				break;
			case ‘8297‘:
				return $typeCode. ‘ : ‘ .‘rar‘;
				break;
			default:
				return $typeCode. ‘ : ‘ .‘Unknown‘;
				break;
		}
		//return $typeCode;
    }

	$file_name = ‘11.doc‘;
	echo checkFileType($file_name);

下来提供一个类的实现:

/*通过文件名,获得文件类型*
 *@author chengmo QQ:8292669*
 *@copyright http://www.cnblogs.com/chengmo 2010-10-17
 *@version 0.1
 *$filename="d:/1.png";echo cFileTypeCheck::getFileType($filename); 打印:png
 */
class cFileTypeCheck
{
    private static $_TypeList=array();
    private static $CheckClass=null;
    private function __construct($filename)
    {
        self::$_TypeList=$this->getTypeList();
    }

    /**
     *处理文件类型映射关系表*
     *
     * @param string $filename 文件类型
     * @return string 文件类型,没有找到返回:other
     */
    private function _getFileType($filename)
    {
        $filetype="other";
        if(!file_exists($filename)) throw new Exception("no found file!");
        $file = @fopen($filename,"rb");
        if(!$file) throw new Exception("file refuse!");
        $bin = fread($file, 15); //只读15字节 各个不同文件类型,头信息不一样。
        fclose($file);

        $typelist=self::$_TypeList;
        foreach ($typelist as $v)
        {
            $blen=strlen(pack("H*",$v[0])); //得到文件头标记字节数
            $tbin=substr($bin,0,intval($blen)); ///需要比较文件头长度

            if(strtolower($v[0])==strtolower(array_shift(unpack("H*",$tbin))))
            {
                return $v[1];
            }
        }
        return $filetype;
    }

    /**
     *得到文件头与文件类型映射表*
     *
     * @return array array(array(‘key‘,value)...)
     */
    public function getTypeList()
    {
        return array(array("FFD8FFE1","jpg"),
        array("89504E47","png"),
        array("47494638","gif"),
        array("49492A00","tif"),
        array("424D","bmp"),
        array("41433130","dwg"),
        array("38425053","psd"),
        array("7B5C727466","rtf"),
        array("3C3F786D6C","xml"),
        array("68746D6C3E","html"),
        array("44656C69766572792D646174","eml"),
        array("CFAD12FEC5FD746F","dbx"),
        array("2142444E","pst"),
        array("D0CF11E0","xls/doc"),
        array("5374616E64617264204A","mdb"),
        array("FF575043","wpd"),
        array("252150532D41646F6265","eps/ps"),
        array("255044462D312E","pdf"),
        array("E3828596","pwl"),
        array("504B0304","zip"),
        array("52617221","rar"),
        array("57415645","wav"),
        array("41564920","avi"),
        array("2E7261FD","ram"),
        array("2E524D46","rm"),
        array("000001BA","mpg"),
        array("000001B3","mpg"),
        array("6D6F6F76","mov"),
        array("3026B2758E66CF11","asf"),
        array("4D546864","mid"));
    }

    public static function getFileType($filename)
    {
        if(!self::$CheckClass) self::$CheckClass=new self($filename);
        $class=self::$CheckClass;
        return $class->_getFileType($filename);
    }

}

$filename="22.jpg";
echo $filename,"t",cFileTypeCheck::getFileType($filename),"rn";
$filename="11.doc";
echo $filename,"t",cFileTypeCheck::getFileType($filename),"rn";

或者可以这么检测:

$filename = ‘22.jpg‘;

$extname = strtolower(substr($filename, strrpos($filename, ‘.‘) + 1));
echo $extname.‘<br />‘;
$file = @fopen($filename, ‘rb‘);
    if ($file)
    {
        $str = @fread($file, 0x400); // 读取前 1024 个字节
		echo substr($str, 0, 4);
        @fclose($file);
    }
 	if (substr($str, 0, 4) == ‘MThd‘ && $extname != ‘txt‘)
        {
            $format = ‘mid‘;
        }
        elseif (substr($str, 0, 4) == ‘RIFF‘ && $extname == ‘wav‘)
        {
            $format = ‘wav‘;
        }
        elseif (substr($str ,0, 3) == "/xFF/xD8/xFF")
        {
            $format = ‘jpg‘;
        }
        elseif (substr($str ,0, 4) == ‘GIF8‘ && $extname != ‘txt‘)
        {
            $format = ‘gif‘;
        }
        elseif (substr($str ,0, 8 ) == "/x89/x50/x4E/x47/x0D/x0A/x1A/x0A")
        {
            $format = ‘png‘;
        }
        elseif (substr($str ,0, 2) == ‘BM‘ && $extname != ‘txt‘)
        {
            $format = ‘bmp‘;
        }
        elseif ((substr($str ,0, 3) == ‘CWS‘ || substr($str ,0, 3) == ‘FWS‘) && $extname != ‘txt‘)
        {
            $format = ‘swf‘;
        }
        elseif (substr($str ,0, 4) == "/xD0/xCF/x11/xE0")
        {   // D0CF11E == DOCFILE == Microsoft Office Document
            if (substr($str,0x200,4) == "/xEC/xA5/xC1/x00" || $extname == ‘doc‘)
            {
                $format = ‘doc‘;
            }
            elseif (substr($str,0x200,2) == "/x09/x08" || $extname == ‘xls‘)
            {
                $format = ‘xls‘;
            } elseif (substr($str,0x200,4) == "/xFD/xFF/xFF/xFF" || $extname == ‘ppt‘)
            {
                $format = ‘ppt‘;
            }
        } elseif (substr($str ,0, 4) == "PK/x03/x04")
        {
            $format = ‘zip‘;
        } elseif (substr($str ,0, 4) == ‘Rar!‘ && $extname != ‘txt‘)
        {
            $format = ‘rar‘;
        } elseif (substr($str ,0, 4) == "/x25PDF")
        {
            $format = ‘pdf‘;
        } elseif (substr($str ,0, 3) == "/x30/x82/x0A")
        {
            $format = ‘cert‘;
        } elseif (substr($str ,0, 4) == ‘ITSF‘ && $extname != ‘txt‘)
        {
            $format = ‘chm‘;
        } elseif (substr($str ,0, 4) == "/x2ERMF")
        {
            $format = ‘rm‘;
        } elseif ($extname == ‘sql‘)
        {
            $format = ‘sql‘;
        } elseif ($extname == ‘txt‘)
        {
            $format = ‘txt‘;
        }

		echo $format;
时间: 2024-11-08 02:22:24

根据文件头检测文件类型的相关文章

java通过文件头来判断文件类型

import java.io.FileInputStream; import java.io.IOException; import java.util.HashMap; import java.util.Map.Entry; /** * @Description 根据的文件头来判断文件类型 * @author LJ * @Version v1.0 */ public class GetFileTypeByHead { public static void main(String[] args)

利用文件头判断文件类型

上传文件时经常需要做文件类型判断,例如图片.文档等,普通做法是直接判断文件后缀名,而文艺青年为了防止各种攻击同时也会加上使用文件头信息判断文件类型. 原理很简单:用文件头判断,直接读取文件的前2个字节即可. 1 public class FileUtil { 2 /** 3 * byte数组转换成16进制字符串 4 * 5 * @param src 6 * @return 7 */ 8 private static String bytesToHexString(byte[] src) { 9

【转】python通过文件头判断文件类型

刚刚看到一个好玩的程序,拉过来.原文地址:https://www.ttlsa.com/python/determine-file-type-by-the-file-header/ 侵权删. ==============================分隔线============================== 对于提供上传的服务器,需要对上传的文件进行过滤,否则各种webshell,暴库. import struct # 支持文件类型 # 用16进制字符串的目的是可以知道文件头是多少字节

Tika检测文件类型

Tika类型检测 Tika支持MIME所提供的所有互联网媒体文件类型.每当一个文件通过Tika检测到该文件,其文件类型.检测的介质类型,Tika内部通过以下机制. MIME标准 多用途Internet邮件扩展(MIME)标准,用于识别文件类型的最佳标准.这些标准的知识有助于在内部相互作用的浏览器. 当浏览器遇到一个媒体文件,它选择可用它来显示其内容的兼容软件.在情况下,它不具有任何合适的应用程序,以运行一个特定媒体文件,它建议用户获得合适的插件软件. 使用Facade类类型检测 facade类的

检测文件类型脚本

考核内容test文件类型测试编辑文件利用test文件类型测试思路先确认文件为空时处理方式确认文件不存在时处理方式确认文件存在时类型的处理方式 文件类型 普通文件文件类型目录文件类型 块文件文件类型 字符块文件文件类型 套接字文件 原文地址:https://blog.51cto.com/14190777/2434109

为python添加magic进行文件类型识别

最近想看看cuckoo里的文件识别功能是怎样实现的,翻了cuckoo源码,发现其对文件格式的判断代码如下: def _get_filetype(self, data): """Gets filetype, uses libmagic if available. @param data: data to be analyzed. @return: file type or None. """ if not HAVE_MAGIC: return No

Python判断上传文件类型

在开发上传服务时,经常需要对上传的文件进行过滤. 本文为大家提供了python通过文件头判断文件类型的方法,非常实用. 代码如下 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 import struct  # 支持文件类型  # 用16进制字符串的目的是可以知道文件头是多少字节  # 各种文件头的长度不一样,少半2字符,长则8字

子界类型、集合类型、记录类型、文件类型

子界类型 如果我们定义一个变量i为integer类型,那么i的值在微型机系统的pascal中,使用2字节的定义表示法,取值范围为-32768-32767.而事实上,每个程序中所用的变量的值都有一个确定的范围. 例如,人的年龄一般不超过150,一个班级的学生不超过100人,一年中的月数不超过12,一月中的天数不超过31,等等. 如果我们能在程序中对所用的变量的值域作具体规定的话,就便于检查出那些不合法的数据,这就能更好地保证程序运行的正确性.而且在一定程度上还会节省内存空间. 子界类型就很好解决如

04 bbed修复system文件头损坏

1 启动数据库,查看trace,在mount到open, SQL> startup mount; ORACLE instance started. Total System Global Area 784998400 bytes Fixed Size 2257352 bytes Variable Size 511708728 bytes Database Buffers 264241152 bytes Redo Buffers 6791168 bytes Database mounted. SQ