妙用python之编码转换

转自i春秋

文章难易度:★★

知识点:python、编码转换

前 言

在日常渗透,漏洞挖掘,甚至是CTF比赛中,会遇到各种编码,常常伴随着这些编码之间的各种转换。记得刚入门那个时候,自己处理编码转换问题往往是“百度:url解码、base64加密、hex……”,或者是使用一款叫做“小葵多功能转换工具”的软件,再后来直接上Burpsuite的decoder功能,感觉用的还挺好的。不过,也遇到些问题:在线转换效率低(搜索占去了2/3的时间)、两款工具存在一些小问题,比如burp中涉及中文往往显示乱码。

直到使用python来作为我日常编码转换工具……

开启py转换之旅

1

url编码

url编码是一种浏览器用来打包表单输入的格式.可谓是一名作为web人员最熟悉的一种编码方式了。

[Python] 

>>> from urllib import *

>>> quote("union select null,null,null")

‘union%20select%20null%2Cnull%2Cnull‘

>>> unquote("union%20select%20null%2Cnull%2Cnull")

‘union select null,null,null‘

>>> urlencode({‘x‘:‘2333‘,‘y‘:‘666‘})

‘y=666&x=2333‘

2

Base64

Base64常常用作网页表单和HTTP传输的一些参数,也常用于邮件协议传输用户信息等。

[Python]

>>> import base64

>>> base64.b64encode("admin")

‘YWRtaW4=‘

>>> base64.b64decode(‘YWRtaW4=‘)

‘admin‘

记得有次ctf比赛中考到了base32解密,一般网站不提供在线解密,一时之间貌似没有办法继续下去。不过如果你使用python的话会像上边解密base64一样简单,只需要将函数改变下:

[Python] 

>>> import base64

>>> base64.b32encode(‘jjjjj‘)

‘NJVGU2TK‘

>>> base64.b32decode(‘NJVGU2TK‘)

‘jjjjj‘

3

Hex

十六进制编码也是web application中常见的一种编码方案。作为一名web安全人员,我们心知肚明的是,MySQL注入可以使用hex绕过htmlspecialchars()函数从而写入webshell。
比如:

[SQL]

select 0x3c3f70687020406576616c28245f504f53545b615d293b203f3e into outfile ‘/web/1.php‘

下面是python实现hex加解密的方法:

[Python] 

>>> ‘<?php @eval($_POST[a]); ?>‘.encode(‘hex‘)

‘3c3f70687020406576616c28245f504f53545b615d293b203f3e‘

>>>

>>> print ‘3c3f70687020406576616c28245f504f53545b615d293b203f3e‘.decode(‘hex‘)

<?php @eval($_POST[a]); ?>

4

Ascii

MySQL中的char()函数则是转换ascii码的,正因如此,也可以使用这个特性来绕过htmlspecialchars()函数。
比如:

[SQL]

select char(60, 63, 112, 104, 112, 32, 64, 101, 118, 97, 108, 40, 36, 95, 80, 79, 83, 84, 91, 97, 93, 41, 59, 32, 63, 62) into outfile ‘/web/1.php‘

使用python将字符串转换ascii很简单,但是逆转换的话需要需要点小操作:

[Python]

>>> map(ord, "<?php phpinfo() ?>")

[60, 63, 112, 104, 112, 32, 112, 104, 112, 105, 110, 102, 111, 40, 41, 32, 63, 62]

>>> print chr(112)

p

>>> l = [60, 63, 112, 104, 112, 32, 112, 104, 112, 105, 110, 102, 111, 40, 41, 32, 63, 62]

>>> print ‘‘.join(map(chr,l))       #这里采用pcat表哥指出的方法

<?php phpinfo() ?>

5

Md5

md5在web安全界可以说是人尽皆知了,以他的不可逆性,大多数网站存储用户密码等关键数据时常常使用md5加密。有的时候我们提交payload需要md5加密,这个时候用下面的方法就可以轻松实现。当然解密的话推荐去cmd5。

[Python] 

>>> from hashlib import md5

>>> m = md5()

>>> m.update(‘this is a secret‘)

>>> m.hexdigest()

‘7dbbcee180ba4d456e4aa1cfbdad9c7b‘

>>> m.hexdigest()[8:-8]

‘80ba4d456e4aa1cf‘

>>>

6

Unicode转中文

unicode转换中文,很多情况下都能遇到。尤其是在做渗透测试的时候。用burp的话会存在中文乱码的问题,在python下实现非常简单。

[Python] 

>>> print u"\u4f60\u9700\u8981\u91cd\u65b0\u767b\u9646"

你需要重新登陆
时间: 2024-10-12 03:53:32

妙用python之编码转换的相关文章

Python字符编码转换Unicode和str

参考链接1:https://blog.csdn.net/VictoriaW/article/details/75314737 参考链接2:https://blog.csdn.net/sheldonwong/article/details/86684761 Unicode和str ## str 我们平时写的用引号括起来的字符串都是str类型的. >>> x = '哈哈' >>> x '\xb9\xfe\xb9\xfe' ### 根据上面的打印结果,可以知道str类型的x存

〖Python〗-- 编码转换

[字符编码与转码] 为什么要进行编码和转码 由于每个国家电脑的字符编码格式不统一(列中国:GBK),同一款软件放到不同国家的电脑上会出现乱码的情况,出现这种情况如何解决呢?! 当然由于所有国家的电脑都支持Unicode万国码,那么我们可以把Unicode为跳板,先把字符编码转换为Unicode,在把Unicode转换为另一个国家的字符编码(例韩国),则不会出现乱码的情况.当然这里只是转编码集并不是翻译成韩文不要弄混了. Python3.0进行编码转换 # __author__:"ShengXin

python字符编码转换

ASCII码很好的解决了以英文为母语基础的计算机使用语言,但比如中国人想存汉子的时候,就无法实现,于是就出现了新的字符集GB2312中文字符集,但是支持的汉子较少.-----> decode()是将str转化为Unicode字符串 encode()是将Unicode转化为str Unicode也被称为万国码,兼容性特别强,支持utf-8.gbk.ASCII等字符集,可以实现互相转换   UTF-8字符集:一个英文占1个字节,一个汉字占3个字节

python字符串编码转换

假设读者已经了解了什么叫字符集,什么叫编码,什么叫解码. 首先要明确,虽然有三种前缀(无前缀,前缀u,前缀b),但是字符串的类型只有两种(str,bytes),实验如下:               根据程序以及以上运行结果,发现无前缀,和前缀u,构造出来的字符串常量,是一样的. 类型一样是str,长度一样是3,==判断也是返回true.is判断也是返回true. 其实,这里是因为,python3中,字符串的存储方式都是以Unicode字符来存储的,所以前缀带不带u,其实都一样. 结论:字符串常

python 字符串编码转换

import chardetdef CheckCode(filename): adchar=chardet.detect(filename) if adchar['encoding']=='utf-8': filename=filename.decode('utf-8') else: filename=filename.decode('gbk') return filename

python 字符编码转换

>>> a = u'\xb2\xe2\xca\xd4' >>> b = a.encode('raw_unicode_escape') >>> print b 测试 >>> c = a.encode('latin1') >>> print c 测试 unicode.encode(text, encoding='utf-8') decode('unicode-escape') 原文地址:https://www.cnblo

19.python的编码问题

在正式说明之前,先给大家一个参考资料:戳这里 文章的内容参考了这篇资料,并加以总结,为了避免我总结的不够完善,或者说出现什么错误的地方,有疑问的地方大家可以看看上面那篇文章. 下面开始讲python中的编码问题,首先,我们看看编码有哪些. 1. ASCII ASCII是用一个字节表示字符,而一个字节由八位二进制组成,所以能产生2**8=256种变化,在计算机刚诞生的年代,用来表示大小写的26个英文字母,外加一些符号之类的还是绰绰有余的.这也是python2.x中默认使用的编码,所以在python

多线程批量转换文件编码, 从GBK, GB2312编码转换到UTF-8编码(Python)

# coding=utf-8 # author:Jeffrey Ma # version:0.1 # build 2 # created on:2015年3月31日 # description: 1. 批量转换文件编码,从GBK GB2312编码转换到UTF-8编码 # 2. 支持指定目录下所有的文件的转换,包括子目录中的文件 # 3. 支持检测原始编码,对已经是UTF-8编码的文件,不做转换 # 4. 支持只转换指定扩展名的编码 # 5. 支持多线程转换和控制台输出 # 6. 支持控制台显示线

python基础 字符编码转换

python2 1 #python2上所有的字符编码都需要先decode到unicode,再从unicode encode到目标编码 2 str_utf8 = "我就是我" 3 print("str_utf-8:我就是我:",str_utf8) 4 #将utf-8转换为unicode 5 str_utf8_to_unicode = str_utf8.decode("utf-8") 6 print(str_utf8_to_unicode) 7 #将