Python 控制流代码混淆简介,加大别人分析你代码逻辑和流程难度

前言

文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。

作者: 王平

PS:如有需要Python学习资料的小伙伴可以加点击下方链接自行获取http://t.cn/A6Zvjdun

聊下 Python 的代码混淆,对 Python 的代码做混淆感觉是不伦不类,但是对于外包项目交付型的,又有一些需要。

混淆的目的就是加大别人分析你代码逻辑和流程的难度,让代码看上去杂乱,逻辑混乱。但是程序要能正常运行。

一般混淆

对 Python 代码做简单点混淆的就是变量名/类名/字符串/常量做混淆,把名称变成很长或者近似。

这类的混淆库很多,比如 Intensio-Obfuscator 这个库,这个库分简单和复杂混淆,来看下用它的简单模式来混淆 Python 代码:

左边是混淆前,右边是混淆后,只是把变量名方法名混淆并且加长了。

这种简单混淆的意义不大,字符串和常量都一目了然,代码结构,就靠静态分析,代码的脉络也看得还是清楚。

再复杂一点的混淆就是把关键代码藏起来,和在代码里加一些无效代码。

还是 Intensio-Obfuscator 这个库的复杂混淆模式,我们来看看:

右边初看,貌似不像是 Python 代码,实际上右边那串字符串就是左边的 Python 代码,只不过是 unicode 码。 因为 Python 有个内置函数 exec() 可以执行字符串程序,像这样:

>> exec("1+1")>> 2

我们把这个字符串里的内容打印成 utf8 看看里面的内容:

如上图,它的混淆一是把变量名做得更长,二是代码里加了些干扰代码,看标红处,原始代码本来没有 for 和 if 语句,混淆后的代码有了。看上去如果要静态分析这个代码很困难了,实际如果把变量名重名命和变短后,这部分多余的 for 和 if 通过静态分析,还是较容易跳过去。

总结下 Intensio-Obfuscator 库复杂混淆模式,先是把代码变量函数名弄得很长,然后是在代码里加入了无效代码,最后是把源代码压缩当成一个字符串,用 exec 来执行。

抽象语法树混淆

上面的混淆方式相对简单,通过静态分析就能反混淆出来。更复杂一点的混淆就是控制流混淆。通常程序的执行流程都是很有条理的,控制流混淆就是把程序的执行流程混淆。

比如代码里多了很多 while for if 乃至 lamdb 语句,把赋值,加减操作,变成位运算等等。让你通过静态分析的方式,很难看出代码的目的和逻辑是什么。

怎么做到控制流混淆,要通过抽象语法树 (AST),通过抽象语法树,可以做到用程序来修改程序。通过抽象语法树,可以很精确的知道程序在做什么操作,这样就能很精准的修改代码。

先看一下简单的通过抽象语法树来混淆程序的例子,还是拿上面的程序来举例。

左边是混淆前的代码,后面是混淆后的。这个例子也是把变量名混淆了,然后是把字符串和常量,还有 import 也混淆了。反混淆的难度比上面大了一点,要通过动态调试才知道程序在干嘛。

什么是抽象语法树

见名知意就是把程序抽象成一棵树,代码里的语句被拆成了树上的一个个节点。Python 里有个 AST 模块就是用来干这个的,还是上面的源代码,看下被 AST 拆成节点后是什么样。

第二张图就是把第一张图创建为了抽象语法树,并且把源代码按树的节点打印出来了。

红箭头标注了,有 Import 节点,Assign 节点, 函数节点, 加法节点等等。这颗树可以完全表达上述程序。我们可以通过访问这颗树,来用程序修改程序。

自定义一个类,继承 ast.NodeTransformer ,比如你想访问字符串,就实现visit_Str这个方法,想访问 Import 就实现 visit_ImportFrom 这个方法。在实现的方法里,你可以用一些混淆算法去混淆,(注意只能是混淆,不能改变结果)。这样就能做到精细化和更复杂的混淆。

有一个 ASTObfuscate 第三方混淆库就是通过操作 AST 来混淆代码,不过对程序逻辑流的混淆没有,要实现更复杂的控制流混淆,要完整实现这颗解析树。

当然 Python 的代码混淆更难的话,应该是通过混淆字节码,或者把关键代码做成 so 文件,这样的混淆难度更大。 字节码和 so 文件都是汇编指令。

如果你处于想学Python或者正在学习Python,Python的教程不少了吧,但是是最新的吗?说不定你学了可能是两年前人家就学过的内容,在这小编分享一波2020最新的Python教程。获取方式,私信小编 “ 资料 ”,即可免费获取哦!

原文地址:https://www.cnblogs.com/python0921/p/12694280.html

时间: 2025-01-12 04:47:25

Python 控制流代码混淆简介,加大别人分析你代码逻辑和流程难度的相关文章

御安全浅析安卓开发代码混淆技术

御安全浅析安卓开发代码混淆技术[关键词:代码混淆,Android应用加固,移动应用保护,APP保护,御安全] 提高native代码的安全性有什么好办法吗?答案是肯定的,今天我们就来介绍一种有效对抗native层代码分析的方法--代码混淆技术.随着移动互联网的快速发展,应用的安全问题不断涌现出来,于是越来越多的应用开发者将核心代码由java层转到native层,以对抗成熟的java逆向分析工具,然而如果native层的代码如果没有进行任何保护,还是比较容易被逆向分析工作者获取其运行逻辑,进而完成应

Android代码混淆防反编译解决方案研究

做Android开发的都知道要做混淆去防apk被反编译.破解,通过proguard进行Java代码混淆.但是,Android代码混淆真的能起到实质性的作用吗?看下面分析 1.Android代码混淆 如上图,对Android 代码进行混淆后混淆器将代码中的所有变量.函数.类的名称加密为简短的英文字母代号,在APP被破解后增加破解者对代码的阅读难度. 但是混淆的功效只能运作在APP已经被破解后,而且只是增加破解者的难度时间,对其防止破解的作用意义不是很大. 那么,Android代码混淆不能从根本上防

代码混淆

拷贝上面图片中的文件到工程中, 默认四大组件和自定义控件不会被混淆,如果想不混淆(保持不变)某个包名下面的bean类,就可以按照下面的代码混淆 打包apk之前必须进行代码混淆 混淆代码的步骤 1.找到proguard-android.txt文件放到工程的根目录下 sdk\tools\proguard 2.将工程的project.properties的代码放开 proguard.config=proguard-android.txt:proguard-project.txt 3.避免混淆,prog

代码混淆之道——控制流扁平与不透明谓词理论篇

控制流是指代码执行时指令的执行顺序.在各种控制逻辑的作用下,程序会沿着特定的逻辑顺序执行.一般控制逻辑包括有无条件分支.循环.函数调用等. 本文原创作者:i春秋签约作家--penguin_wwy 一.扁平化的定义 本篇讲代码混淆的一个重要手段,控制流扁平化. 所谓控制流是指代码执行时指令的执行顺序.在各种控制逻辑的作用下,程序会沿着特定的逻辑顺序执行.一般控制逻辑包括有\无条件分支.循环.函数调用等.在正常情况下程序的逻辑非常好理解(代码逻辑不好的程序员都死了...),开发过程中有各种人为的行为

Python,django:用line_profiler工具分析代码的性能

昨天下班前写了一段后端程序,然后运行后,发现网页打开速度有点慢,不太理想(因为要去后台数据库进行大量数据查询,而且还要进行运算,所以速度有点慢),然后想到有没有专业的工具对代码块进行性能分析呢?之前一直都是用datetime模块来分析,实例如下: #coding=utf-8 import datetime def f(x,y):     t1 = datetime.datetime.now()     a = x + y     t2 = datetime.datetime.now()     

Python 代码混淆和不可告人的加密技术!

Python进行商业开发时, 需要有一定的安全意识, 为了不被轻易的逆向. 混淆和加密就有所必要了. 混淆 为了增加代码阅读的难度, 源代码的混淆非常必要, 一个在线的Python代码混淆网站. http://pyob.oxyry.com/ 同时需要注意的是, 这个混淆其实还是被很多人怀疑的, 因为即使混淆了, 也没有改变代码的结构. 这种方法只能"防君子,不防小人" 所以, 必要的话, 在编程的时候, 可以故意做点提高逆向难度的事情: 结构稍微改变, 合并几个类到同一个文件. 面向对

Python 代码混淆和加密技术

动机 Python进行商业开发时, 需要有一定的安全意识, 为了不被轻易的逆向. 混淆和加密就有所必要了. 混淆 为了增加代码阅读的难度, 源代码的混淆非常必要, 一个在线的Python代码混淆网站. http://pyob.oxyry.com/ 同时需要注意的是, 这个混淆其实还是被很多人怀疑的, 因为即使混淆了, 也没有改变代码的结构. 这种方法只能”防君子,不防小人“ 所以, 必要的话, 在编程的时候, 可以故意做点提高逆向难度的事情: 结构稍微改变, 合并几个类到同一个文件. 面向对象的

Android代码混淆技术

Android混淆是Android开发者经常使用的一种用于防止被反编译的常见手法.Android开发基于java语言的,很容易被别人反编译出来,一下就相当于裸奔了,特别是用于商业用途的时候,防止反编译是必要的措施.而Android混淆的确可以保证Android源代码的一定安全. Android混淆技术 Java类名.方法名混淆 Dalvik字节码包含了大量的调试信息,如类名.方法名.字段名.参数名.变量名等,使用反编译工具可以还原这些信息.由于类名.方法名等通常都会遵循一定的命名规范,破解者很容

计算机科学及编程导论(7)数组及可变性、字典、伪代码,代码运行效率简介

1. 数组及可变性 当创建一个数组的时候,它将与一个对象进行绑定 L1 = [1, 2, 3] L2 = L1 L1[0] = 4 print(L2)#=>[4, 2, 3] L2 = L1 意味着L2与L1指向同一个对象,而L1[0]=4则改变了对象的值,所以最终L2的值也会改变,可以与下面这个例子进行比较 a = 1 #a指向对象1 b = a #b指向对象a a = 4 #此时a指向了对象4 print(b) #=>1,由于b依旧指向对象1,所以没有发生变化 2.字典 字典包括了以下几个