3.Arm机器码

首先汇编程序转化为机器码,才能在机器内运行。

首先我们对上面的裸机的代码中生的.elf文件进行反汇编:

start.elf: file format elf32-littlearm

?

Disassembly of section .text:

?

50008000 <_start>:

.text

.global _start

_start:

[email protected]和str的操作

????mov r0,#0xff

50008000:????e3a000ff ????mov????r0, #255????; 0xff

????str r0,[r1]

50008004:????e5810000 ????str????r0, [r1]

????ldr r2,[r1]

50008008:????e5912000 ????ldr????r2, [r1]

[email protected]程序状态字寄存器访问

????mrs r0,cpsr

5000800c:????e10f0000 ????mrs????r0, CPSR

????orr r0,#0b100

50008010:????e3800004 ????orr????r0, r0, #4????; 0x4

????msr cpsr,r0

50008014:????e129f000 ????msr????CPSR_fc, r0

[email protected]:循环右移

????mov r1,#0b11

50008018:????e3a01003 ????mov????r1, #3????; 0x3

????mov r1,r1,ror#1

5000801c:????e1a010e1 ????ror????r1, r1, #1

[email protected]:左移

????mov r1,#0b11

50008020:????e3a01003 ????mov????r1, #3????; 0x3

????mov r1,r1,lsl#2

50008024:????e1a01101 ????lsl????r1, r1, #2

[email protected]指令:带链接跳转

????bl func1

50008028:????eb000005 ????bl????50008044 <func1>

[email protected]指令:

????mov r1,#6

5000802c:????e3a01006 ????mov????r1, #6????; 0x6

????mov r2,#7

50008030:????e3a02007 ????mov????r2, #7????; 0x7

????cmp r1,r2

50008034:????e1510002 ????cmp????r1, r2

????bgt [email protected]表示大于的时候跳转

50008038:????ca000003 ????bgt????5000804c <branch1>

????add r3,r1,r2

5000803c:????e0813002 ????add????r3, r1, r2

????b end

50008040:????ea000002 ????b????50008050 <end>

?

50008044 <func1>:

func1:

????mov r1,#23

50008044:????e3a01017 ????mov????r1, #23????; 0x17

????mov pc,[email protected]函数的返回,固定格式。

50008048:????e1a0f00e ????mov????pc, lr

?

5000804c <branch1>:

?

branch1:

????sub r3,r1,r2

5000804c:????e0413002 ????sub????r3, r1, r2

?

50008050 <end>:

end:

????nop

50008050:????e1a00000 ????nop????????????(mov r0,r0)

[email protected]指令:

????mov r1,#0b101

50008054:????e3a01005 ????mov????r1, #5????; 0x5

????tst r1,#0b01

50008058:????e3110001 ????tst????r1, #1????; 0x1

?

????mov r1,#0b101

5000805c:????e3a01005 ????mov????r1, #5????; 0x5

????tst r1,#0b10

50008060:????e3110002 ????tst????r1, #2????; 0x2

[email protected]指令的操作:

????mov r1,#2

50008064:????e3a01002 ????mov????r1, #2????; 0x2

????cmp r1,#1

50008068:????e3510001 ????cmp????r1, #1????; 0x1

?

????mov r1,#2

5000806c:????e3a01002 ????mov????r1, #2????; 0x2

????cmp r1,#3

50008070:????e3510003 ????cmp????r1, #3????; 0x3

?

????mov r1,#2

50008074:????e3a01002 ????mov????r1, #2????; 0x2

????cmp r1,#2

50008078:????e3510002 ????cmp????r1, #2????; 0x2

[email protected]:位清除指令

????mov r1,#0b1101011

5000807c:????e3a0106b ????mov????r1, #107????; 0x6b

????bic r2,r1,#0b1000011

50008080:????e3c12043 ????bic????r2, r1, #67????; 0x43

[email protected]的用法:逻辑与

????mov r1,#5

50008084:????e3a01005 ????mov????r1, #5????; 0x5

????and r2,r1,#0

50008088:????e2012000 ????and????r2, r1, #0????; 0x0

?

????mov r1,#5

5000808c:????e3a01005 ????mov????r1, #5????; 0x5

????and r2,r1,#1

50008090:????e2012001 ????and????r2, r1, #1????; 0x1

[email protected]:加法:

????add r1,r0,r2

50008094:????e0801002 ????add????r1, r0, r2

[email protected]:减法,注意被减数不能是立即数

????mov r2,#4

50008098:????e3a02004 ????mov????r2, #4????; 0x4

????sub r0,r2,#2

5000809c:????e2420002 ????sub????r0, r2, #2????; 0x2

????mov r1,#3

500080a0:????e3a01003 ????mov????r1, #3????; 0x3

????sub r3,r1,r0

500080a4:????e0413000 ????sub????r3, r1, r0

[email protected]这是注释,mov指令

????mov r1,#6

500080a8:????e3a01006 ????mov????r1, #6????; 0x6

????mov r2,r1

500080ac:????e1a02001 ????mov????r2, r1

????mov r3,#10

500080b0:????e3a0300a ????mov????r3, #10????; 0xa

[email protected]:传值取反的值

????mvn r0,#4 @r0:4取反变为-5

500080b4:????e3e00004 ????mvn????r0, #4????; 0x4

????mvn r1,#0b111000

500080b8:????e3e01038 ????mvn????r1, #56????; 0x38

????mvn r2,r1 @r2:0b111000

500080bc:????e1e02001 ????mvn????r2, r1

Disassembly of section .ARM.attributes:

?

00000000 <.ARM.attributes>:

0:????00001741 ????andeq????r1, r0, r1, asr #14

4:????61656100 ????cmnvs????r5, r0, lsl #2

8:????01006962 ????tsteq????r0, r2, ror #18

c:????0000000d ????andeq????r0, r0, sp

10:????00543405 ????subseq????r3, r4, r5, lsl #8

14:????01080206 ????tsteq????r8, r6, lsl #4

Disassembly of section .debug_line:

?

00000000 <.debug_line>:

0:????00000060 ????andeq????r0, r0, r0, rrx

4:????001e0002 ????andseq????r0, lr, r2

8:????01020000 ????tsteq????r2, r0

c:????000d0efb ????strdeq????r0, [sp], -fp

10:????01010101 ????tsteq????r1, r1, lsl #2

14:????01000000 ????tsteq????r0, r0

18:????00010000 ????andeq????r0, r1, r0

1c:????72617473 ????rsbvc????r7, r1, #1929379840????; 0x73000000

20:????00532e74 ????subseq????r2, r3, r4, ror lr

24:????00000000 ????andeq????r0, r0, r0

28:????00020500 ????andeq????r0, r2, r0, lsl #10

2c:????16500080 ????ldrbne????r0, [r0], -r0, lsl #1

30:????2f302f2f ????svccs????0x00302f2f

34:????302f302f ????eorcc????r3, pc, pc, lsr #32

38:????2f30302f ????svccs????0x0030302f

3c:????2f2f2f2f ????svccs????0x002f2f2f

40:????30312f30 ????eorscc????r2, r1, r0, lsr pc

44:????2f302f30 ????svccs????0x00302f30

48:????2f302f30 ????svccs????0x00302f30

4c:????2f302f30 ????svccs????0x00302f30

50:????2f302f30 ????svccs????0x00302f30

54:????2f2f3030 ????svccs????0x002f3030

58:????2f2f302f ????svccs????0x002f302f

5c:????022f2f30 ????eoreq????r2, pc, #192????; 0xc0

60:????01010002 ????tsteq????r1, r2

Disassembly of section .debug_info:

?

00000000 <.debug_info>:

0:????00000045 ????andeq????r0, r0, r5, asr #32

4:????00000002 ????andeq????r0, r0, r2

8:????01040000 ????tsteq????r4, r0

c:????00000000 ????andeq????r0, r0, r0

10:????50008000 ????andpl????r8, r0, r0

14:????500080c0 ????andpl????r8, r0, r0, asr #1

18:????72617473 ????rsbvc????r7, r1, #1929379840????; 0x73000000

1c:????00532e74 ????subseq????r2, r3, r4, ror lr

20:????6d6f682f ????stclvs????8, cr6, [pc, #-188]!

24:????61732f65 ????cmnvs????r3, r5, ror #30

28:????2f61626d ????svccs????0x0061626d

2c:????6a6f756c ????bvs????1bdd5e4 <_start-0x4e42aa1c>

30:????61702f69 ????cmnvs????r0, r9, ror #30

34:????00317472 ????eorseq????r7, r1, r2, ror r4

38:????20554e47 ????subscs????r4, r5, r7, asr #28

3c:????32205341 ????eorcc????r5, r0, #67108865????; 0x4000001

40:????2e38312e ????rsfcsep????f3, f0, #0.5

44:????01003035 ????tsteq????r0, r5, lsr r0

48:????Address 0x00000048 is out of bounds.

?

Disassembly of section .debug_abbrev:

?

00000000 <.debug_abbrev>:

0:????10001101 ????andne????r1, r0, r1, lsl #2

4:????12011106 ????andne????r1, r1, #-2147483647????; 0x80000001

8:????1b080301 ????blne????200c14 <_start-0x4fe073ec>

c:????13082508 ????movwne????r2, #34056????; 0x8508

10:????00000005 ????andeq????r0, r0, r5

Disassembly of section .debug_aranges:

?

00000000 <.debug_aranges>:

0:????0000001c ????andeq????r0, r0, ip, lsl r0

4:????00000002 ????andeq????r0, r0, r2

8:????00040000 ????andeq????r0, r4, r0

c:????00000000 ????andeq????r0, r0, r0

10:????50008000 ????andpl????r8, r0, r0

14:????000000c0 ????andeq????r0, r0, r0, asr #1

????...

我们从上面的反汇编的代码看到,在内存地址的后面有一串数字,这就是机器码。

接下来我们打开我们的ARM Architecture Reference Manual.pdf。这是一份很重要的资料。在第三章的第一节:

上面就是机器码的格式了。下面是31~28四位是条件信息:

Opcode指令类型的信息:21~14位:

下面我们就以mov指令为例,来讲他的机器码的内容。就是他对应的机器码:

这里我们一下面两条代码:

为例:指令的详解

首先是反汇编:如下:

?

我们通过转变:

Mov r0,r1的机器码0xe1a00001= 0b 1110 00 0 1101 0 0000 0000 000000000001

Moveq r0,0xff的机器码0x03a000ff=0b 0000 00 1 1101 0 0000 0000 000011111111

上面就是两个指令对应的机器码:

下面是mov机器码的格式:

我们在上面的机器码分析中知道,后12位是表示数的大小的。可是只有8位2进制数大小,前面四位是移位信息位。所以表示的数最大0xff。当我们把他改为0x1ff的时候会报错:

这就是下来要学习的了:伪指令。

伪指令

2.伪指令定义:

????伪/指令本身并没有所对应的机器码,它只是在编译的时候起作用,或者转化为其他的实际指令来运行。

?

指令看似该指令执行了操作,其实他不会产生机器码。伪指令的作用:1、它只是在编译的时候起作用,就像我们在C语言用#define定义一个宏一样,只是在编译的时候起作用。

2、能够起到操作的作用,是转为其他指令运行。

一、定义类伪指令:

Global:定义一个全局的符号。

Data:定义数据段。数据存到数据段。

Ascii:字符串

Byte:字节

Word:字

Equ:相当于宏定义

Align:设置对齐。

?

代码:

?

?

?

?

编译的截图:

上图知道:data的起始地址是500080c8:往下内容:

?

上面可以看到,我们的数据已经存进了数据段了。以后,我们就可以通过标号访问数据段的数据了。

Equ:宏定义伪指令

上面可以看到r0是0x89,宏定义成功。

?

?

?

?

?

?

?

Align的例子:

我们从上面的例子知道,bh标号处的地址是500080d3,是没有四字节对齐的。现在我们设置他四字节对齐:

设置后的地址变成500080e0是能被四整除的,是四字节对齐。

  1. 操作类伪指令:

    Ldr的例子:

    运行结果:

    由于伪指令是转为实际的指令执行的呢?

    反汇编看看:

    他是转化为实际的ldr存储器指令运行的。

    Nop的例子:是空操作是延时的作用。

    反汇编:

    实际的操作是mov r0,r0的操作,没有什么意义,只是延时操作。

    反汇编的命令:

    arm-linux-objdump -D -S start.elf

    查看信息:

    arm-linux-readelf -a start.elf

时间: 2025-02-01 15:40:27

3.Arm机器码的相关文章

ARM机器码分析

我们编写的汇编程序还是不够底层,CPU都是对机器码进行操作的,所以还需要用汇编器将汇编代码转换成机器码才能被CPU处理.下面举几个例子来说说分析ARM机器码的方法. 对编译连接之后得到的ELF进行反汇编:arm-linux-objdump 查看得到的反汇编代码.这里如果想同时看到汇编代码和机器码,在编译的时候需要加上-g调试选项. 1.mov r1,#0xff  1110 00 1 1101 0 0000 0001 000011111111 前者是汇编代码,后者是其对应的机器码.用第一个例子具体

12.ARM伪指令操作

12.ARM伪指令操作 首先ARM伪指令包括: ARM机器码 定义类伪指令 操作类伪指令 ? ARM机器码: 其实任何一种处理器可以运行的叫机器码,机器码是从汇编程序通过汇编器转换来的.接下来看看机器码的信息.流程:图1-1. 图1-1 在上一节里,建立好了一个简单的汇编工程,在start.S只有三行代码:图1-2: 图1-2 接下来对产生的elf文件来进行反汇编,命令是: arm-linux-objdump -D -S gboot.elf >dump,将反汇编的代码存到dump文件,dump文

arm指令bne.w改成b,即无条件跳转

近期逆向一个程序,需要把bne.w改成b,无条件跳转.由于ios逆向不像pc上,可以在od里直接改汇编指令,这篇文章给了我很大的帮助.通过memory write 修改后,验证可行后,再用ultraedit修改二进制文件,保存可执行程序.再拷贝到ios设备,即可. 文章出处:http://blog.chinaunix.net/uid-22915173-id-225005.html ARM中的常用指令含义ADD 加指令SUB 减指令STR    把寄存器内容存到栈上去LDR    把栈上内容载入一

Part3_lesson3---ARM伪指令学习

1.ARM机器码 对elf格式的文件进行反汇编可得到相应汇编文件的机器码: arm-linux-objdump -D -S start.elf 机器码的解析,可以参考文件ARM Architecture Reference Manual的The ARM Instruction Set章节. 2.定义类伪指令 伪指令前面加上"."号是GNU的一个特点!! .global:标明一个全局的符号. .data:标明接下来的数据会存放到数据段里面去.即,这是一个数据段. 那么在数据段当中能够定义

arm跳转指令对应的机器码

ARM: 常见跳转指令机器码: B:0xEA BL:0xEB 偏移地址计算过程: (目标地址 - 指令地址 - 8)/ 4 = 偏移 // 减8,指令流水造成. // 除4,因为指令定长,存储指令个数差,而不是地址差. 完整指令: 假设上一步得到的偏移为0x00000C 跳转指令为:B 则完整指令为:0C 00 00 EA THUMB: Thumb指令都是2字节.BL看起来像4字节指令,其实是一个误解,因为长跳转是由两条跳转指令组成的. 0~11位表示11位地址,具体含义如下: 第11位为0,偏

ARM汇编指令集1

(汇编)指令是CPU机器指令的助记符,经过编译过会得到一串0011组成的机器码,可以由CPU读取执行. (汇编)伪指令本质不是指令(只是和指令一起写在代码中),它是编译器环境提供的,目的是用来指导编译过程,经过编译后伪指令最终不会生成机器码. 两种不同风格的ARM指令 --ARM官方的ARM汇编风格:指令一般用大写,Windows中的IDE开发环境(如ADS.MDK)常用.如:LDR  R0,[R1] --GNU风格的ARM汇编:指令一般用小写字母.Linux中常用.如:ldr  r0,[r1]

ARM中跳转指令BL/BLX偏移值计算规则

4字节对齐arm指令 ????规则:偏移=( 跳转地址-(指令地址+8) )/4 原因: 指令地址 + 8:因为ARM的流水线使得指令执行到当前指令处时,PC实际的值是A+8. 跳转指令 - 上一步得到地址:得到跳转指令与当前PC处的差值. ÷4:因为ARM的指令是4对齐的,即最低两位为00,于是将这个值右移两位. ? 执行时: 取出偏移,左移两位,加入PC,这时PC的值刚好为目标处的地址值,即目标地址指令进入取值,流水线前两级被清空. ? 实例测试: .text:0000126C 90 00

浅析 Linux 下的 arm 交叉编译工具

什么是交叉编译工具 http://elinux.org/Toolchains 要解释交叉编译工具,我们首先要理解三个基本概念: 编译平台:是指该编译器是在哪个平台编译出来的 编译主机:编译器运行在哪个平台 目标平台:编译器为哪个平台产生代码 比如我们在 Ubuntu(Linux) 下编译 arm 开发板的程序,那么: 编译平台就是 X86,该编译器在 x86上运行 编译主机就是这台运行 Ubuntu Linux 的电脑 目标平台就是 arm 开发板 所以通常所指的交叉编译,就是在该平台编译生成在

ARM指令集——跳转指令

ARM 汇编指令条件执行 在ARM模式下,任何一条数据处理指令可以选择是否根据操作的结果来更新CPSR寄存器中的ALU状态标志位.在数据处理指令中使用S后缀来实现该功能. 不要在CMP,CMN,TST或者TEQ指令中使用S后缀.这些比较指令总是会更新标志位. 在Thumb模式下,所有数据处理指令都更新CPSR中的标志位.有一个例外就是:当一个或更多个高寄存器被用在MOV和ADD指令时,此时MOV和ADD不能更新状态标志. 几乎所有的ARM指令都可以根据CPSR中的ALU状态标志位来条件执行.参见