iOS逆向工程之Hopper中的ARM指令

发布时间:2020-06-13 09:50:52 作者:zsdnr
来源:网络 阅读:539

一、Hopper中的ARM指令

ARM处理器就不多说了,ARM处理器因为低功耗等原因,所以大部分移动设备上用的基本上都是ARM架构的处理器。当然作为移动设备的Android手机,iPhone也是用的ARM架构的处理器。如果你想对iOS系统以及你的应用进一步的了解,那么对ARM指令集的了解是必不可少的,ARM指令集应该也算得上是iOS逆向工程的基础了。

当你使用Hopper进行反编译时,里边全是ARM的指令,那是看的一个爽呢。下面就是使用Hopper打开MobileNote.app的一个Hopper的界面。从主窗口中可以看到全是ARM的指令呢,如果你对ARM指令不了解,那么如何进行分析呢,对吧。所以对ARM指令的了解,是iOS逆向工程的基础呢。今天这篇博客就总结一下ARM指令集的基础指令。

  iOS逆向工程之Hopper中的ARM指令

 

Hopper的功能是非常强大的,在Hopper中你可以对ARM指令进行修改,并且生成一个新的可执行文件。当然Hopper强大的功能可以帮助你更好的理解ARM汇编语言的业务逻辑,Hopper会根据ARM汇编生成相关的逻辑图,如下所示。从下方的逻辑图中你就能清楚的看到相关ARM汇编的指令逻辑。红线表明条件不成立时的跳转,蓝线则表明条件成立时的跳转。

  iOS逆向工程之Hopper中的ARM指令

 

Hopper的功能强大到可以将ARM汇编生成相应的伪代码,如果你看ARM指令不直观的话,那么伪代码对你来说会更好一些。下方就是Hopper根据ARM指令生成的伪代码,如下所示。

  iOS逆向工程之Hopper中的ARM指令

貌似有点跑偏了,今天的主题是ARM指令集,Hopper的东西就不做过多赘述了。

 

二、ARM指令集综述

ARM指令主要是对寄存器,栈、内存的操作。寄存器位于CPU中,个数少速度快,ARM指令集中大部分指令都是对寄存器操作,但有些指令是对栈和内存的操作。下方会对操作栈、寄存器以及内存的指令进行介绍。

 

1.栈操作---- push 与pop

先简单的聊一下栈的概念,“栈”说白了就是数据结构的一种,栈的数据结构具有LIFO(last in first out) ---- 后进先出的特点。栈在ARM中所指的其实是一块具有栈数据结构特点内存区。栈中主要用来暂存寄存器中的值得,比如R0寄存器正在使呢,可是现在有一个优先级比较高的函数要使用R0, 那么就先把R0的值Push到栈中暂存,然后等R0被优先级更高的函数使用完毕后在从栈中Pop出之前的值。在函数调用时一般会对栈进行操作。

对栈操作的命令就是push和pop了,一般会成对出现,在函数开始时将该函数执行时要使用的寄存器中的值push入栈,然后在函数结束时将之前push到栈中的值在pop到相应的寄存器中。

下方就是push和pop的用法的一个实例。在下方函数开始执行前,将该函数要使用的寄存器r4, r5, r7, lr使用push进行入栈操作,lr是该函数执行后要返回的地址。在函数执行完毕后,使用pop命令将函数执行前入栈的值在pop到相应的寄存器中。有一点需要注意的是将lr寄存器中的值在函数结束后pop到pc (Program Counter)寄存器中,pc寄存器中存储的是将要执行的命令的地址。这样一来,函数执行后就会返回到之前执行的地址上继续执行。

  iOS逆向工程之Hopper中的ARM指令

 

2. pc寄存器中的中的标志位

此处我们以32位指令为例,pc寄存器中的后四位是标志位,第28 - 31位分别对应着V (oVerflow),C (Carry),Z (Zero),N (Negative)。下面分别来介绍一下这四种符号所表示的状态。

 

3. 命令操作符

下方是ARM指令集中常用的算术操作:

(1)加法操作

     iOS逆向工程之Hopper中的ARM指令

(2)减法操作

    iOS逆向工程之Hopper中的ARM指令 

(3)、乘法指令

在ARM指令集中,乘法指令有两种第一个是MUL, 第二个是带累加的乘法MLA。当然,这两个指令使用起来都不复杂。

 

(4)、逻辑操作

逻辑操作比较好理解一些,与我们编程中使用的逻辑操作大同小异,无非是一些与、或、非、异或这些操作。

 

4、寄存器的装载和存储

有时我们需要将内存中的数据装载到寄存器中进行操作,或者将寄存器中运算后的数据存储到内存中,此时我们就会用到寄存器的装载和存储的相关命令。下方就一一的总结了这些命令。

(1)、传送单一数据

LDR{条件} Rd, <地址>   ;将地址中的数据加载到Rd寄存器中

STR{条件} Rd, <地址>   ;将寄存器Rd中的数值存储到<地址>中的内存中

LDR{条件}B  Rd, <地址>   ;将内存地址所对应值得低8位加载到Rd的寄存器中。

STR{条件}B  Rd, <地址>   ;将寄存器Rd的后8为存的到内存地址中。

 

 

(2)、一次传送两个数据

 

 

(3)、块数据存取 

 

(4)、单一数据交换:SWP

SWP命令用来交换寄存器与内存直接的值,下方是SWP的指令格式:

SWP{条件}{B} Rd, Rm, [Rn]

上述命令表示将Rn中内存地址所指向内存中的数据加载到Rd中,然后将寄存器Rm中的值存储到该内存地址指向的区域中。如果Rd = Rm, 那么Rn指向的内存中的值就会与Rd进行交换。如果加上条件后缀的话,就说明在满足该条件时进行操作,后缀B则是操作低8位。

 

5、比较、分支与条件指令

分支与条件指令是编程中不可或缺的指令,在处理一些特定的业务逻辑时会经常使用到分支与条件指令。分支说白了就是跳转,而分支与条件结合使用就是当满足一定条件后进行特定的跳转。接下来,将总结一下ARM指令集中常用的分支指令与条件指令,更确切的说是条件后缀。

(1)、比较指令

在ARM指令集中使用到的比较指令有CMN、CMP、TEQ、TST。有一点需要注意的是CMN与CMP是算术指令,TEQ和TST属于逻辑指令。比较指令在执行后总是会设置标志位(N、Z、C、V), 因为条件后缀是根据被设置的标志位来判断比较结果是否满足条件的。下方会给出详细的条件后缀。比较命令后方也是可以添加条件后缀的。

(2)、分支指令

常用的分支指令是B、BL、BX这三个指令。

 

(3)、条件后缀

上述的分支指令与条件后缀结合才能发挥其强大的功能和作用,解析这部分介绍的是就是我们的条件后缀。条件后缀不能单独的使用,要和其他命令一块结合使用,然后根据条件的结果来做一些操作。下方是所有条件后缀,条件是否成立是根据NZCV这四个标志位来判断的,因为我们在对一些数值进行比较时,会设置相应的标志位。然后我们就可以使用这些标志位来判断条件是否成立。NZCV就是我们之前所提到的几个标志位,Z(是否为零), C(是否进位), N(是否为负), V(是否溢出)四种标准位来判断的。

 

6. 移位操作(LSL、ASL、LSR、ASR、ROR、RRX)

移位操作在ARM指令集中不作为单独的命令使用,它在指令格式中是一个字段。接下来将会介绍一下各种移位操作。如果你之前学过“数字电路”这门课的话,那么你肯定对这些移位操作并不陌生。

(1)、LSL ---- 逻辑左移(Logical Shift Left)与 ASL ---- 算术左移 (Arithmetic Shift Left)

逻辑左移与算术左移的操作是一样的,都是将操作数向左移位,低位补零,移除的高位进行丢弃。接下来我们来看一个示例,根据这个示例来看一下LSL或者ASL的工作方式。

MOV  R0, #5

MOV  R1, R0, LSL #2

上述命令,就是将5存储到R0寄存器上(R0 = 5), 然后将R0逻辑左移2位后传送到R1寄存器中。十进制5的二进制数值是0101,进行逻辑左移2位就是0001_0100, 也就是十进制中的20。其实没逻辑左移1位就相当于原数值进行乘2操作,5逻辑左移2位其实就是5 x 2^2 = 20。下方是该操作的原理图

  iOS逆向工程之Hopper中的ARM指令

 

(2)、LSR ---- 逻辑右移(Logical Shift Right)

逻辑右移与逻辑左移是相对的,逻辑右移其实就是往右移位,左边补零。用法与LSL类似,在此就不做过多赘述了。

 

(3)、ASR ---- 算术右移(Arithmetic Shift Right)

ASR与LSR类似,唯一不同的是,LSR的高位补零,而ASR的高位补符号位。符号位为1,那么就补1,符号位为0那么就补零。

 

(4)、ROR ---- 循环右移(Rotate Right)

循环右移,见名知意,就是循环着往右移动,右边移除的位往高位进行填补。


推荐阅读:
  1. ARM体系结构与常用汇编指令是什么
  2. ARM cortex a 之串口通信2

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

工程 pp

上一篇:python的列表学习

下一篇:DataTable常识[.NET Framework 2.0]

相关阅读

您好,登录后才能下订单哦!

密码登录
登录注册
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》