2-函数的本质

002–函数本质

##关于CPU的补充
####寄存器
CPU除了有控制器、运算器还有寄存器。其中寄存器的作用就是进行数据的临时存储。

CPU的运算速度是非常快的,为了性能CPU在内部开辟一小块临时存储区域,并在进行运算时先将数据从内存复制到这一小块临时存储区域中,运算时就在这一小快临时存储区域内进行。我们称这一小块临时存储区域为寄存器。

对于arm64系的CPU来说, 如果寄存器以x开头则表明的是一个64位的寄存器,如果以w开头则表明是一个32位的寄存器,在系统中没有提供16位和8位的寄存器供访问和使用。其中32位的寄存器是64位寄存器的低32位部分并不是独立存在的。

####高速缓存
iPhoneX上搭载的ARM处理器A11它的1级缓存的容量是64KB,2级缓存的容量8M.

CPU每执行一条指令前都需要从内存中将指令读取到CPU内并执行。而寄存器的运行速度相比内存读写要快很多,为了性能,CPU还集成了一个高速缓存存储区域.当程序在运行时,先将要执行的指令代码以及数据复制到高速缓存中去(由操作系统完成).CPU直接从高速缓存依次读取指令来执行.

###寄存器的补充
####数据地址寄存器
数据地址寄存器通常用来做数据计算的临时存储、做累加、计数、地址保存等功能。定义这些寄存器的作用主要是用于在CPU指令中保存操作数,在CPU中当做一些常规变量来使用。
ARM64中

  • 64位: X0-X30, XZR(零寄存器)
  • 32位: W0-W30, WZR(零寄存器)

注意:
之前讲解8086汇编中有一种特殊的寄存器段寄存器:CS,DS,SS,ES四个寄存器来保存这些段的基地址,这个属于Intel架构CPU中.在ARM中并没有

####浮点和向量寄存器
因为浮点数的存储以及其运算的特殊性,CPU中专门提供浮点数寄存器来处理浮点数

  • 浮点寄存器 64位: D0 – D31 32位: S0 – S31

现在的CPU支持向量运算.(向量运算在图形处理相关的领域用得非常的多)为了支持向量计算系统了也提供了众多的向量寄存器.

  • 向量寄存器 128位:V0-V31

  • 栈:是一种具有特殊的访问方式的存储空间(后进先出, Last In Out Firt,LIFO)

15193998892055.jpg

###SP和FP寄存器

  • sp寄存器在任意时刻会保存我们栈顶的地址.
  • fp寄存器也称为x29寄存器属于通用寄存器,但是在某些时刻我们利用它保存栈底的地址!

注意:ARM64开始,取消32位的 LDM,STM,PUSH,POP指令! 取而代之的是ldr\ldp str\stp
ARM64里面 对栈的操作是16字节对齐的!!

###函数调用栈
常见的函数调用开辟和恢复的栈空间

sub    sp, sp, #0x40             ; 拉伸0x4064字节)空间
stp    x29, x30, [sp, #0x30]	 ;x29\x30 寄存器入栈保护
add    x29, sp, #0x30            ; x29指向栈帧的底部
... 
ldp    x29, x30, [sp, #0x30]	 ;恢复x29/x30 寄存器的值
add    sp, sp, #0x40             ; 栈平衡
ret
复制代码

15468434153501.jpg

###关于内存读写指令

注意:读/写 数据是都是往高地址读/写

str(store register)指令

将数据从寄存器中读出来,存到内存中.
ldr(load register)指令

将数据从内存中读出来,存到寄存器中

此ldr 和 str 的变种ldp 和 stp 还可以操作2个寄存器.

###堆栈操作练习
使用32个字节空间作为这段程序的栈空间,然后利用栈将x0和x1的值进行交换.

sub    sp, sp, #0x20	;拉伸栈空间32个字节
stp    x0, x1, [sp, #0x10] ;sp往上加16个字节,存放x0 和 x1
ldp    x1, x0, [sp, #0x10] ;将sp偏移16个字节的值取出来,放入x1 和 x0
复制代码

bl和ret指令

####bl标号

  • 将下一条指令的地址放入lr(x30)寄存器
  • 转到标号处执行指令

####ret

  • 默认使用lr(x30)寄存器的值,通过底层指令提示CPU此处作为下条指令地址!

ARM64平台的特色指令,它面向硬件做了优化处理的

####x30寄存器
x30寄存器存放的是函数的返回地址.当ret指令执行时刻,会寻找x30寄存器保存的地址值!

注意:在函数嵌套调用的时候.需要将x30入栈! lr

##函数的参数和返回值
ARM64下,函数的参数是存放在X0到X7(W0到W7)这8个寄存器里面的.如果超过8个参数,就会入栈.
函数的返回值是放在X0 寄存器里面的.

##函数的局部变量
函数的局部变量放在栈里面!

    • 是一种具有特殊的访问方式的存储空间(后进先出,last in out first,LIFO)

    15193998892055.jpg

    • SP和FP寄存器
      • sp寄存器在任意时刻会保存我们栈顶的地址
      • fp寄存器也成为x29寄存器数据通用寄存器,但是在某些时刻我们利用它来保存栈底的地址
    • ARM64里面对栈的作用是16字节对齐的
    • 栈的读写指令
      • 读:ldr(load register)指令LDR、LDP
      • 写:str(store register)指令 STR、STP
    • 汇编练习
      • 指令:
        • sub sp,sp,#0x10;拉伸栈空间16个字节
        • stp x0,x1[sp];往sp所在位置存放x0和x1
      • 简写:
        • stp x0,x1,[sp,#0x10]!
  • bl指令

    • 跳转指令:bl标号,表示程序执行到标号处,将下一条指令的地址保存到lr寄存器。
    • B 代表跳转
    • L 代表 lr(x30) 寄存器
  • ret 指令

    • 类似函数中return
    • 让CPU执行lr寄存器所指向的指令

函数

  • 函数调用栈
    • ARM64中栈是递减栈,向低地址延伸的栈
    • SP寄存器指向栈顶的位置
    • X29(FP)寄存器指向栈底的位置
  • 函数的参数
    • ARM64中,参数是放在X0到X7的8个寄存器
    • 如果是浮点数,就会用到浮点寄存器
    • 如果超过8个参数就会栈传递
  • 函数的返回值
    • 一般函数的返回值使用X0寄存器保存
    • 如果返回值大于8个字节,就会利用内存传递返回值,写入上一个调用栈的内容,用X8寄存器作为参数。
  • 函数的局部变量
    • 使用栈保存局部变量
  • 函数嵌套调用:会将X29、X30寄存器入栈保护

全局变量与常量

  • 获取全局变量和常量时,会出现adrp和add两条指令获得一个地址的情况
  • ADRP (Address Page)
    • adrp x0,1
    • 将PC寄存器的低12位清零
    • 将1的值,左移12位! 16进制就是0x1000
    • 以上两个结果相加放入x0寄存器
  • 通过ADD指令获取这页内存中的偏移值
© 版权声明
THE END
喜欢就支持一下吧
点赞0 分享