iOS底层原理-对象的本质

我们在程序设计时绕不开对象,那什么是对象?对象的本质是什么?对象是对客观事物的抽象,对象可以定义属性和方法,下面我通过代码来分析Objective-C对象的本质;Objective-C是由C、C++和汇编语言的超集,要分析Objective-C对象,需要通过Clang或者xcrun把Objective-C转换成C++,进而分析对象的构成。

一、Objective-C对象的本质

Clang和xcrun的定义

Clang
Clang是一个C语言、C++、Objective-C语言的轻量级编译器。源代码发布于BSD协议下。
Clang将支持其普通lambda表达式、返回类型的简化处理以及更好的处理constexpr关键字。
Clang是一个由Apple主导编写,基于LLVM的C/C++/Objective-C编译器
复制代码
xcrun
xcrun是xcode安装的时候顺带安装了`xcrun命令,`xcrun`命令在`clang`的基础上进行了一些封装,更方便使用
复制代码

通过Clang和xcrun编译下面一个Objective-C文件

//
//  main.m
//
//  Created by Atom on 2021/6/15.
//

#import <Foundation/Foundation.h>

@interface ATPerson : NSObject

@property (nonatomic, copy) NSString *name;

@end

@implementation ATPerson

@end

int main(int argc, const char * argv[]) {
    @autoreleasepool {
        
    }
    return 0;
}
复制代码
编译

进入main.m所在目录下执行编译命令

// Clang
clang -rewrite-objc main.m -o main.cpp

xcrun
xcrun -sdk iphonesimulator clang -arch arm64 -rewrite-objc main.m -o main-arm64.cpp //模拟器
xcrun -sdk iphoneos clang -arch arm64 -rewrite-objc main.m -o main-arm64.cpp //真机
复制代码

源码分析

编译完成后会生成main.cpp文件,这个文件会生成非常多的代码以至于不知从哪里着手,我们可以通过自定义的对象ATPerson进行搜索,分析在.cpp文件中对应的结构,可以查询到如下的代码:

struct ATPerson_IMPL {
    struct NSObject_IMPL NSObject_IVARS;
    NSString *_name; //定义的name属性
};

// 通过NSObject_IMPL可以找到isa指针
struct NSObject_IMPL {
    Class isa;
};

typedef struct objc_class *Class; // 结构体指针

// name属性的get方法
static NSString * _I_ATPerson_name(ATPerson * self, SEL _cmd) { return (*(NSString **)((char *)self + OBJC_IVAR_$_ATPerson$_name)); }

// name属性的set方法
static void _I_ATPerson_setName_(ATPerson * self, SEL _cmd, NSString *name) { objc_setProperty (self, _cmd, __OFFSETOFIVAR__(struct ATPerson, _name), (id)name, 0, 1); }
复制代码

从以上截取的代码中,我们知道ATPerson底层是个结构体类型,结构体ATPerson内包含一个name属性,一个是struct的NSObject_IMPL NSObject_IVARS,通过查找NSObject_IMPL内含有Class类型的isa,而Class是个objc_class的结构体指针,因此NSObject_IVARS对应的isa指针;在Objective-C对象定义的属性中,我们从源码可以看到自动生成了getset方法,包含了隐藏参数,get方法通过找到self(也就是isa)指针对应的地址,通过地址偏移找到属性name地址,进而获取到属性的值,同样set方法通过找到isa指针的地址,通过指针地址偏移找到属性name的地址,再给name赋值。
111.png

二、nonPointerIsa

定义

在了解nonPointerIsa之前,我们先了解一下联合体位域,再分析一下为什么苹果会设计nonPointerIsa,和普通的isa有什么区别?

联合体位域

// 定义一个结构体S1
struct S1 {
    BOOL front;
    BOOL back;
    BOOL left;
    BOOL right;
}; 
复制代码

通过上一篇:结构体内存对齐解析文章分析,可以得知S1占4个字节,我们有通过代码运行来验证一下;
33.png

4个字节等于4 * 8 = 32bit,而对于方向位置的设计根本不需要32位去存储,这样造成极大的空间浪费,对于前后左右每个位置只需要1位来标记就可以满足,因此只需要4位也就是半个字节,因为最小单位是1字节,也就是1字节就可以满足我们的需求,而没必要设计为4字节,能否进一步优化,请看下面的定义:

// 可以在后面加冒号(:)指定位数
struct S2 {
    BOOL front: 1;
    BOOL back : 1;
    BOOL left : 1;
    BOOL right: 1;
};
运行打印输入size = 1字节,大大优化了存储空间
复制代码

再看下面2个定义,有什么区别?同时我们分别定义2个对象T1和U1,给成员变量赋值后打印看看会有什么区别?

struct T1 {
    char        *name;
    int         age;
    double      height ;
};

union U1 {
    char        *name;
    int         age;
    double      height ;
};

int main(int argc, const char * argv[]) {
    @autoreleasepool {
        struct T1 t1;
        t1.name = "Atom";
        t1.age = 18;
        
        union U1 u1;
        u1.name = "Atom";
        u1.age = 18;
    }
    return 0;
}
复制代码

11.png
通过运行断点逐一打印查看,可以看出struct类型的T1初始化后成员变量都是空值,逐个赋值后对应的变量会更新所赋的值,union类型的U1初始化后成员变量也都是空值,当给u1.name赋值后,name更新为新值,但此时u1的age和height也值,只是出现很奇怪的值,当断点再往下走一步给age赋值后,age的值是我们正常赋给的18,但name和height就不是了,这就是struct和union的区别之处。

结论:struct类型是共存的,只要初始化就会给所有变量开辟内存空间,而联合体union是互斥的,当给某个变量赋值时,其他变量就是未使用状态,拿到的值是脏数据,因此我们在设计时可以更新不同场景定义不同类型,可以提供效率节省内存空间。

nonPointerIsa

nonPinterIsa通过字面意思理解是不纯的isa,isa占用8字节内存(64位),而实际指针地址存不了这么多,为了提高isa内存的使用率,所以苹果对isa进行了优化,下面通过源码看一下isa的结构

// arm64架构
# if __arm64__
#   define ISA_MASK        0x0000000ffffffff8ULL
#   define ISA_MAGIC_MASK  0x000003f000000001ULL
#   define ISA_MAGIC_VALUE 0x000001a000000001ULL
#   define ISA_BITFIELD                                                      \
      uintptr_t nonpointer        : 1;                                       \
      uintptr_t has_assoc         : 1;                                       \
      uintptr_t has_cxx_dtor      : 1;                                       \
      uintptr_t shiftcls          : 33; /*MACH_VM_MAX_ADDRESS 0x1000000000*/ \
      uintptr_t magic             : 6;                                       \
      uintptr_t weakly_referenced : 1;                                       \
      uintptr_t deallocating      : 1;                                       \
      uintptr_t has_sidetable_rc  : 1;                                       \
      uintptr_t extra_rc          : 19
#   define RC_ONE   (1ULL<<45)
#   define RC_HALF  (1ULL<<18)

// x86_64架构
# elif __x86_64__
#   define ISA_MASK        0x00007ffffffffff8ULL
#   define ISA_MAGIC_MASK  0x001f800000000001ULL
#   define ISA_MAGIC_VALUE 0x001d800000000001ULL
#   define ISA_BITFIELD                                                        \
      uintptr_t nonpointer        : 1;                                         \
      uintptr_t has_assoc         : 1;                                         \
      uintptr_t has_cxx_dtor      : 1;                                         \
      uintptr_t shiftcls          : 44; /*MACH_VM_MAX_ADDRESS 0x7fffffe00000*/ \
      uintptr_t magic             : 6;                                         \
      uintptr_t weakly_referenced : 1;                                         \
      uintptr_t deallocating      : 1;                                         \
      uintptr_t has_sidetable_rc  : 1;                                         \
      uintptr_t extra_rc          : 8
#   define RC_ONE   (1ULL<<56)
#   define RC_HALF  (1ULL<<7)

nonpointer: 是否对 isa 指针开启指针优化
has_assoc: 关联对象标志位,0没有,1存在
has_cxx_dtor: 是否有C++或者Objc的析构器,如果有析构函数,则需要做析构逻辑, 如果没有,则可以更快的释放对象
shiftcls: 存储类指针的值。开启指针优化的情况下,在arm64架构中有33位用来存储类指针
magic: 用于调试器判断当前对象是真的对象还是没有初始化的空间
weakly_referenced: 是否被指向或者曾经指向一个ARC的弱变量,没有弱引用的对象可以更快释放
deallocating: 标志对象是否正在释放内存
has_sidetable_rc: 当对象引用技术大于10时,则需要借用该变量存储进位
extra_rc: 当表示该对象的引用计数值,实际上是引用计数值减1,例如,如果对象的引用计数为10,那么extra_rc为9。如果引用计数大于10, 则需要使用到下面的has_sidetable_rc
复制代码

通过以上对isa指针结构的分析,可以接iOS底层原理alloc之初探第3点的绑定对象进行进一步的理解,下面是isa指针关联对象的源码

inline void 
objc_object::initIsa(Class cls, bool nonpointer, bool hasCxxDtor) 
{ 
    ASSERT(!isTaggedPointer()); 
    
    if (!nonpointer) {
        // 如果不是nonpointer直接把当前的cls赋值给isa
        isa = isa_t((uintptr_t)cls);
    } else {
        ASSERT(!DisableNonpointerIsa);
        ASSERT(!cls->instancesRequireRawIsa());

        // 如果是nonpointer,就需要对各部分进行赋值,以下赋值部分就上面isa指针内部的结构
        isa_t newisa(0);
#if SUPPORT_INDEXED_ISA
        ASSERT(cls->classArrayIndex() > 0);
        newisa.bits = ISA_INDEX_MAGIC_VALUE;
        // isa.magic is part of ISA_MAGIC_VALUE
        // isa.nonpointer is part of ISA_MAGIC_VALUE
        newisa.has_cxx_dtor = hasCxxDtor;
        newisa.indexcls = (uintptr_t)cls->classArrayIndex();
#else
        newisa.bits = ISA_MAGIC_VALUE;
        // isa.magic is part of ISA_MAGIC_VALUE
        // isa.nonpointer is part of ISA_MAGIC_VALUE
        newisa.has_cxx_dtor = hasCxxDtor;
        newisa.shiftcls = (uintptr_t)cls >> 3;
#endif
        // This write must be performed in a single store in some cases
        // (for example when realizing a class because other threads
        // may simultaneously try to use the class).
        // fixme use atomics here to guarantee single-store and to
        // guarantee memory order w.r.t. the class index table
        // ...but not too atomic because we don't want to hurt instantiation
        isa = newisa;
    }
}
复制代码
示例验证(以x86_64为例)
  1. 通过x/4gx p输出对象isa地址为0x011d8001000080e9
  2. p/x 0x011d8001000080e9 & 0x00007ffffffffff8ULL // isa & ISA_MASK
  3. p/x ATPerson.class,打印ATPerson的地址

结果得出2和3的输出是一致的,都可以打印ATPerson对象地址。
22.png

下面通过内存示意图看一下nonPointerIsa的分布:
33.png
通过上面的结构分析,我们知道了nonPointerIsa的内存分布,isa关联类的地址主要存储在3-46位的内存中,因此我们可以通过平移法求出对象的地址,还是按之前x/4gx的方式拿到对象的isa首地址,先右移3位,左边多出的3位自动补0,然后左移20位,再右移17位恢复到原来的class对应的位置,以下代码验证
5.png
以上就是结合源码分析实际代码运行得出相同的结果。

总结

  1. 了解了Clang和xcrun两种编译工具,并通过这2种编译方式输出类源文件,对OC对象的源码分析得出类的本质是结构体。
  2. 通过实例对联合体位域的进一步了解,以及在内存中可以根据需求进行优化,提高内存的利用率。
  3. 知道了什么是nonPointerIsa,以及苹果为什么会这样设计,结合实际的代码实例分析内部的构成。
© 版权声明
THE END
喜欢就支持一下吧
点赞0 分享