我们在程序设计时绕不开对象,那什么是对象?对象的本质是什么?对象是对客观事物的抽象,对象可以定义属性和方法,下面我通过代码来分析Objective-C对象的本质;Objective-C是由C、C++和汇编语言的超集,要分析Objective-C对象,需要通过Clang或者xcrun把Objective-C转换成C++,进而分析对象的构成。
一、Objective-C对象的本质
Clang和xcrun的定义
Clang
Clang是一个C语言、C++、Objective-C语言的轻量级编译器。源代码发布于BSD协议下。
Clang将支持其普通lambda表达式、返回类型的简化处理以及更好的处理constexpr关键字。
Clang是一个由Apple主导编写,基于LLVM的C/C++/Objective-C编译器
复制代码
xcrun
xcrun是xcode安装的时候顺带安装了`xcrun命令,`xcrun`命令在`clang`的基础上进行了一些封装,更方便使用
复制代码
通过Clang和xcrun编译下面一个Objective-C文件
//
// main.m
//
// Created by Atom on 2021/6/15.
//
#import <Foundation/Foundation.h>
@interface ATPerson : NSObject
@property (nonatomic, copy) NSString *name;
@end
@implementation ATPerson
@end
int main(int argc, const char * argv[]) {
@autoreleasepool {
}
return 0;
}
复制代码
编译
进入main.m所在目录下执行编译命令
// Clang
clang -rewrite-objc main.m -o main.cpp
xcrun
xcrun -sdk iphonesimulator clang -arch arm64 -rewrite-objc main.m -o main-arm64.cpp //模拟器
xcrun -sdk iphoneos clang -arch arm64 -rewrite-objc main.m -o main-arm64.cpp //真机
复制代码
源码分析
编译完成后会生成main.cpp文件,这个文件会生成非常多的代码以至于不知从哪里着手,我们可以通过自定义的对象ATPerson进行搜索,分析在.cpp文件中对应的结构,可以查询到如下的代码:
struct ATPerson_IMPL {
struct NSObject_IMPL NSObject_IVARS;
NSString *_name; //定义的name属性
};
// 通过NSObject_IMPL可以找到isa指针
struct NSObject_IMPL {
Class isa;
};
typedef struct objc_class *Class; // 结构体指针
// name属性的get方法
static NSString * _I_ATPerson_name(ATPerson * self, SEL _cmd) { return (*(NSString **)((char *)self + OBJC_IVAR_$_ATPerson$_name)); }
// name属性的set方法
static void _I_ATPerson_setName_(ATPerson * self, SEL _cmd, NSString *name) { objc_setProperty (self, _cmd, __OFFSETOFIVAR__(struct ATPerson, _name), (id)name, 0, 1); }
复制代码
从以上截取的代码中,我们知道ATPerson底层是个结构体类型,结构体ATPerson内包含一个name
属性,一个是struct的NSObject_IMPL NSObject_IVARS
,通过查找NSObject_IMPL内含有Class
类型的isa
,而Class是个objc_class
的结构体指针,因此NSObject_IVARS对应的isa
指针;在Objective-C对象定义的属性中,我们从源码可以看到自动生成了get
和set
方法,包含了隐藏参数,get方法通过找到self(也就是isa)指针对应的地址,通过地址偏移找到属性name地址,进而获取到属性的值,同样set方法通过找到isa指针的地址,通过指针地址偏移找到属性name的地址,再给name赋值。
二、nonPointerIsa
定义
在了解nonPointerIsa之前,我们先了解一下联合体位域,再分析一下为什么苹果会设计nonPointerIsa,和普通的isa有什么区别?
联合体位域
// 定义一个结构体S1
struct S1 {
BOOL front;
BOOL back;
BOOL left;
BOOL right;
};
复制代码
通过上一篇:结构体内存对齐解析文章分析,可以得知S1占4个字节,我们有通过代码运行来验证一下;
4个字节等于4 * 8 = 32bit
,而对于方向位置的设计根本不需要32位去存储,这样造成极大的空间浪费,对于前后左右每个位置只需要1位来标记就可以满足,因此只需要4位也就是半个字节,因为最小单位是1字节,也就是1字节就可以满足我们的需求,而没必要设计为4字节,能否进一步优化,请看下面的定义:
// 可以在后面加冒号(:)指定位数
struct S2 {
BOOL front: 1;
BOOL back : 1;
BOOL left : 1;
BOOL right: 1;
};
运行打印输入size = 1字节,大大优化了存储空间
复制代码
再看下面2个定义,有什么区别?同时我们分别定义2个对象T1和U1,给成员变量赋值后打印看看会有什么区别?
struct T1 {
char *name;
int age;
double height ;
};
union U1 {
char *name;
int age;
double height ;
};
int main(int argc, const char * argv[]) {
@autoreleasepool {
struct T1 t1;
t1.name = "Atom";
t1.age = 18;
union U1 u1;
u1.name = "Atom";
u1.age = 18;
}
return 0;
}
复制代码
通过运行断点逐一打印查看,可以看出struct类型的T1初始化后成员变量都是空值,逐个赋值后对应的变量会更新所赋的值,union类型的U1初始化后成员变量也都是空值,当给u1.name赋值后,name更新为新值,但此时u1的age和height也值,只是出现很奇怪的值,当断点再往下走一步给age赋值后,age的值是我们正常赋给的18,但name和height就不是了,这就是struct和union的区别之处。
结论:struct类型是共存的,只要初始化就会给所有变量开辟内存空间,而联合体union是互斥的,当给某个变量赋值时,其他变量就是未使用状态,拿到的值是脏数据,因此我们在设计时可以更新不同场景定义不同类型,可以提供效率节省内存空间。
nonPointerIsa
nonPinterIsa通过字面意思理解是不纯的isa,isa占用8字节内存(64位),而实际指针地址存不了这么多,为了提高isa内存的使用率,所以苹果对isa进行了优化,下面通过源码看一下isa的结构
// arm64架构
# if __arm64__
# define ISA_MASK 0x0000000ffffffff8ULL
# define ISA_MAGIC_MASK 0x000003f000000001ULL
# define ISA_MAGIC_VALUE 0x000001a000000001ULL
# define ISA_BITFIELD \
uintptr_t nonpointer : 1; \
uintptr_t has_assoc : 1; \
uintptr_t has_cxx_dtor : 1; \
uintptr_t shiftcls : 33; /*MACH_VM_MAX_ADDRESS 0x1000000000*/ \
uintptr_t magic : 6; \
uintptr_t weakly_referenced : 1; \
uintptr_t deallocating : 1; \
uintptr_t has_sidetable_rc : 1; \
uintptr_t extra_rc : 19
# define RC_ONE (1ULL<<45)
# define RC_HALF (1ULL<<18)
// x86_64架构
# elif __x86_64__
# define ISA_MASK 0x00007ffffffffff8ULL
# define ISA_MAGIC_MASK 0x001f800000000001ULL
# define ISA_MAGIC_VALUE 0x001d800000000001ULL
# define ISA_BITFIELD \
uintptr_t nonpointer : 1; \
uintptr_t has_assoc : 1; \
uintptr_t has_cxx_dtor : 1; \
uintptr_t shiftcls : 44; /*MACH_VM_MAX_ADDRESS 0x7fffffe00000*/ \
uintptr_t magic : 6; \
uintptr_t weakly_referenced : 1; \
uintptr_t deallocating : 1; \
uintptr_t has_sidetable_rc : 1; \
uintptr_t extra_rc : 8
# define RC_ONE (1ULL<<56)
# define RC_HALF (1ULL<<7)
nonpointer: 是否对 isa 指针开启指针优化
has_assoc: 关联对象标志位,0没有,1存在
has_cxx_dtor: 是否有C++或者Objc的析构器,如果有析构函数,则需要做析构逻辑, 如果没有,则可以更快的释放对象
shiftcls: 存储类指针的值。开启指针优化的情况下,在arm64架构中有33位用来存储类指针
magic: 用于调试器判断当前对象是真的对象还是没有初始化的空间
weakly_referenced: 是否被指向或者曾经指向一个ARC的弱变量,没有弱引用的对象可以更快释放
deallocating: 标志对象是否正在释放内存
has_sidetable_rc: 当对象引用技术大于10时,则需要借用该变量存储进位
extra_rc: 当表示该对象的引用计数值,实际上是引用计数值减1,例如,如果对象的引用计数为10,那么extra_rc为9。如果引用计数大于10, 则需要使用到下面的has_sidetable_rc
复制代码
通过以上对isa指针结构的分析,可以接iOS底层原理alloc之初探第3点的绑定对象进行进一步的理解,下面是isa指针关联对象的源码
inline void
objc_object::initIsa(Class cls, bool nonpointer, bool hasCxxDtor)
{
ASSERT(!isTaggedPointer());
if (!nonpointer) {
// 如果不是nonpointer直接把当前的cls赋值给isa
isa = isa_t((uintptr_t)cls);
} else {
ASSERT(!DisableNonpointerIsa);
ASSERT(!cls->instancesRequireRawIsa());
// 如果是nonpointer,就需要对各部分进行赋值,以下赋值部分就上面isa指针内部的结构
isa_t newisa(0);
#if SUPPORT_INDEXED_ISA
ASSERT(cls->classArrayIndex() > 0);
newisa.bits = ISA_INDEX_MAGIC_VALUE;
// isa.magic is part of ISA_MAGIC_VALUE
// isa.nonpointer is part of ISA_MAGIC_VALUE
newisa.has_cxx_dtor = hasCxxDtor;
newisa.indexcls = (uintptr_t)cls->classArrayIndex();
#else
newisa.bits = ISA_MAGIC_VALUE;
// isa.magic is part of ISA_MAGIC_VALUE
// isa.nonpointer is part of ISA_MAGIC_VALUE
newisa.has_cxx_dtor = hasCxxDtor;
newisa.shiftcls = (uintptr_t)cls >> 3;
#endif
// This write must be performed in a single store in some cases
// (for example when realizing a class because other threads
// may simultaneously try to use the class).
// fixme use atomics here to guarantee single-store and to
// guarantee memory order w.r.t. the class index table
// ...but not too atomic because we don't want to hurt instantiation
isa = newisa;
}
}
复制代码
示例验证(以x86_64为例)
- 通过x/4gx p输出对象isa地址为0x011d8001000080e9
- p/x 0x011d8001000080e9 & 0x00007ffffffffff8ULL // isa & ISA_MASK
- p/x ATPerson.class,打印ATPerson的地址
结果得出2和3的输出是一致的,都可以打印ATPerson对象地址。
下面通过内存示意图看一下nonPointerIsa的分布:
通过上面的结构分析,我们知道了nonPointerIsa的内存分布,isa关联类的地址主要存储在3-46位的内存中,因此我们可以通过平移法求出对象的地址,还是按之前x/4gx的方式拿到对象的isa首地址,先右移3位,左边多出的3位自动补0,然后左移20位,再右移17位恢复到原来的class对应的位置,以下代码验证
以上就是结合源码分析实际代码运行得出相同的结果。
总结
- 了解了Clang和xcrun两种编译工具,并通过这2种编译方式输出类源文件,对OC对象的源码分析得出类的本质是结构体。
- 通过实例对联合体位域的进一步了解,以及在内存中可以根据需求进行优化,提高内存的利用率。
- 知道了什么是nonPointerIsa,以及苹果为什么会这样设计,结合实际的代码实例分析内部的构成。