深入Objective-C Runtime機製(一):類和對象的實現
1.概要對於Runtime係統,相信大部分iOS開發工程師都有著或多或少的了解。對於Objective-C,Runtime係統是至關重要的,可以說是Runtime係統讓Objective-C成為了區分於C語言,C++之外的一門獨立開發語言,讓OC在擁有了自己的麵向對象的特性以及消息發送機製。並且因為其強大的消息發送機製,也讓很多人認為Objective-C是一門動態語言(實際上每種語言都具有一定的動態性,隻是OC的Runtime更加強大,但它仍比不上Python,Lua等動態語言)。
而Runtime係統的核心就是一個用C,C++,以及在最核心的消息發送部分甚至使用匯編語言而編寫的一套底層API庫。它是OC麵向對象和動態發送消息的基石,它把很多編譯時做的決定推遲到運行時。而且研究Runtime源碼能知道很多底層知識,比如類是什麼,分類是怎麼實現的,方法是什麼等。所以準備寫一係列文章,詳細分析一下Runtime的源碼以及設計機製。
2.麵向對象特性 —— 類與對象的實現
(一)類的實現
在C++中,類和結構體就已經非常相似了。隻是屬性的默認訪問權限有些區別。而OC中的Class究竟是什麼呢?很幸運,蘋果已經把Runtime庫開源,可以去蘋果的openSource上下載。打開Runtime工程,OC中的Class定義即可在Object.mm源碼中初見端倪:
typedef struct objc_class *Class;
我們使用的Class其實就是一個指向objc_class結構體的指針,那麼探尋類的構成其實就是弄清楚objc_class結構體的組成。在objc-runtime-new.h中,可以找到objc_class的定義,源碼過長,我截取了關鍵部分,代碼如下:
struct objc_class : objc_object {
// Class ISA;
Class superclass;
cache_t cache; // formerly cache pointer and vtable
class_data_bits_t bits; // class_rw_t * plus custom rr/alloc flags
class_rw_t *data() {
return bits.data();
}
}
在分析結構體內的屬性之前,還能發現objc_class繼承於objc_object結構體。從名字上就能看出來,objc_object是對象的結構體。這也說明了類本身其實也是一個對象。關於objc_object的問題留到後麵再談,回到類結構體。
類結構體有三個屬性,superclass,cache, 以及bit屬性。
(1)superclass,從名字上就能看出來,它保存了自己的父類。如果本身已經是根類NSObject,則為空。
(2) cache,從名字上也能看出來,它跟緩存相關。但是它究竟緩存了什麼東西,還需要進入cache_t結構體一探究竟,代碼如下:
struct cache_t {
struct bucket_t *_buckets;
mask_t _mask; //在find方法中可知
mask_t _occupied; //occupied:一個整數,指定實際占用的緩存bucket的總數。
public:
struct bucket_t *buckets();
mask_t mask();
mask_t occupied();
void incrementOccupied();
void setBucketsAndMask(struct bucket_t *newBuckets, mask_t newMask);
void initializeToEmpty();
mask_t capacity();
bool isConstantEmptyCache();
bool canBeFreed();
static size_t bytesForCapacity(uint32_t cap);
static struct bucket_t * endMarker(struct bucket_t *b, uint32_t cap);
void expand();
void reallocate(mask_t oldCapacity, mask_t newCapacity);
struct bucket_t * find(cache_key_t key, id receiver);
static void bad_cache(id receiver, SEL sel, Class isa) __attribute__((noreturn));
};
有幾個需要重點關注的點:bucket_t結構體的數組*_buckets,mask_t結構體的_mask和_occupied屬性,以及返回類型為bucket_t類型的find(cache_key_t,id receiver)方法。
看起來有好幾處都指向了bucket_t結構體,那我們先來看看這個結構體的組成內容:
struct bucket_t {
private:
cache_key_t _key;
IMP _imp;
public:
inline cache_key_t key() const { return _key; }
inline IMP imp() const { return (IMP)_imp; }
inline void setKey(cache_key_t newKey) { _key = newKey; }
inline void setImp(IMP newImp) { _imp = newImp; }
void set(cache_key_t newKey, IMP newImp);
};
bucket_t結構體有兩個屬性,cache_key_t(unsighed long)型的key,以及方法指針IMP。大概知道了這個結構體存了一個key與方法指針的對應關係,再結合cache_t結構體裏的find()方法(在消息發送的章節中會重點介紹),不難推測出cache_t緩存的是一個bucket鏈表,即近期調用過的方法的緩存區,目的是加快方法調用的速度。不過究竟是如何加快,查找的規則又是如何,將在消息發送的章節中進行詳解。
(3) class_data_bits_t結構體的bits,這是類結構中最重要的一環,它存儲了類最基本的信息,如方法,成員變量,遵循的protocal列表等等。而我們要的數據都存在class_rw_t結構體中,這點在objc_class中的注釋也能看出來: class_data_bits_t bits; // class_rw_t * plus custom rr/alloc flags
class_data_bits_t其實就是class_rw_t加上了自定義的rr/alloc標誌位。而最核心的數據都在class_rw_t中。所以這個結構體的源碼是我們重點關注的,做了一些精簡之後如下:
struct class_rw_t {
uint32_t flags;
uint32_t version;
const class_ro_t *ro;
method_array_t methods;
property_array_t properties;
protocol_array_t protocols;
}
首先映入眼簾,幾個令人興奮的關鍵字:method!property!protocals!
看來終於找到重點了,從名字就能看出來它保存了Method,Property,protocol列表。不過需要注意的是,因為在新版的Xcode提供了property自動合成成員變量的功能,很多人對property和Ivar的認知出現了混淆,需知道property本身不包括成員變量。而另外的methods和protocols,一目了然,就是我們要找的方法和遵循的協議列表。而flags與version標誌位則是標誌了該類是否是metaClass(下文會講解),是否被實現等等。
但是新的問題隨之產生,這些array是怎麼被生成的,又是按照什麼規則生成的,category裏的方法是什麼時候添進去的呢?而且還有一個class_ro_t常量指針,它有什麼作用,又指向了什麼內容呢?讓我們刨根問底吧!首先先解答第二個問題,class_ro_t結構體的內容如下:
struct class_ro_t {
uint32_t flags;
uint32_t instanceStart;
uint32_t instanceSize;
#ifdef __LP64__
uint32_t reserved;
#endif
const uint8_t * ivarLayout;
const char * name;
method_list_t * baseMethodList;
protocol_list_t * baseProtocols;
const ivar_list_t * ivars;
const uint8_t * weakIvarLayout;
property_list_t *baseProperties;
method_list_t *baseMethods() const {
return baseMethodList;
}
};
事實上,class_ro_t保存了類在編譯期就確定的method list,Ivar list等。關於這點我們可以在_read_images方法中的readClass方法中求證,Runtime係統從image文件中拿到類的定義,然後將這個類的data()數據,賦給了新生成的類的rw數據中的ro,這裏說的比較晦澀,因為它更底層,以後會專門用一篇文章來講這部分的內容。
最後把這一個個根據image文件中類定義生成出來的新類進行實現,即realizeClass方法。我們現在就來看看類的方法,協議和分類的方法,協議是如何串起來的。
進入realizeClass()方法,會發現它會先realize自己的superClass,metaClass,以及設置標誌位。在方法快結束的時候,有一句代碼:
// Attach categories
methodizeClass(cls);
看注釋就能明白,在這個地方會把類和分類串起來,生成最終的類。那跳進去看看具體做了什麼事情。首先它將ro中保存的baseMethod,baseProperty,baseProtocols等添加進class_rw_t中的methods,propertys,protocols。然後再開始加載category,關鍵代碼:
// Attach categories.
category_list *cats = unattachedCategoriesForClass(cls, true /*realizing*/);
attachCategories(cls, cats, false /*don't flush caches*/);
首先拿到尚未attach到class的category列表,然後進入attachCategories方法,這裏麵就做了真正添加分類屬性的工作。這部分代碼不是很難,就是把方法數組等的第一個元素地址添加進Array。唯一需要注意的是,添加category的順序是按照category的load順序,最先被load的category首先被加載。
(二)對象的實現
struct objc_object {
private:
isa_t isa;
public:
........
}
截取了部分代碼,發現objc_object有一個唯一的私有變量:isa。相信很多有研究過Runtime的同學都知道,isa是一個指向自己類的指針。而實際上,在ISA()方法中,我們可以知道在64位CPU上,isa已經不再是一個指針,而是non-pointer isa。
那什麼是non-pointer isa?我們都知道在64位的機器上,一個指針會占8個字節,即64位。但是我們的地址空間並不需要那麼多位數來表示,如果把這64位的一部分用來存儲實際地址,而另外一部分存一些標誌位,如這個對象是不是有弱引用的對象,它有沒有關聯對象,這個對象是否正在被銷毀等等。那麼我們就可以更好的利用起來這64位空間。那麼基於這個思想,isa就步入了non-pointer isa時代,它提升了內存的使用效率,降低了64位係統上的內存消耗。
那麼non-pointer isa的每一位究竟表示什麼呢?這個跟處理器指令集有關。越靠近底層就關注機器本身的特性,一般在iOS開發中能接觸到的指令集有四種:arm架構的v7和64,inter架構上的i386和x86_64,一般在手機上我們會用到前兩種架構,而在PC模擬器上會用到後兩種。手機型號與CPU架構對應關係如下:
# if __arm64__
# define ISA_MASK 0x0000000ffffffff8ULL
# define ISA_MAGIC_MASK 0x000003f000000001ULL
# define ISA_MAGIC_VALUE 0x000001a000000001ULL
struct {
uintptr_t indexed : 1;
uintptr_t has_assoc : 1;
uintptr_t has_cxx_dtor : 1;
uintptr_t shiftcls : 33; // MACH_VM_MAX_ADDRESS 0x1000000000
uintptr_t magic : 6;
uintptr_t weakly_referenced : 1;
uintptr_t deallocating : 1;
uintptr_t has_sidetable_rc : 1;
uintptr_t extra_rc : 19;
# define RC_ONE (1ULL<<45)
# define RC_HALF (1ULL<<18)
};
它的non-pointer isa中包括第4位往後的33位是表示真實的isa地址,而其它都是一些相關標誌位。有些一目了然就能知道是什麼意思,比如has_assoc,weakly_referenced,deallocating,但是其餘的標誌位相對就比較晦澀,這部分將在以後的文章中進行詳解。
有了前麵的講解,那麼我們也就知道了,如果是為了拿到一個對象的類,直接訪問它的isa是很危險的,因為它並不是一個真實的地址,所以要使用[obj class]或者是objc_getClass的方式,Runtime會幫我們做這一層轉換。
3.NSTaggedPointer
在看isa部分的源碼時,發現了很奇怪的一點,附源碼:
inline Class
objc_object::getIsa()
{
if (isTaggedPointer()) {
uintptr_t slot = ((uintptr_t)this >> TAG_SLOT_SHIFT) & TAG_SLOT_MASK;
return objc_tag_classes[slot];
}
return ISA();
}
在獲得isa的過程中,會先進行isTaggedPointer的判斷,若不是TaggedPointer才會返回ISA。而判斷是不是TaggedPointer則是很簡單的用non-pointer isa與TAG_MASK做一個按位與的操作,事實上上文中的indexed標誌位,即isa第一位就標誌了該對象是不是一個NSTaggedPointer,若為0則是普通的isa,若為1則表示是支持NSTaggedPointer的isa。
那什麼情況下支持NSTaggedPointer,它又有什麼作用呢?在objc_config.h中,找到了以下定義:
// Define SUPPORT_NONPOINTER_ISA=1 to enable extra data in the isa field.
#if !__LP64__ || TARGET_OS_WIN32 || TARGET_IPHONE_SIMULATOR
# define SUPPORT_NONPOINTER_ISA 0
#else
# define SUPPORT_NONPOINTER_ISA 1
#endif
可以看出在蘋果是在64位平台上開始支持NSTaggedPointer,那我們就可以合理猜測NSTaggedPointer的設計原理以及功效與non-pointer isa是差不多的。
在WWDC2013中,蘋果介紹了NSTaggedPointer,在32位時代,一個指針占4個字節,即32位。到了64位時代,一個指針被擴大到了8個字節,即64位。也就是說就算什麼都不幹,僅僅是把以前的代碼放到64位係統上運行,內存占用也會擴大一倍。而在絕大多數情況下,我們並不需要64位去存儲指針的地址,我們完全可以像non-pointer isa一樣,去存點別的東西,比如說小對象本身的值,即對象的"指針"本身就已經帶了值,不僅充分利用了內存空間,而且更美妙的是還不用去二次查找,這也加快了值的訪問速度,還減去了開辟內存,銷毀的開銷,這就是NSTaggedPointer的設計思想。
大家可以去WWDC2013的官方pdf中找到詳細的定義,在此就要點做一下簡單翻譯:
(1)NSTaggedPointer是在64位係統中被加入的,它專門用於存儲一些小的對象,如NSNumber,NSDate。
(2)NSTaggedPointer把對象的值本身存在了pointer裏麵,沒有malloc和free的消耗(也不會存在堆中)。
(3)在性能上,它有三倍的內存使用效率,以及106倍的生成和銷毀效率。
(附原文地址:https://devstreaming.apple.com/videos/wwdc/2013/404xbx2xvp1eaaqonr8zokm/404/404.pdf)
現在我們也可以理解,為什麼在獲取isa的時候會先去判斷一下是不是NSTaggedPointer,因為它根本不是一個真正的對象,它的pointer本身就已經存儲了它的值,當然它也就不會有isa指針了。不過由此也可以得出一個結論,對內存的優化,性能的追求是無止境的!
4.小結
本章講述了類和對象的實現,以及蘋果在64位係統上針對對象指針做的優化細節。下章將會繼續從源碼的角度去分析消息發送以及轉發的流程究竟是怎麼實現的,蘋果為此又做了什麼關鍵的優化。
最後更新:2017-04-26 13:02:02