今天看到了这位兄弟的面试题总结文章:,里面的问题确实不错,所以就查资料学习了下,在这给个答案(链接-_-),以及一些其他的原理和发散。
问题
- 如果让你实现属性的weak,如何实现的?
- 如果让你来实现属性的atomic,如何实现?
- KVO为什么要创建一个子类来实现?
- 类结构体的组成,isa指针指向了什么?(这里应该将元类和根元类也说一下)
- RunLoop有几种事件源?有几种模式?
- 方法列表的数据结构是什么?
- 分类是如何实现的?它为什么会覆盖掉原来的方法?
1. weak原理
这篇文章我觉得写得很好,我用自己的话简单总结下: weak
是啥?在一个对象被释放后,指向它的所有weak
指针都跟着被设为nil
,所以关键就是怎么从这个对象找到所有指向它的weak指针。
系统使用一张表,用对象的地址做key,值是对象的引用计数和weak指针表。 在类似__weak SomeClass *obj = otherObj
这种的时候,调用storeWeak
方法把新指针obj
和对象otherObj
关联起来,实际干的就是:
- 使用指针获取旧的对象,在使用旧对象获取旧对象的weak表,把指针从就旧对象的weak表里移除
- 使用新对象获取新对象的weak表,把指针加入到weak表里
2.实现atomic
简单说,在属性的getter/setter实现里,先加锁然后再对变量进行访问
- (UITextField *) userName { UITextField *retval = nil; @synchronized(self) { retval = [[userName retain] autorelease]; } return retval;}- (void) setUserName:(UITextField *)userName_ { @synchronized(self) { [userName_ retain]; [userName release]; userName = userName_; }}复制代码
发散下
- 首先这样做就会加大开销,因为开锁解锁
- 然后这样做,实际很多时候并不能保证线程同步的作用,除了上面的stackoverflow问题里的提到的
firstname
+secondname
的例子,我可以举一个:比如仓库里有5袋米,然后10个人去拿,每个人就相当于每个线程,每个线程先要check是否还有米,然后决定去拿use。atomic只能保证你check的时候是独立的,use的时候也是独立的,这样可能出现什么?5人check完,第一个人还没有use,那么第6个人check的时候,他以为还有5袋米,然后他也去拿,最后结果就是米的数量变成了负数。
简单说,就是check和use要正整体加锁:
lock->check->use->unlock复制代码
而atomic
是在属性内部实现的加锁,即相当于: lock->check->unlock->可能其他线程插入进来...->lock->use->unlock
。
- 然后提到
@synchronized
,就也说下它的原理,。 简单说:
@synchronized(obj) { // do work}复制代码
也是用一张哈希表,在进入这个代码块的时候,使用obj这个对象获取对应的递归锁,然后加锁,在出代码块的时候解锁。所以这是以obj的地址为唯一性的锁。
3. KVO的原理
- 在你给对象a设置观察者之后,假设a的类型为ClassA,那么会从ClassA临时建一个子类subClassA,然后重写你观察的那个属性的方法,把对象a类型改成这个子类subClassA。
- 修改子类的方法使用了runtime里的isa指针的作用
- 回到问题,为什么要实现一个子类?
- 重写属性,是怎么重写的?比如setName会变成:
void setName:(NSString *)name{ [self willChangeValueForKey:@"name"]; [super setName:name]; [self didChangeValueForKey:@"name"];}复制代码
也就是通过willChangeValueForKey
和didChangeValueForKey
来通知外界的,所以你必须要重写原本的setter方法,否则外界不会收到消息
- 那么重写就有两种选择:改本类和改子类。如果改了本类,就会污染本类的所有其他的对象的方法
- 本来我还想到重写的方法会被反复重写,导致
willChangeValueForKey
反复嵌套,但想这个是可以通过设置表示来避免的,比如在类里建个表存储KVO重写的方法 - 其实这里是一个很好的思路,我见过使用method swizzling导致类的其他地方被污染的,可以像KVO里一样,自动创建一个子类,然后就你当前的对象方法被修改了,这样你就不用担心其他地方会因为方法篡改而导致位置bug
4. isa指针的问题
看这个图就好了:
好,下一题!-_-
5. RunLoop
mode有几种:公开的有kCFRunLoopDefaultMode
和UITrackingRunLoopMode
后一种在scrollView滚动的时候会切换到。这里会牵扯到一个经典考题:滚动导致NSTimer不起作用的问题。上面的文章里有说明白。 事件有:source、timer和observer
struct __CFRunLoopMode { CFStringRef _name; // Mode Name, 例如 @"kCFRunLoopDefaultMode" CFMutableSetRef _sources0; // Set CFMutableSetRef _sources1; // Set CFMutableArrayRef _observers; // Array CFMutableArrayRef _timers; // Array ... };
6. 方法列表的结构
先看类的结构:
struct objc_class { Class isa OBJC_ISA_AVAILABILITY;#if !__OBJC2__ Class super_class OBJC2_UNAVAILABLE; const char *name OBJC2_UNAVAILABLE; long version OBJC2_UNAVAILABLE; long info OBJC2_UNAVAILABLE; long instance_size OBJC2_UNAVAILABLE; struct objc_ivar_list *ivars OBJC2_UNAVAILABLE; struct objc_method_list **methodLists OBJC2_UNAVAILABLE; struct objc_cache *cache OBJC2_UNAVAILABLE; struct objc_protocol_list *protocols OBJC2_UNAVAILABLE;#endif} OBJC2_UNAVAILABLE;复制代码
struct objc_method_list **methodLists
这个就是方法列表了,首先这里有个不易发现的知识点:为什么methodLists是指针的指针而不是指针? 这个问题里的说了一些,简单说: objc_method_list *
代表一个方法链,按理说对于类来说,这个结构就足够了,objc_method_list **
这个代表n条方法链,其实是因为Category
才会这样。
在合并Category和类的时候,就可以把Category的方法直接放进来,而不用修改原来的方法链。
while (i--) { //取出category的方法列表 method_list_t *mlist = cat_method_list(cats->list[i].cat, isMeta); if (mlist) { //直接放到列的方法列表的列表里,而不修改类本身的方法列表 mlists[mcount++] = mlist; fromBundle |= cats->list[i].fromBundle; } } attachMethodLists(cls, mlists, mcount, NO, fromBundle, inoutVtablesAffected);复制代码
个人认为这样是为了:
- 保持各个方法表的独立,比如category定义了和类本身同样的方法,可以共存
- 修改起来方便些,如果只有一个表,就得增加和删除一大堆的节点,而且还得维护那些节点是category的,哪些是类的。
然后是objc_method_list
的结构:
struct objc_method_list { struct objc_method_list *obsolete OBJC2_UNAVAILABLE; int method_count OBJC2_UNAVAILABLE;#ifdef __LP64__ int space OBJC2_UNAVAILABLE;#endif /* variable length structure */ struct objc_method method_list[1] OBJC2_UNAVAILABLE;}复制代码
这里没有借鉴,只有自己翻一下(这几个问题其实都是对runtime源码的解析吧)
/* These next three functions are the heart of ObjC method lookup. */static inline Method _findMethodInList(struct objc_method_list * mlist, SEL sel) { int i; if (!mlist) return NULL; for (i = 0; i < mlist->method_count; i++) { Method m = &mlist->method_list[i]; if (m->method_name == sel) { return m; } } return NULL;}复制代码
上面这个函数是从里objc_method_list找到对应的Method,可以看出方法存储在method_list
里面。没看代码前,我以为是objc_method_list实际是链表的一个节点,每个method_list只存储一个方法,然后用obsolete连接下一个方法。
7. Category的原理
- 把category的方法、属性和协议都和原有类合并;
- 对于属性和协议,把链表衔接起来就好了
newproperties = buildPropertyList(NULL, cats, isMeta); if (newproperties) { newproperties->next = cls->data()->properties; cls->data()->properties = newproperties; } newprotos = buildProtocolList(cats, NULL, cls->data()->protocols); if (cls->data()->protocols && cls->data()->protocols != newprotos) { _free_internal(cls->data()->protocols); } cls->data()->protocols = newprotos;复制代码
- 对于方法,先把所有category的方法列表都存在列表的列表(method_list_t **)里,然后把类原本的方法列表放进来
// Copy old methods to the method list array for (i = 0; i < oldCount; i++) { newLists[newCount++] = oldLists[i]; }复制代码
-
所以为什么会覆盖的问题就得到了解决:并不是覆盖,而是在类本身的方法列表放到了后面,从而被滞后隐藏了。其实也可以猜得到,不可能把原本类的方法去掉,否则原本方法就丢了,而现在这样,在category移除后,原本类的方法又可以暴露出来了。
-
关于category,有个在静态库的加载问题,讲得非常好。简单说就是category不是编译器用来确认加载的标识
Categories are a runtime-only feature, categories aren't symbols like classes or functions and that also means a linker cannot determine if a category is in use or not.
解决方案就是在Other Linker Flags里添加-Objc,-force_load或-all_load来加载,-Objc是所有OC代码的文件都加载,-force_load指定文件加载,-all_load全部加载。
其他的一些相关问题
- 自动释放池的原理:
在开始的时候,创建一个AutoreleasePoolPage
类型的双向链表,它会保存所有使用__autoreleasing
标记的对象(MRC时直接调用autoRelease方法),实际就是调用了下面的方法,创建一个新节点加进去
static inline id *autoreleaseFast(id obj){ AutoreleasePoolPage *page = hotPage(); if (page && !page->full()) { return page->add(obj); } else if (page) { return autoreleaseFullPage(obj, page); } else { return autoreleaseNoPage(obj); }}复制代码
在pool结束后,对每个对象release。
- ,同样使用哈希表。
- 对于一些调试,用lldb可以达到特殊效果,