IGListKit diff 实现简析
16 Mar 2017前言
Instagram 在去年年底开源了基于 数据驱动 的 UICollectionView 框架 IGListKit。整个框架通过 Adapter 将过去直接暴露的 CollectionView Datasource 和 Delegate 实现进行包装,并通过它关联 Model 和 IGListSectionController。这使得上层用户只需要继承并实现所需要的 IGListSectionController 接口即可,很好地进行了代码解耦。
整个思路比较新颖又很简洁,即使不直接使用这个框架,也可以按照思路依葫芦画瓢做出自己的简易版方案。不过今天要讲的并不是 IGListKit 本身,而是扒一扒它里面的 IGListDiff 实现。
相比于前端各种各样 Virtual DOM diff 实现,移动端在这方面较为欠缺。在 UITableView 和 UICollectionView 的使用上,一旦同时发生数据删除,更新,添加时,我们的做法往往是手动计算出变化 NSIndexPaths 并调用批量刷新,甚至简单粗暴地调用 reloadData 做一次全刷新。而 IGListKit 的 IGListDiff 正是为这种场景而生:当数据变化产生后,通过调用 IGListDiff 自动计算前后两次的差值,为后续批量刷新提供数据。整个算法的复杂度为 O(n),相当高效。
IGList Diff
算法介绍
IGListDiff 使用一个额外的哈希表和两个新旧哈希列表 hash entry list 使得比较的算法复杂度从 O(n^2) 变成 O(n)。一个 hash entry 定义为
/// hash entry
struct IGListentry {
/// 记录旧队列中相同 hash 值对象个数
NSInteger oldCounter = 0;
/// 记录新队列中相同 hash 值对象个数
NSInteger newCounter = 0;
/// 旧队列中当前 hash 对应的对象序号堆栈
stack<NSInteger> oldIndexes;
/// 标示数据是否有更新
BOOL updated = NO;
};
然后我们就可以进行数据比较了,主要是四个步骤
- 遍历新队列,计算对象
hash值并找到对应entry,使得newCount++,同时计入new entry list - 遍历旧队列,计算对象
hash值并找到对应entry,使得oldCount++,同时将当前序号入栈oldIndexes.push(i),并记录old entry list - 遍历
new entry list,检查entry对应的oldIndexes信息,如果堆栈中有旧队列序号值,则表示当前entry至少对应新旧队列中的两个对象,即发生所谓的entry match,进行记录,方便后续反向查询。再通过检查新队列当前对象和entry 对应旧对象是否相同确认update状态。 - 再次遍历新旧
entry list,检查每个entry的entry match状态- 没有
entry match的对象,在新队列中的被标记为insert,而在旧队列中的则被标示为delete - 有
entry match的对象通过比较新旧队列序号和update状态分表表示为update,move和not modified
- 没有
举例
以旧数组 [1,2,3] 和新数组 [1,3,5] 为例 (数字比较直接忽略 update 状态)
- 遍历新数组,得到
[entry1,entry3,entry5]列表,记为nl - 遍历旧数组,得到
[entry1,entry2,entry3]列表,记为ol - 遍历
nl,由于entry1 oldIndexs = [0],entry3 oldIndexes = [2]所以他们是entry match,做记录 (reverse lookup) - 遍历
olentry1有entry match,跳过entry2没有entry match,记为deleteentry3有entry match,跳过
- 遍历
nlentry1有entry match,同时相对位置不变,记为not modified(其实就是跳过)entry3有entry match,但是相对位置变化,记为moveentry5没有entry match,记为insert
- 输出一个包含
insert,move,delete和update列表信息的最终结果