1.binary instrumentation: 二进制执行文件插桩简介
2.从规范面解读:Promises/A+规范与浏览器Promise规范有何区别?
3.generator 执行机制分析
binary instrumentation: 二进制执行文件插桩简介
在二进制层面对执行文件进行插桩,源码能够摆脱对源码和编译器的源码依赖,广泛应用于测试、源码函数收集、源码无用函数检测等领域。源码静态插桩(static instrumentation)利用此方法在二进制层面实现代码覆盖分析,源码有钱还源码装无需编译器支持,源码能够达到极高的源码代码覆盖率,避免编译器优化对桩指令的源码影响,且不受编程语言、源码编译器差异的源码限制。静态插桩灵活且强大,源码能覆盖大部分场景,源码包括异常处理等复杂逻辑。源码静态插桩工具如bcov,源码能够对二进制代码进行代码覆盖率分析,通过在关键位置插入探针,控制流转移至跳板(trampoline),执行相关操作后,再返回原路径。bcov扩展ELF文件,易安卓视频解析源码插入代码段与数据段,用于跳板逻辑与覆盖率数据存储。在原始代码位置插入跳转指令,跳转至跳板,跳板中修改覆盖率数据,执行原始代码块指令。通过分析运行后的数据段,可以了解哪些代码被执行过。inline hook原理与trampoline hook相似,用于替换函数开头指令,转移执行流,执行所需逻辑后,回调执行原始指令,再跳转回原路径。inline hook处理时需注意被覆盖指令的跳转、函数执行体、寄存器变量污染等问题。动态插桩在运行时利用工具收集信息,对性能影响较小,适用于不依赖编程语言、视频网站引导页源码编译器、操作系统的软件层面实现。动态插桩通过虚拟机实现,指令经过虚拟机处理,插桩相对容易。关于动态插桩的详细内容,已有文章进行深入讨论,感兴趣者可参考阅读。
从规范面解读:Promises/A+规范与浏览器Promise规范有何区别?
前言
Promise是一种优秀的异步解决方案,其原生实现更是面试中的爆点,提到Promise实现,我们首先会想起Promises/A+规范,大多数教程中都是按照Promises/A+规范来实现Promise。
小包也是Promises/A+圣经的执行者之一,但小包心中一直有个好奇,遵循Promises/A+规范实现的Promise与ES6-Promise能有什么区别呐?
文章中的测试代码选取小包基于Promises/A+规范实现的原生Promise
学习本文,你能收获:
进一步完善原生Promise的实现
更进一步理解Promise与microTask之间的关系
promise的成功值valuePromises/A+规范只提供了value的定义,并没有详细说明如何处理不同类型的value值:
“value”isanylegalJavaScriptvalue(including?undefined,athenable,orapromise).value可以是任意合法的JavaScript值,包括undefined、具备then接口的简单网页制作成品源码对象或者promise
但ECMAScript规范对不同类型的value做了细致的处理。
红框部分我们可以看出,ES6规范会根据resolution(相当于Promises/A+规范中的value)类型选取不同的执行方案。
判断resolution是否为Object,如果不是,直接执行FulfillPromise
如果是Object,试探是否存在then接口
判断then是否可执行(abruptcompletion可以理解为非正常值)
如果then可执行,将then方法放入事件队列中。
PromiseResolveThenableJob:该job使用传入的thenable的then方法来解决promise。
一句话总结上面的过程:如果value值为可thenable对象或者promise,ES6会采用该thenable的状态。
小包举个栗子:
const?p?=?new?Promise((resolve)?=>?{ ?resolve(1);});const?p1?=?new?Promise((resolve)?=>?{ ?resolve(p);});p1.then((d)?=>?console.log(d));p1接收的成功值value为Promisep,p状态为fulfilled,这种情况下ES6中会采取p的状态及value,因此最终打印1。
我们将p更换为具备thenable对象,结果也是类似的。
//?类?promise?对象const?p1?=?{ ?a:?1,?then(onFulfilled,?onReject)?{ onFulfilled(this.a);?},};const?p2?=?new?Promise((resolve)?=>?{ ?resolve(p1);});//?1p2.then((d)?=>?console.log(d));Promises/A+没有对此进行规范,因此当传入的value为thenable对象时,会原封不动的输出。
那我们应该如何完善这部分代码呐?我们需要对value值进行解析,最新裂变强制分享源码如果value可thenable,则采纳他的状态和值,递归进行上述步骤,直至value不可thenable。(这里与resolvePromise部分递归解析onFulfilled函数的返回值是类似的)
const?resolve?=?(value)?=>?{ ?if?(typeof?value?===?"object"?&&?value?!=?null)?{ try?{ ?const?then?=?value.then;?if?(typeof?then?===?"function")?{ return?then.call(value,?resolve,?reject);?}}?catch?(e)?{ ?return?reject(e);}?}?if?(this.status?===?PENDING)?{ this.value?=?value;this.status?=?FULFILLED;this.onFulfilledCallbacks.forEach((cb)?=>?cb(this.value));?}};Promise与microTaskPromises/A+规范中其实并没有将Promise对象与microTask挂钩,规范是这么说的:
Here“platformcode”meansengine,environment,andpromiseimplementationcode.Inpractice,thisrequirementensuresthat?onFulfilled?and?onRejected?executeasynchronously,aftertheeventloopturninwhich?then?iscalled,andwithafreshstack.Thiscanbeimplementedwitheithera“macro-task”mechanismsuchas?setTimeout?or?setImmediate,orwitha“micro-task”mechanismsuchas?MutationObserver?or?process.nextTick.Sincethepromiseimplementationisconsideredplatformcode,itmayitselfcontainatask-schedulingqueueor“trampoline”inwhichthehandlersarecalled.
Promises/A+规范中表示then方法可以通过setTimeout或setImediate等宏任务机制实现,也可以通过MutationObserver或process.nextTick等微任务机制实现。
但经过大量面试题洗礼的我们知道浏览器中的Promise.then典型的微任务。既然都学到这里了,小包索性就打破砂锅问到底,找到Promise与microTask挂钩的根源。
谁规定了Promise是microTask标准读起来属实有些无聊,但好在小包找到了最终的答案。
首先小包先入为主的以为,Promise的详细规定应该都位于ECMAScript制定的规范中,但当小包进入标准后,全局搜索micro,竟然只搜索到三个Microsoft。讲实话,小包是震惊的,ECMAScript并没有规定Promise是microTask。
ECMAScript规范中,最接近的是下面两段表达:
The?host-defined?abstractoperationHostEnqueuePromiseJobtakesarguments?job?(a?Job?AbstractClosure)and?realm?(a?RealmRecord?or?null)andreturns?unused.Itschedules?job?tobeperformedatsomefuturetime.The?AbstractClosures?usedwiththisalgorithmareintendedtoberelatedtothehandlingofPromises,orotherwise,tobescheduledwithequalprioritytoPromisehandlingoperations.
JobsarescheduledforexecutionbyECMAScripthostenvironments.ThisspecificationdescribesthehosthookHostEnqueuePromiseJobtoscheduleonekindofjob;hostsmaydefineadditionalabstractoperationswhichschedulejobs.SuchoperationsacceptaJobAbstractClosureastheparameterandscheduleittobeperformedatsomefuturetime.Theirimplementationsmustconformtothefollowingrequirements:
上面两句话意思大约是:ECMAScript中将Promise看作一个job(作业),HostEnqueuePromiseJob是用来调度Promise作业的方法,这个方法会在未来某个时间段执行,具体执行与Promise的处理函数或者与Promise处理操作相同的优先级有关。
那何处将Promise规定为microTask呐?---HTML标准
HTML标准中指出:
JavaScriptcontainsan?implementation-defined?HostEnqueuePromiseJob(job,?realm)abstractoperationtoschedulePromise-relatedoperations.HTMLschedulestheseoperationsinthemicrotaskqueue.
上述标准的最后一句话指出,HTML将在microqueue中安排这些操作。破案了,原来是HTML标准中将Promise规定为microTask。(为什么会是HTML进行规定,小包还没有探究出来)
更深入的区别,请参考月夕大佬:V8Promise源码全面解读
后语我是?战场小包?,一个快速成长中的小前端,希望可以和大家一起进步。
如果喜欢小包,可以在?掘金?关注我,同样也可以关注我的小小公众号——小包学前端。
一路加油,冲向未来!!!
疫情早日结束人间恢复太平原文:/post/
generator 执行机制分析
本文以下面代码为例,分析 generator 执行机制相关的源码,版本为 V8 7.7.1。
首先,当 let iterator = test() 开始执行时,V8 调用 Runtime_CreateJSGeneratorObject,创建一个生成器对象。此函数逻辑是创建 JSGeneratorObject 的实例,设置相关属性后返回生成器对象 generator。此时生成器对象 generator 被保存在累加器中。在字节码 SuspendGenerator 的处理函数中,该函数暂停当前函数的执行,并多次调用 StoreObjectField 来保存生成器函数当前运行的状态。最后返回累加器中的值,即生成器对象 generator。因此,生成器函数在执行到“第一次暂停”的位置时,处于暂停状态。
在有了生成器对象后,可以调用其 next 方法让生成器函数继续执行。当 JavaScript 代码继续执行 iterator.next() 时,生成器对象的 next 方法被调用。生成器函数恢复执行需要 CPU 的寄存器操作。在笔者的 Mac 下,调用链路为GeneratorBuiltinsAssembler::GeneratorPrototypeResume-> CodeFactory::ResumeGenerator-> Builtins::Generate_ResumeGeneratorTrampoline。之后,调用 X 汇编,使生成器函数在暂停处恢复执行。此过程通过 Builtins::Generate_ResumeGeneratorTrampoline 函数完成,函数通过将未来要返回的地址压栈,并跳转到生成器函数 test 暂停的地方,继续执行。
生成器函数从暂停处继续执行后,字节码一行一行往下执行,直到遇到下一个 SuspendGenerator,即“第二次暂停”。这是由 yield 带来的。yield 被 V8 编译成 SuspendGenerator 和 ResumeGenerator 两条字节码,分别表示保存状态暂停和恢复状态继续执行。
async/await 与 generator 的关系分析:async/await 和 generator 都有暂停当前函数执行并从暂停处恢复执行的能力。await 和 yield 对应的字节码都是 SuspendGenerator 和 ResumeGenerator。生成器函数暂停时,需要调用生成器对象的 next 方法来从暂停处恢复执行。async 函数依赖 Promise 和 microtask,当 V8 在执行 microtask 队列时,已经暂停的 async 函数恢复执行。async 函数通过 Generator 和 Promise 获得保存状态暂停和恢复状态执行的能力,以及自我驱动向下继续执行的能力,从而避免调用 next 方法。
JavaScript 中的函数类型较为复杂。虽然在 JavaScript 中,1 和 0.1 都是 number,但在 V8 中它们是不同的类型,内存表示和 CPU 运算指令也有所不同。因此,即使在 JavaScript 中 typeof 都返回 function 的 test、test1、test2,在 V8 中是不同的类型。日常开发中,当一个组件/方法需要一个函数做为参数时,需要确保正确传递 ES6 之前的函数、async 函数或生成器函数,以避免运行时错误。
原生 generator 与 babel 转译的区别:在日常开发中,生成器/async 函数会被 babel 转译成类似下面的代码。这段代码中,test 函数被多次调用,但由于闭包保存了函数执行的状态,每次调用 test 都是新的 test。这种实现非常巧妙,但与 V8 中生成器函数的原理有较大区别。Babel 转译的代码无法生成字节码 SuspendGenerator 和 ResumeGenerator。
总结:生成器函数被调用时,开始执行并返回生成器对象后暂停。调用 iterator.next() 后,生成器函数从第一次暂停的位置恢复执行,遇到 yield(SuspendGenerator)后第二次暂停。