90行代码实现模块打包器
作者:卡颂
来源:SegmentFault 思否社区
大家好,我卡颂。
今天来聊聊如何用90行代码实现一个现代JS
模块打包器。
我们的打包器虽然迷你,但是实现了webpack
的核心功能。
而且,我知道你看到大段代码头疼,所以这篇文章都是图。看完感兴趣的话,
这里是完整代码的仓库地址:GitHub - BetaSu/minipack: 📦 现代JS模块打包器的简易实现、详细教学
只有90行代码哦。
让我们愉快的开始吧。
生成依赖图
如果应用是个毛线团的话,那么入口文件就是线头。打包器要做的第一件事是:
顺着线头开始滤清整条线的走向
假设入口文件是entry.js
:
// entry.js
import a from './a.js';
import b from './b.js';
console.log(a, b);
他依赖了a.js
与b.js
。
em... 有点太简陋了,让我们再扩展下a.js
与b.js
:
// a.js
import c from './c.js';
// ...
// b.js
import d from './d.js';
import e from './e.js';
// ...
所以整个依赖关系是这样:
打包器会从入口文件开始,尝试建立模块(即js
文件)间的依赖关系,也就是刚才我们讲的顺着线头开始滤清整条线的走向。
模块间的依赖关系可以通过分析模块代码中的import 声明语句
得知。
为了能分析import 声明语句
,可以使用babel
等编译工具将模块代码分解为AST
(抽象语法树)。
遍历AST
,类型为ImportDeclaration
的节点就是import声明语句
。
最后,我们将AST
重新转换为可执行的目标代码
,可能还需要根据代码要执行的宿主环境(一般为浏览器)对代码做一些转换。
比如,浏览器不支持import './a.js'
这样的ESM
语法,那么我们需要将所有ESM
语法转为CJS
语法。
// 源代码
import './a.js';
// 转换后
require('./a.js');
所以,对于任一模块(js
文件),会经历:
右边包含目标代码
和模块间依赖关系
的数据结构被称为asset
。
每个asset
可以通过模块间依赖关系
找到依赖的模块,重复这一过程,生成新的asset
,最终形成整个应用所有asset
间的依赖关系:
应用完整的依赖关系被称为依赖图(dependency graph)。
打包代码
接下来,只需要遍历依赖图,将所有asset
的目标代码
打包在一起就行。
所有代码会被打包在一个立即执行函数中:
(function(modules) {
// 打包好的代码
})(modules)
modules
中保存了所有asset
及他们之间的依赖关系。
如果你对modules
的细节感兴趣,可以去文末仓库里翻代码
刚才说过,asset
的目标代码
是CJS
规范的,类似:
// entry.js
require('./a.js');
require('./b.js');
这意味着我们需要实现:
require
方法(用于引入依赖的其他asset
的目标代码)module
对象(用于保存当前asset
的目标代码
执行后导出的数据)
同时,为了防止不同asset
的目标代码
中的变量互相污染,每个目标代码
需要独立的作用域。
我们将目标代码
包裹在函数
中:
// 我们操作的是字符串模版
`function (require, module, exports) {
${asset.code}
}`
所以,最终打包的结果为:
(function(modules) {
function require() {// ...}
require(入口asset的ID)
})(modules)
这段字符串被包裹在浏览器<script>
标签内,会依次执行:
require
(入口
asset
的
ID
),执行入口asset
的目标代码
目标代码
内部会调用require
执行其他asset
的目标代码
一步步执行下去...
总结
打包器的工作原理分为两步:
从入口文件开始遍历,生成依赖图
根据依赖图,将代码打包进一个立即执行函数
这个打包器还很稚嫩,缺失很多必要的功能,比如:
解决循环依赖
缓存
但是瑕不掩瑜嘛~
点击左下角阅读原文,到 SegmentFault 思否社区 和文章作者展开更多互动和交流,扫描下方”二维码“或在“公众号后台“回复“ 入群 ”即可加入我们的技术交流群,收获更多的技术文章~
- END -