JavaScript Modules Part 2: Module Bundling笔记

date

Feb 27, 2018

slug

module-bundling

status

Published

前言

自己刚开始接触前端的时候，前端生态圈已处于一个蓬勃发展的阶段，各类打包工具层出不穷。Github 上的许多脚手架项目如 create-react-app 都支持零配置启动一个前端项目。工具的便捷能让开发者不再为复杂的打包工具的配置而烦恼，但是这并不代表开发者可以不去了解打包工具运作的原理。通过精读 JavaScript Modules Part 2: Module Bundling 这篇文章，我们将更加深入得了解前端项目的模块打包。这篇文章主要内容分以下几点：

为什么我们要将模块打包

现今流行的几种打包方案

JavaScript 模块化的未来

笔记

什么是模块打包

模块打包是一个将一组模块（及其依赖）按照正确的顺序打包成一个文件（或多个文件）的过程。

为什么要打包

不同 JavaScript 模块通常以不同的.js文件存在，那么在 HTML 文件中需要引入多个 js 文件，导致浏览器在渲染页面时产生较多的 HTTP 请求。要提高页面性能，我们往往需要将不同 js 文件串联起来，并打包成一个（或者多个）文件。当然，打包工具所做的工作不仅仅是将不同模块串联起来那么简单。

模块打包的不同方式

上一篇文章中提到，现今在 JavaScript 生态圈中有多种模块化方案，如 CommonJS、AMD、ES6 Modules等，那么对应不同的模块化方案，也存在着不同的打包工具。这也意味着，打包工具的另一项工作就是需要将打包前的代码转换成browser-friendly的代码。

CommonJS 模块的打包工具——Browserify

Browserify 是一个为浏览器编译 CommonJS 模块的工具。 Browserify 使用示例 假设我们在main.js中引入 myDependency 模块来计算一个数组的平均值。

// main.js
var myDependency = require(‘myDependency’);

var myGrades = [93, 95, 88, 0, 91];

var myAverageGrade = myDependency.average(myGrades);

然后使用 Browserify 打包：

browserify main.js -o bundle.js

运作原理 通过为每一个require语句编译 abstract syntax tree (AST)，来遍历整个项目的整个依赖关系，并根据依赖关系按顺序将各个模块打包成一个文件。

构建 AMD 模块

在浏览器中，我们通常使用 Require.js 和 Curl来动态加载 AMD 模块。由于 AMD 是异步加载模块的，所以理论上讲我们不需要将 AMD 模块打包成一个模块，浏览器只会逐步请求那些执行程序所必需的文件，而不是在用户第一次访问页面的时候一次性下载所有模块。在开发环境中，AMD 应用不需要进行构建（打包）。但是当应用发布至生产环境时，开发者们还是会使用构建工具来打包 AMD 模块并压缩代码来实现最佳性能，使用诸如 Require.js 优化器——r.js 之类的工具。

Webpack

Webpack 支持 CommonJS、AMD 及 ES6 Modules 等各种模块化方案来组织前端应用的依赖关系。另外，Webpack 还支持代码分割（code splitting），它能将代码分割为一个个按需加载的 chunk。 webpack 官网：https://webpack.js.org

ES6 modules

ES6 模块系统与 CommonJS、AMD 之间最大的区别在于 ES6 模块系统具有静态分析（static analysis）的特性——当你import一个模块时，import在编译时就被解析了。基于这个特性，通过 Webpack 和 Rollup 等构建工具便能做到 Tree Shaking。

Tree Shaking

tree shaking 是一个术语，通常用于描述移除 JavaScript 上下文中的未引用代码(dead-code)。它依赖于 ES6 模块系统中的静态结构特性，例如 import 和 export。下面是一个简单的例子。util.js 中定义并export了each、filter、map和reduce三个函数：

// util.js

export function each(collection, iterator) {
  if (Array.isArray(collection)) {
    for (var i = 0; i < collection.length; i++) {
      iterator(collection[i], i, collection);
    }
  } else {
    for (var key in collection) {
      iterator(collection[key], key, collection);
    }
  }
 }

export function filter(collection, test) {
  var filtered = [];
  each(collection, function(item) {
    if (test(item)) {
      filtered.push(item);
    }
  });
  return filtered;
}

export function map(collection, iterator) {
  var mapped = [];
  each(collection, function(value, key, collection) {
    mapped.push(iterator(value));
  });
  return mapped;
}

export function reduce(collection, iterator, accumulator) {
    var startingValueMissing = accumulator === undefined;

    each(collection, function(item) {
      if(startingValueMissing) {
        accumulator = item;
        startingValueMissing = false;
      } else {
        accumulator = iterator(accumulator, item);
      }
    });

return accumulator;
}

然后首先在main.js引入util.js中的所有函数：

// main.js

import * as Utils from ‘./utils.js’;

仅使用each函数：

// main.js

import * as Utils from ‘./utils.js’;

Utils.each([1, 2, 3], function(x) { console.log(x) });

经过 Tree shaking 处理之后，main.js等价于：

function each(collection, iterator) {
  if (Array.isArray(collection)) {
    for (var i = 0; i < collection.length; i++) {
      iterator(collection[i], i, collection);
    }
  } else {
    for (var key in collection) {
      iterator(collection[key], key, collection);
    }
  }
 };

each([1, 2, 3], function(x) { console.log(x) });

HTTP/2 会使模块化构建过时吗？

使用 HTTP/1，每个 TCP 连接只允许发出一个请求。这就是为什么加载多个资源需要多个请求。而 HTTP/2 是多路复用的，这意味着多个请求和响应可以并行发生。因此，我们可以通过单个连接同时处理多个请求。在 HTTP/2 的支持下，加载一堆模块似乎不再是一个巨大的性能问题。但是，模块打包工具所做的不仅仅是打包，比如它通常会移除无用代码以节省空间等……若要追求极致性能，模块化构建还是很有必要的。

另外，我们离所有的网站都采用 HTTP/2 传输还有很长一段时间。短期内使用模块化构建还是很有必要的。 HTTP/2 与 HTTP/1 的详细对比可见：https://http2.github.io/faq/#what-are-the-key-differences-to-http1x