如何使用JavaScript在浏览器中逐步压缩PDF文件

PDF文件随处可见。从发票和报告到简历和各种文档，它们都是我们最常处理的文件格式之一。但有一个普遍存在的问题：PDF文件的体积很容易变得很大。

如果你曾经尝试上传PDF文件时遇到文件大小限制，那么你就已经明白为什么压缩如此重要了。

大多数工具都是通过将文件上传到服务器来解决这个问题的。这种方法确实有效，但在处理私人或敏感文档时，并不总是最理想的方案。

好消息是，现代浏览器具备足够的性能，可以在本地对PDF文件进行基本的压缩处理。

在本教程中，你将学习如何使用JavaScript构建一个基于浏览器的PDF压缩工具，所有操作都会在浏览器内部直接完成。

基于浏览器的PDF压缩工具 allinonetool

PDF压缩的工作原理

PDF压缩与图像压缩是不同的。

PDF文件并不只是一张图片，而是一个结构化的文档，其中可以包含文本、图片、字体以及元数据。因此，要减小PDF文件的体积，就需要优化文件中的多个部分，而不是仅仅使用一种压缩方法。

在大多数情况下，压缩PDF文件意味着在可能的情况下降低图像质量，删除不必要的或未使用的数据，并优化文档的内部结构。

虽然在浏览器中操作时，我们无法像服务器端工具那样拥有那么高的控制权限，但仍然可以通过重新处理文档并将其保存为更高效的格式来减小文件大小。

这种方法虽然可能无法实现极度的压缩效果，但它能够有效地创建体积更小、效率更高的PDF文件，同时还能确保文件传输的速度和安全性。

项目设置

这个项目非常简单。

你只需要以下这些资源：

一个HTML文件
JavaScript代码
一个PDF处理库

不需要后端服务器，所有功能都在浏览器中本地运行。

我们使用的是什么库？

我们将使用pdf-lib这个库，它可以帮助我们加载和生成PDF文件。

你可以通过CDN来引入这个库：

<script src="https://unpkg.com/pdf-lib/dist/pdf-lib.min.js"></script>

创建上传界面

首先，我们可以从创建一个简单的上传界面开始：

<input type="file" id="upload" accept="application/pdf">
<button onclick="compressPDF()">>压缩PDF文件</button>

<a id="download" style="display:none;">>下载压缩后的PDF文件<>/a>

这样，用户就可以上传PDF文件，触发压缩过程，然后在压缩完成后下载结果文件。

读取上传的PDF文件

接下来，我们需要读取用户上传的PDF文件：

const fileInput = document.getElementById("upload");

if (!fileInput.files.length) {
  alert("请上传一个PDF文件");
  return;
}

const file = fileInput.files[0];
const arrayBuffer = await file.arrayBuffer();

了解压缩原理

由于我们在浏览器中开发这个程序，因此无法对PDF文件的压缩过程进行完全的低级控制。

相反，我们采用了一些实际的优化方法，这些方法能够在不影响文件可用性的前提下减少文件大小。例如，我们会以更高效的方式重新构建文档结构，删除不必要的元数据，并在可能的情况下降低图片质量。

我们的目标并不是实现完美的压缩效果，而是让文件体积变小，同时保持可接受的视觉质量和可读性。

压缩PDF文件

下面是具体的压缩逻辑：

async function compressPDF() {
  const fileInput = document.getElementById("upload");

  if (!fileInput.files.length) {
    alert("请上传一个PDF文件");
    return;
  }

  const file = fileInput.files[0];
  const arrayBuffer = await file.arrayBuffer();

  const { PDFDocument } = PDFLib;

  const originalPdf = await PDFDocument.load(arrayBuffer);
  const newPdf = await PDFDocument.create();

  const pages = await newPdf.copyPages(
    originalPdf,
    originalPdf.getPageIndices()
  );

  pages.forEach(page => new Pdf.addPage(page));

  const pdfBytes = await newPdf.save({
    useObjectStreams: true
  });

  const blob = new Blob([pdfBytes], { type: "application/pdf" });

  const link = document.getElementById("download");
  link.href = URL.createObjectURL(blob);
  link.download = "compressed.pdf";
  link.style.display = "inline";
  link.innerText = "下载压缩后的PDF文件";
}

这种方法利用经过优化的对象流来重新生成PDF文件，从而有效减小文件大小。

生成并下载文件

处理完成后：

link.href = URL.createObjectURL(blob);
link.download = "compressed.pdf";

文件会立即被下载下来，整个过程不需要与服务器进行任何交互。

演示：PDF压缩工具的工作原理

以下是在实际使用中，通过基于浏览器的PDF压缩工具完成整个操作流程的示例。

步骤1：上传PDF文件

PDF压缩工具界面，包含可拖放的文件上传区域以及“选择文件”按钮

首先上传您的PDF文件。您可以将文件拖放到上传区域，或者点击“选择PDF”按钮从设备中选取文件。

步骤2：预览PDF文件

基于浏览器的压缩工具中的PDF文件预览界面，包含页面导航功能

文件加载完成后，工具会显示文档的预览界面。您可以浏览各个页面，确认上传的是正确的文件，然后再开始压缩操作。

步骤3：选择压缩设置

PDF压缩设置选项，包括基本、推荐、高级等多种级别

接下来，根据您的需求选择合适的压缩级别。较低的压缩比例会保留更好的文件质量，而较高的压缩比例则能更显著地减小文件大小。您还可以查看一些高级设置选项，例如元数据处理功能。

步骤4：压缩PDF文件

基于浏览器的PDF压缩工具中的“压缩PDF”按钮，以及“重新开始”选项

点击“压缩PDF”按钮即可开始压缩过程。该工具会直接在您的浏览器中完成所有操作，无需将文件上传到任何服务器。

步骤5：下载压缩后的文件

压缩完成的PDF文件，显示了文件大小的减少情况以及用于下载优化后文件的按钮

压缩完成后，您会看到最终结果以及文件大小减少的情况。此时您可以立即为优化后的PDF文件重新命名并下载它。

实际使用中需要注意的事项

在浏览器中处理PDF文件的压缩时，处理大型文件就显得尤为重要。

如果用户上传的PDF文件体积非常大，尝试一次性处理所有内容可能会导致浏览器运行速度变慢，甚至出现卡顿现象。因此，最好不要盲目地尝试处理所有文件，而应该采取相应的检查措施，并谨慎地操作这些文件。

例如，您可以在处理文件之前先限制其大小：

const MAX_SIZE = 10 * 1024 * 1024; // 10MB

if (file.size > MAX_SIZE) {
  alert("文件体积过大。请上传小于10MB的文件.");
  return;
}

这样做可以避免出现性能问题，确保工具能够正常运行。

另一种有效的方法是分步处理文件，而不是一次性完成所有操作：

const { PDFDocument } = PDFLib;

const originalPdf = await PDFDocument.load(arrayBuffer);
const new Pdf = await PDFDocument.create();

for (let i = 0; i < originalPdf.getPageCount(); i++) {
  const [page] = await newPdf.copyPages(originalPdf, [i]);
  newPdf.addPage(page);
}

这种分步处理的方式可以让任务量分散开来，避免导致浏览器堵塞。

还需要注意的是，所有操作都是在客户端进行的。这意味着文件永远不会离开用户的设备，这对保护用户隐私非常有利。但同时，这也意味着性能会受到用户设备的限制，因此保持高效的处理速度非常重要。

需要避免的常见错误

一个常见的错误是在处理文件之前没有对用户输入的内容进行有效的验证。

例如，用户可能会尝试上传空文件、非PDF格式的文件，或者在没有选择任何文件的情况下就启动压缩操作。因此，提前检查这些情况对于避免后续出现错误非常重要：

const fileInput = document.getElementById("upload");

if (!fileInput.files.length) {
  alert("请上传PDF文件.");
  return;
}

const file = fileInput.files[0];

if (file.type !== "application/pdf") {
  alert("仅支持PDF格式的文件。")
  return;
}

另一个需要避免的问题是让无效或不符合要求的输入内容被直接处理。即使是像空文件或损坏的文件这样的简单问题，也可能会导致PDF处理失败，因此进行基本的验证可以使工具更加可靠。

在没有任何检查措施的情况下处理大型文件也是另一个常见的问题。如果允许体积过大的PDF文件被无限制地处理，那么它很可能会导致浏览器运行速度变慢，甚至使页面无法正常响应。添加简单的文件大小检查机制可以帮助避免这种情况：

const MAX_SIZE = 10 * 1024 * 1024; // 10MB

if (file.size > MAX_SIZE) {
  alert("文件体积过大。请上传小于10MB的文件。」
  return;
}

另一个常见的误解是认为压缩操作总会使文件大小显著减小。实际上，与专用的服务器端工具相比，基于浏览器的压缩技术存在诸多限制，因此压缩效果会因PDF文件的内容不同而有所差异。

在实际应用中，大多数问题都源于缺乏有效的验证机制以及对特殊情况的处理不当。在开发过程中加入一些简单的检查步骤，可以使工具更加稳定，从而提升整体用户体验。

结论

通过本教程，你已经使用JavaScript开发出了一个基于浏览器的PDF压缩工具。

你学会了如何读取和生成PDF文件，掌握了基本的优化技巧，并且能够在浏览器环境中完成整个压缩流程。

如果你想尝试这个工具的完整版本，可以访问以下链接：https://allinonetools.net/pdf-compressor/

这种开发方式能够确保工具运行速度快、使用方便且数据隐私得到有效保护。

一旦掌握了这一技术原理，你还可以进一步扩展它的功能，从而开发出更高级的文档处理工具。

而正是这一点，使得这项技术变得真正有趣起来。

目录