Stirling-PDF安装教程

Stirling-PDF是一款全能的网页PDF处理工具。下面以一台空白的雨云云服务器为例进行部署。

视频教程

STEP 1 更新系统软件包列表(必须)

sudo apt update

STEP 2 安装常用工具(curl、wget、unzip、ca-certificates)

sudo apt -y install curl wget unzip ca-certificates gnupg lsb-release

STEP 3 添加 Docker 官方仓库

# 添加 GPG 密钥
sudo install -m 0755 -d /etc/apt/keyrings

curl -fsSL https://download.docker.com/linux/ubuntu/gpg | \
  sudo gpg --dearmor -o /etc/apt/keyrings/docker.gpg

# 添加仓库
echo \
  "deb [arch=$(dpkg --print-architecture) signed-by=/etc/apt/keyrings/docker.gpg] \
  https://download.docker.com/linux/ubuntu $(lsb_release -cs) stable" | \
  sudo tee /etc/apt/sources.list.d/docker.list >/dev/null

# 更新仓库索引
sudo apt update

STEP 4 安装 Docker + Docker Compose

sudo apt -y install docker-ce docker-ce-cli containerd.io docker-buildx-plugin docker-compose-plugin

STEP 5 把当前用户加入 docker 组

sudo usermod -aG docker $USER
newgrp docker   # 立即生效,无需重登录

STEP 6 验证 Docker 是否就绪

docker version
# 看到 Server 和 Client 版本号即成功

STEP 7 创建持久化目录(fonts、OCR、配置、临时文件)

mkdir -p $HOME/stirling-pdf/{fonts,ocr/tessdata,configs,work}
cd $HOME/stirling-pdf

STEP 8 拉取 Stirling-PDF 官方镜像

docker pull ghcr.io/stirling-tools/stirling-pdf:latest

STEP 9 下载中文简体 OCR 训练数据

cd $HOME/stirling-pdf/ocr/tessdata
curl -L -O https://github.com/tesseract-ocr/tessdata/raw/main/chi_sim.traineddata
curl -L -O https://github.com/tesseract-ocr/tessdata/raw/main/chi_sim_vert.traineddata
ls -l *.traineddata

STEP 10 把系统字体复制到本地卷(容器挂载用)

# 创建字体卷目录
FONT_DIR=$HOME/stirling-pdf/fonts
# 复制文泉驿 & Noto 字体
cp -r /usr/share/fonts/truetype/wqy $FONT_DIR/ 2>/dev/null || true
cp -r /usr/share/fonts/opentype/noto $FONT_DIR/ 2>/dev/null || true

STEP 11 生成字体缓存(容器内用)

docker run --rm -v $FONT_DIR:/fonts:ro alpine sh -c "
  apk add fontconfig &&
  fc-cache -fv /fonts"

STEP 12 启动 Stirling-PDF 容器(带中文 OCR & 字体)

DOCKER_VOL=$HOME/stirling-pdf
docker run -d --name stirling-pdf \
  -p 8080:8080 \
  -v $DOCKER_VOL/work:/tmp/work \
  -v $DOCKER_VOL/fonts:/usr/share/fonts/custom:ro \
  -v $DOCKER_VOL/ocr/tessdata:/usr/share/tesseract-ocr/4/tessdata:ro \
  -e DOCKER_ENABLE_SECURITY=false \
  -e TESSERACT_LANGS=chi_sim,chi_sim_vert,chi_tra,eng \
  -e SYSTEM_DEFAULTLOCALE=zh_CN \
  ghcr.io/stirling-tools/stirling-pdf:latest

STEP 13 检查容器日志

docker logs stirling-pdf | tail -n 30

看到 Started StirlingPDF in xxx seconds 即启动成功。


STEP 14 浏览器访问

http://<你的服务器IP>:8080