Dockerfile学习

cnb 链接

掌握 Dockerfile：从零到一的全面学习指南

如果你正在容器化的世界里探索，那么 Dockerfile 绝对是你需要深入理解的核心工具。它是一个文本文件，包含了一系列指令，Docker 可以根据这些指令自动构建镜像。掌握 Dockerfile 不仅能让你更好地控制镜像的构建过程，还能帮助你优化镜像大小、提高部署效率。

本文将带你从头开始，全面探索 Dockerfile 的所有关键知识点，助你成为 Docker 容器化的高手！

为什么 Dockerfile 如此重要？

想象一下，你需要为你的应用程序创建一个标准化的运行环境。手动安装各种依赖、配置环境变量，不仅耗时而且容易出错。Dockerfile 就是为了解决这个问题而生的。它通过 代码化 的方式定义了镜像的构建步骤，带来了诸多优势：

自动化： 一键构建镜像，告别繁琐的手动操作。
可重复性： 确保每次构建的镜像都完全一致，避免“在我机器上能跑”的问题。
版本控制： 将 Dockerfile 和你的代码一起进行版本管理，方便追踪和回溯。
透明性： 任何人都可以通过 Dockerfile 了解镜像的构建过程和包含内容。
协作性： 团队成员之间共享和复用 Dockerfile，提高开发效率。

Dockerfile 的基本结构

一个 Dockerfile 通常由一系列指令组成，每个指令都代表一个操作。这些指令是按照顺序执行的。

# 注释：用于解释说明
FROM <基础镜像>  # 指定基础镜像
LABEL <key>=<value>  # 为镜像添加元数据
WORKDIR <工作目录>  # 设置工作目录
COPY <源路径> <目标路径>  # 复制文件或目录
ADD <源路径> <目标路径>  # 复制文件或目录（功能更强）
RUN <命令>  # 执行命令
ENV <环境变量名>=<值>  # 设置环境变量
EXPOSE <端口>  # 暴露端口
VOLUME <挂载点>  # 定义匿名卷
USER <用户>  # 指定运行用户
ARG <参数名>[=<默认值>]  # 定义构建参数
ONBUILD <指令>  # 当此镜像作为基础镜像时执行的指令
HEALTHCHECK <选项> CMD <命令>  # 定义健康检查
ENTRYPOINT ["可执行文件", "参数1", "参数2"]  # 容器启动时执行的命令
CMD ["参数1", "参数2"]  # 容器启动时执行的默认命令

核心指令详解

让我们深入了解 Dockerfile 中最常用和最重要的指令：

1. `FROM`：基石

FROM 指令是 Dockerfile 的第一条非注释指令，它指定了构建新镜像所基于的基础镜像。

语法： FROM <image>[:<tag>] [AS <name>]
示例： FROM ubuntu:22.04 或 FROM alpine:3.18
要点：
- 选择一个适合你应用的基础镜像至关重要。选择小巧、精简的基础镜像（如 Alpine）可以显著减小最终镜像的大小。
- 明确指定标签（tag）可以避免因基础镜像更新而导致构建行为不一致。

2. `RUN`：执行命令

RUN 指令用于在镜像构建过程中执行命令。这些命令会在当前镜像的顶部创建一个新的层。

语法：
- RUN <command> (shell 形式)
- RUN ["executable", "param1", "param2"] (exec 形式)
示例：
- RUN apt-get update && apt-get install -y vim
- RUN ["npm", "install"]
要点：
- 链式命令： 尽可能将多个相关联的 RUN 命令合并为一条，使用 && 连接，并用 \ 进行换行。这可以减少镜像层数，提高构建效率和镜像大小。
- 清理： 在执行安装命令后，务必清理不必要的缓存文件，例如 apt-get clean 或 rm -rf /var/lib/apt/lists/*，进一步减小镜像大小。
- exec 形式 vs shell 形式： exec 形式不会在 shell 中执行，可以避免 shell 环境变量带来的问题，更推荐用于执行明确的二进制文件。

3. `COPY` 与 `ADD`：复制文件

这两个指令都用于将文件或目录从构建上下文复制到镜像中。

COPY 语法： COPY [--chown=<user>:<group>] <src>... <dest>
ADD 语法： ADD [--chown=<user>:<group>] <src>... <dest>
示例：
- COPY . /app (复制当前目录所有内容到镜像的 /app 目录)
- ADD http://example.com/latest.tar.gz /tmp/ (下载 URL 并解压)
要点：
- 推荐 COPY： 在大多数情况下，优先使用 COPY。COPY 更加透明和可预测，它只做简单的文件复制。
- ADD 的额外功能： ADD 具有两个额外的功能：
  - 可以处理本地 tar 压缩包（自动解压）。
  - 支持从 URL 下载文件。
- 缓存： Docker 会缓存 COPY 和 ADD 指令。如果源文件内容没有改变，即使目标文件路径相同，Docker 也不会重新执行这些指令，这有助于加速构建。

4. `WORKDIR`：设置工作目录

WORKDIR 指令用于为 Dockerfile 中任何 RUN、CMD、ENTRYPOINT、COPY 和 ADD 指令设置工作目录。

语法： WORKDIR <path>
示例：
- WORKDIR /app
- COPY . . (此时会复制到 /app 目录下)
要点：
- 设置一个明确的工作目录，可以使 Dockerfile 更简洁，并避免路径混乱。
- 如果在 WORKDIR 之后有其他需要访问的文件，它们的路径都将相对于此工作目录。

5. `EXPOSE`：暴露端口

EXPOSE 指令用于通知 Docker，容器在运行时会监听指定的网络端口。它并不会实际发布端口，只是一个文档说明。

语法： EXPOSE <port> [<port>/<protocol>...]
示例： EXPOSE 80 或 EXPOSE 80/tcp 443/udp
要点：
- 要真正发布端口，你需要在运行 docker run 命令时使用 -p 或 -P 参数。

6. `ENV`：设置环境变量

ENV 指令用于设置环境变量，这些变量在构建时和容器运行时都可用。

语法：
- ENV <key>=<value> ...
- ENV <key> <value> (不推荐，容易混淆)
示例： ENV APP_VERSION=1.0.0
要点：
- 环境变量对于配置应用程序非常有用，例如数据库连接字符串、API 密钥等。
- 可以使用 RUN echo $APP_VERSION 在构建时验证。

7. `CMD` 与 `ENTRYPOINT`：定义容器启动命令

这两个指令都用于定义容器启动时执行的命令，但它们之间存在重要的区别。

CMD 语法：
- CMD ["executable","param1","param2"] (exec 形式，推荐)
- CMD ["param1","param2"] (作为 ENTRYPOINT 的默认参数)
- CMD command param1 param2 (shell 形式)
ENTRYPOINT 语法：
- ENTRYPOINT ["executable", "param1", "param2"] (exec 形式，推荐)
- ENTRYPOINT command param1 param2 (shell 形式)

区别与配合：

特性	`CMD`	`ENTRYPOINT`
目的	提供容器启动时的默认命令或参数	指定容器启动时总是执行的命令
可被覆盖	容易被 `docker run` 命令行的参数覆盖	不容易被覆盖，常与 `CMD` 配合使用
数量	Dockerfile 中只能有一个 `CMD` 指令	Dockerfile 中只能有一个 `ENTRYPOINT` 指令
推荐用法	提供默认参数给 `ENTRYPOINT`	作为固定可执行程序，后面跟参数

示例：

# CMD 示例 (作为默认命令)
CMD ["nginx", "-g", "daemon off;"]

# ENTRYPOINT 示例 (作为固定可执行程序)
ENTRYPOINT ["node", "app.js"]

# ENTRYPOINT 与 CMD 配合示例 (最佳实践)
ENTRYPOINT ["java", "-jar"]
CMD ["my-app.jar"]
# 此时，`docker run <image>` 会执行 `java -jar my-app.jar`
# `docker run <image> new-app.jar` 会执行 `java -jar new-app.jar`

要点：
- 当你希望容器的行为是固定的，并且可以接受额外的参数时，使用 ENTRYPOINT 结合 CMD 是最佳实践。
- 当你只需要提供一个默认的启动命令，并且用户可以轻易覆盖时，使用 CMD。
- 始终使用 exec 形式，避免 shell 带来的额外开销和不确定性。

Dockerfile 优化技巧

构建高效、小巧的 Docker 镜像是容器化成功的关键。以下是一些重要的优化技巧：

选择合适的基础镜像： 优先选择官方的、轻量级的基础镜像，如 alpine 系列。

多阶段构建 (Multi-stage Builds)： 这是 Dockerfile 优化的“杀手锏”。它允许你在一个 Dockerfile 中定义多个构建阶段。前一阶段用于编译、测试等，并将最终的构建产物复制到下一阶段的精简镜像中。这样可以丢弃构建过程中产生的中间文件和工具，极大地减小最终镜像的大小。

# 第一阶段：构建应用
FROM node:18-alpine AS builder
WORKDIR /app
COPY package.json package-lock.json ./
RUN npm install
COPY . .
RUN npm run build

# 第二阶段：运行应用
FROM node:18-alpine
WORKDIR /app
COPY --from=builder /app/build ./build  # 从 builder 阶段复制构建产物
COPY --from=builder /app/node_modules ./node_modules
COPY package.json ./
CMD ["node", "build/index.js"]

合理使用 .dockerignore： 类似于 .gitignore，.dockerignore 文件可以指定在构建时忽略的文件和目录。这可以避免不必要的文件被复制到构建上下文中，加快构建速度。
1
2
3
4
5
6
# .dockerignore 示例
node_modules/
.git/
.vscode/
*.log
temp/
精简 RUN 命令：
- 合并多个 RUN 命令以减少层数。
- 在 RUN 命令后清理不必要的缓存和文件。
- 例如：RUN apt-get update && apt-get install -y --no-install-recommends <package> && rm -rf /var/lib/apt/lists/*
利用构建缓存： Docker 会根据指令和上下文文件计算哈希值，如果哈希值没有改变，就会使用缓存。
- 将不经常变动的文件（如依赖文件）放在 COPY 命令的前面，以便利用缓存。
- 例如，在 npm install 之前复制 package.json 和 package-lock.json。
指定精确版本： 在 FROM、RUN 等指令中指定软件的精确版本，以保证构建的可重复性。

Dockerfile 最佳实践

除了优化技巧，遵循一些最佳实践可以让你编写出更健壮、更易维护的 Dockerfile：

小写指令： Dockerfile 指令不区分大小写，但通常建议使用大写以提高可读性。
注释： 使用 # 添加清晰的注释，解释每一步的目的。
使用 exec 形式： 尽可能使用 CMD 和 ENTRYPOINT 的 exec 形式，避免 shell 带来的不确定性。
非 root 用户： 除非有特殊需求，否则不要以 root 用户运行容器。创建一个非 root 用户并使用 USER 指令切换，可以提高安全性。
最小化镜像层： 每个 RUN、COPY、ADD 等指令都会创建一个新的镜像层。合并相关指令，减少层数。
只安装必需品： 避免在镜像中安装与应用程序无关的工具或依赖。
构建上下文： 了解构建上下文的概念，它指的是 Docker 构建镜像时可用的文件和目录。
版本控制： 将 Dockerfile 与应用程序代码一起进行版本控制。

总结

Dockerfile 是 Docker 容器化旅程中不可或缺的一部分。通过深入理解其指令、优化技巧和最佳实践，你将能够：

高效地构建 Docker 镜像。
创建精简、安全的容器。
实现应用部署的自动化和可重复性。

Dockerfile学习

cnb 链接

掌握 Dockerfile：从零到一的全面学习指南

为什么 Dockerfile 如此重要？

Dockerfile 的基本结构

核心指令详解

1. FROM：基石

2. RUN：执行命令

3. COPY 与 ADD：复制文件

4. WORKDIR：设置工作目录

5. EXPOSE：暴露端口

6. ENV：设置环境变量

7. CMD 与 ENTRYPOINT：定义容器启动命令