调度 GPU

配置和调度 GPU，供集群中的节点作为资源使用。

功能状态: Kubernetes v1.26 [stable]

Kubernetes 通过设备插件，在集群的不同节点上支持管理 AMD 和 NVIDIA GPU（图形处理单元）的稳定功能。

本页面描述了用户如何使用 GPU，并概述了实现中的一些限制。

使用设备插件

Kubernetes 实现设备插件，以允许 Pod 访问 GPU 等专用硬件功能。

注意： 本节链接到提供 Kubernetes 所需功能的第三方项目。Kubernetes 项目作者不对此类项目负责，这些项目按字母顺序排列。要将项目添加到此列表，请在提交更改前阅读内容指南。更多信息。

作为管理员，你必须在节点上安装相应硬件供应商的 GPU 驱动程序，并运行 GPU 供应商的相应设备插件。以下是一些供应商说明的链接

安装插件后，你的集群将公开一个自定义可调度资源，例如 amd.com/gpu 或 nvidia.com/gpu。

你可以通过请求自定义 GPU 资源来在容器中使用这些 GPU，这与你请求 cpu 或 memory 的方式相同。但是，在指定自定义设备的资源需求时存在一些限制。

GPU 仅应在 limits 部分中指定，这意味着

你可以指定 GPU limits 而不指定 requests，因为 Kubernetes 默认会将 limit 作为请求值使用。
你可以在 limits 和 requests 中都指定 GPU，但这两个值必须相等。
你不能在不指定 limits 的情况下指定 GPU requests。

以下是请求 GPU 的 Pod 的示例清单

apiVersion: v1
kind: Pod
metadata:
  name: example-vector-add
spec:
  restartPolicy: OnFailure
  containers:
    - name: example-vector-add
      image: "registry.example/example-vector-add:v42"
      resources:
        limits:
          gpu-vendor.example/example-gpu: 1 # requesting 1 GPU

管理具有不同类型 GPU 的集群

如果集群中的不同节点具有不同类型的 GPU，那么你可以使用节点标签和节点选择器来将 Pod 调度到适当的节点。

例如

# Label your nodes with the accelerator type they have.
kubectl label nodes node1 accelerator=example-gpu-x100
kubectl label nodes node2 accelerator=other-gpu-k915

标签键 accelerator 只是一个示例；如果你愿意，可以使用不同的标签键。

自动节点标签

作为管理员，你可以通过部署 Kubernetes 节点特征发现 (NFD) 自动发现并标记所有支持 GPU 的节点。NFD 会检测 Kubernetes 集群中每个节点上可用的硬件特征。通常，NFD 被配置为将这些特征作为节点标签公布，但 NFD 也可以添加扩展资源、注解和节点污点。NFD 与所有受支持的 Kubernetes 版本兼容。默认情况下，NFD 会为检测到的特征创建特征标签。管理员可以利用 NFD 对具有特定特征的节点添加污点，以便只有请求这些特征的 Pod 才能调度到这些节点上。

你还需要一个 NFD 插件，用于为节点添加适当的标签；这些标签可以是通用标签，也可以是供应商特定的标签。你的 GPU 供应商可能会提供 NFD 的第三方插件；请查阅其文档以获取更多详细信息。

apiVersion: v1
kind: Pod
metadata:
  name: example-vector-add
spec:
  restartPolicy: OnFailure
  # You can use Kubernetes node affinity to schedule this Pod onto a node
  # that provides the kind of GPU that its container needs in order to work
  affinity:
    nodeAffinity:
      requiredDuringSchedulingIgnoredDuringExecution:
        nodeSelectorTerms:
        - matchExpressions:
          - key: "gpu.gpu-vendor.example/installed-memory"
            operator: Gt # (greater than)
            values: ["40535"]
          - key: "feature.node.kubernetes.io/pci-10.present" # NFD Feature label
            values: ["true"] # (optional) only schedule on nodes with PCI device 10
  containers:
    - name: example-vector-add
      image: "registry.example/example-vector-add:v42"
      resources:
        limits:
          gpu-vendor.example/example-gpu: 1 # requesting 1 GPU

GPU 供应商实现

本页面上的项目涉及提供 Kubernetes 所需功能的第三方产品或项目。Kubernetes 项目作者不对这些第三方产品或项目负责。有关更多详细信息，请参阅 CNCF 网站指南。

在提议添加额外第三方链接的更改之前，你应该阅读内容指南。

上次修改时间：2024 年 9 月 20 日晚上 8:33 (PST)：更新 AMD GPU 设备插件的链接 (8f2d5571cc)

调度 GPU

使用设备插件

管理具有不同类型 GPU 的集群

自动节点标签

GPU 供应商实现

反馈