为容器和 Pod 分配内存资源

此页面介绍如何为容器分配内存请求和内存限制。容器保证拥有与其请求一样多的内存,但不允许使用超出其限制的内存。

开始之前

你需要有一个 Kubernetes 集群,并且必须配置 kubectl 命令行工具才能与你的集群通信。建议在至少有两个不充当控制平面主机的节点的集群上运行此教程。如果你还没有集群,你可以使用 minikube 创建一个,或者你可以使用以下 Kubernetes 游乐场之一

要检查版本,请输入 kubectl version

集群中的每个节点必须至少有 300 MiB 的内存。

此页面上的几个步骤要求你在集群中运行 metrics-server 服务。如果你的 metrics-server 正在运行,你可以跳过这些步骤。

如果你正在运行 Minikube,请运行以下命令来启用 metrics-server

minikube addons enable metrics-server

要查看 metrics-server 是否正在运行,或者资源指标 API (metrics.k8s.io) 的另一个提供程序是否正在运行,请运行以下命令

kubectl get apiservices

如果资源指标 API 可用,则输出将包含对 metrics.k8s.io 的引用。

NAME
v1beta1.metrics.k8s.io

创建一个命名空间

创建一个命名空间,以便你在此练习中创建的资源与集群的其余部分隔离。

kubectl create namespace mem-example

指定内存请求和内存限制

要为容器指定内存请求,请在容器的资源清单中包含 resources:requests 字段。要指定内存限制,请包含 resources:limits

在本练习中,你将创建一个有一个容器的 Pod。该容器的内存请求为 100 MiB,内存限制为 200 MiB。以下是 Pod 的配置文件

apiVersion: v1
kind: Pod
metadata:
  name: memory-demo
  namespace: mem-example
spec:
  containers:
  - name: memory-demo-ctr
    image: polinux/stress
    resources:
      requests:
        memory: "100Mi"
      limits:
        memory: "200Mi"
    command: ["stress"]
    args: ["--vm", "1", "--vm-bytes", "150M", "--vm-hang", "1"]

配置文件中的 args 部分为容器启动时提供参数。"--vm-bytes", "150M" 参数告诉容器尝试分配 150 MiB 的内存。

创建 Pod

kubectl apply -f https://k8s.io/examples/pods/resource/memory-request-limit.yaml --namespace=mem-example

验证 Pod 容器是否正在运行

kubectl get pod memory-demo --namespace=mem-example

查看有关 Pod 的详细信息

kubectl get pod memory-demo --output=yaml --namespace=mem-example

输出显示 Pod 中的一个容器的内存请求为 100 MiB,内存限制为 200 MiB。

...
resources:
  requests:
    memory: 100Mi
  limits:
    memory: 200Mi
...

运行 kubectl top 以获取 Pod 的指标

kubectl top pod memory-demo --namespace=mem-example

输出显示 Pod 正在使用大约 162,900,000 字节的内存,约为 150 MiB。这大于 Pod 的 100 MiB 请求,但在 Pod 的 200 MiB 限制范围内。

NAME                        CPU(cores)   MEMORY(bytes)
memory-demo                 <something>  162856960

删除你的 Pod

kubectl delete pod memory-demo --namespace=mem-example

超出容器的内存限制

如果节点有可用的内存,容器可以超出其内存请求。但是,容器不允许使用超出其内存限制的内存。如果容器分配的内存超出其限制,则该容器将成为终止的候选者。如果容器继续消耗超出其限制的内存,则该容器将被终止。如果终止的容器可以重新启动,则 kubelet 会像处理任何其他类型的运行时故障一样重新启动它。

在本练习中,你将创建一个尝试分配超出其限制的内存的 Pod。以下是 Pod 的配置文件,该 Pod 有一个内存请求为 50 MiB,内存限制为 100 MiB 的容器

apiVersion: v1
kind: Pod
metadata:
  name: memory-demo-2
  namespace: mem-example
spec:
  containers:
  - name: memory-demo-2-ctr
    image: polinux/stress
    resources:
      requests:
        memory: "50Mi"
      limits:
        memory: "100Mi"
    command: ["stress"]
    args: ["--vm", "1", "--vm-bytes", "250M", "--vm-hang", "1"]

在配置文件的 args 部分中,你可以看到容器将尝试分配 250 MiB 的内存,这远远超过 100 MiB 的限制。

创建 Pod

kubectl apply -f https://k8s.io/examples/pods/resource/memory-request-limit-2.yaml --namespace=mem-example

查看有关 Pod 的详细信息

kubectl get pod memory-demo-2 --namespace=mem-example

此时,容器可能正在运行或已被杀死。重复前面的命令,直到容器被杀死

NAME            READY     STATUS      RESTARTS   AGE
memory-demo-2   0/1       OOMKilled   1          24s

获取有关容器状态的更详细视图

kubectl get pod memory-demo-2 --output=yaml --namespace=mem-example

输出显示容器被杀死,因为它内存不足 (OOM)

lastState:
   terminated:
     containerID: 65183c1877aaec2e8427bc95609cc52677a454b56fcb24340dbd22917c23b10f
     exitCode: 137
     finishedAt: 2017-06-20T20:52:19Z
     reason: OOMKilled
     startedAt: null

此练习中的容器可以重新启动,因此 kubelet 会重新启动它。重复此命令几次以查看容器反复被杀死并重新启动

kubectl get pod memory-demo-2 --namespace=mem-example

输出显示容器被杀死,重新启动,再次被杀死,再次重新启动,等等

kubectl get pod memory-demo-2 --namespace=mem-example
NAME            READY     STATUS      RESTARTS   AGE
memory-demo-2   0/1       OOMKilled   1          37s

kubectl get pod memory-demo-2 --namespace=mem-example
NAME            READY     STATUS    RESTARTS   AGE
memory-demo-2   1/1       Running   2          40s

查看有关 Pod 历史记录的详细信息

kubectl describe pod memory-demo-2 --namespace=mem-example

输出显示容器反复启动和失败

... Normal  Created   Created container with id 66a3a20aa7980e61be4922780bf9d24d1a1d8b7395c09861225b0eba1b1f8511
... Warning BackOff   Back-off restarting failed container

查看有关集群节点的详细信息

kubectl describe nodes

输出包括由于内存不足条件而导致容器被杀死的记录

Warning OOMKilling Memory cgroup out of memory: Kill process 4481 (stress) score 1994 or sacrifice child

删除你的 Pod

kubectl delete pod memory-demo-2 --namespace=mem-example

指定对你的节点来说太大的内存请求

内存请求和限制与容器相关联,但将 Pod 视为具有内存请求和限制很有用。Pod 的内存请求是 Pod 中所有容器的内存请求的总和。同样,Pod 的内存限制是 Pod 中所有容器的内存限制的总和。

Pod 调度基于请求。只有当节点具有足够的可用内存来满足 Pod 的内存请求时,Pod 才会被调度在节点上运行。

在本练习中,你将创建一个 Pod,该 Pod 的内存请求太大,以至于超出了集群中任何节点的容量。以下是 Pod 的配置文件,该 Pod 有一个容器,该容器的内存请求为 1000 GiB,这很可能超出了集群中任何节点的容量。

apiVersion: v1
kind: Pod
metadata:
  name: memory-demo-3
  namespace: mem-example
spec:
  containers:
  - name: memory-demo-3-ctr
    image: polinux/stress
    resources:
      requests:
        memory: "1000Gi"
      limits:
        memory: "1000Gi"
    command: ["stress"]
    args: ["--vm", "1", "--vm-bytes", "150M", "--vm-hang", "1"]

创建 Pod

kubectl apply -f https://k8s.io/examples/pods/resource/memory-request-limit-3.yaml --namespace=mem-example

查看 Pod 状态

kubectl get pod memory-demo-3 --namespace=mem-example

输出显示 Pod 状态为 PENDING。也就是说,Pod 未被调度在任何节点上运行,它将无限期地保持在 PENDING 状态

kubectl get pod memory-demo-3 --namespace=mem-example
NAME            READY     STATUS    RESTARTS   AGE
memory-demo-3   0/1       Pending   0          25s

查看有关 Pod 的详细信息,包括事件

kubectl describe pod memory-demo-3 --namespace=mem-example

输出显示由于节点上的内存不足,无法调度容器

Events:
  ...  Reason            Message
       ------            -------
  ...  FailedScheduling  No nodes are available that match all of the following predicates:: Insufficient memory (3).

内存单位

内存资源以字节为单位进行测量。你可以将内存表示为纯整数或带有以下后缀之一的定点整数:E、P、T、G、M、K、Ei、Pi、Ti、Gi、Mi、Ki。例如,以下内容表示大致相同的值

128974848, 129e6, 129M, 123Mi

删除你的 Pod

kubectl delete pod memory-demo-3 --namespace=mem-example

如果你没有指定内存限制

如果你没有为容器指定内存限制,则以下情况之一适用

  • 容器对其使用的内存量没有上限。容器可以使用其运行节点上的所有可用内存,这反过来可能会调用 OOM Killer(内存溢出杀手)。此外,在发生 OOM Kill 的情况下,没有资源限制的容器被杀死的可能性更大。

  • 容器在一个具有默认内存限制的命名空间中运行,并且容器会自动分配该默认限制。集群管理员可以使用 LimitRange 来指定内存限制的默认值。

内存请求和限制的动机

通过为集群中运行的容器配置内存请求和限制,您可以高效地利用集群节点上的可用内存资源。通过保持 Pod 的内存请求较低,您可以使 Pod 有很好的调度机会。通过设置一个大于内存请求的内存限制,您可以实现两件事:

  • Pod 可以进行突发活动,从而利用碰巧可用的内存。
  • Pod 在突发期间可以使用的内存量被限制在某个合理的范围内。

清理

删除您的命名空间。这将删除您为此任务创建的所有 Pod。

kubectl delete namespace mem-example

下一步

对于应用程序开发人员

对于集群管理员

上次修改时间:2024 年 10 月 30 日下午 5:17 PST: KEP 2837: Pod 级别资源 Alpha (0374213f57)