为容器和 Pod 分配内存资源

此页面展示了如何为容器分配内存 *请求* 和内存 *限制*。容器保证拥有其请求的内存量,但不能使用超过其限制的内存。

开始之前

您需要拥有一个 Kubernetes 集群,并且 kubectl 命令行工具必须配置为与您的集群通信。建议在至少有两个节点的集群上运行本教程,这些节点不充当控制平面主机。如果您还没有集群,可以使用 minikube 创建一个,或者您可以使用以下 Kubernetes 游乐场之一

要检查版本,请输入 kubectl version

集群中的每个节点至少需要 300 MiB 的内存。

此页面上的几个步骤需要您在集群中运行 metrics-server 服务。如果您已经运行了 metrics-server,可以跳过这些步骤。

如果您运行的是 Minikube,请运行以下命令来启用 metrics-server

minikube addons enable metrics-server

要查看 metrics-server 是否正在运行,或者资源指标 API(metrics.k8s.io)的其他提供者是否正在运行,请运行以下命令

kubectl get apiservices

如果资源指标 API 可用,输出将包含对 metrics.k8s.io 的引用。

NAME
v1beta1.metrics.k8s.io

创建命名空间

创建一个命名空间,以便您在本练习中创建的资源与集群中的其他资源隔离。

kubectl create namespace mem-example

指定内存请求和内存限制

要为容器指定内存请求,请在容器的资源清单中包含 resources:requests 字段。要指定内存限制,请包含 resources:limits

在本练习中,您将创建一个包含一个容器的 Pod。容器的内存请求为 100 MiB,内存限制为 200 MiB。以下是 Pod 的配置文件

apiVersion: v1
kind: Pod
metadata:
  name: memory-demo
  namespace: mem-example
spec:
  containers:
  - name: memory-demo-ctr
    image: polinux/stress
    resources:
      requests:
        memory: "100Mi"
      limits:
        memory: "200Mi"
    command: ["stress"]
    args: ["--vm", "1", "--vm-bytes", "150M", "--vm-hang", "1"]

配置文件中的 args 部分为容器启动时提供了参数。"--vm-bytes", "150M" 参数告诉容器尝试分配 150 MiB 的内存。

创建 Pod

kubectl apply -f https://k8s.io/examples/pods/resource/memory-request-limit.yaml --namespace=mem-example

验证 Pod 容器是否正在运行

kubectl get pod memory-demo --namespace=mem-example

查看有关 Pod 的详细信息

kubectl get pod memory-demo --output=yaml --namespace=mem-example

输出显示 Pod 中的单个容器的内存请求为 100 MiB,内存限制为 200 MiB。

...
resources:
  requests:
    memory: 100Mi
  limits:
    memory: 200Mi
...

运行 kubectl top 获取 pod 的指标

kubectl top pod memory-demo --namespace=mem-example

输出显示 Pod 正在使用约 162,900,000 字节的内存,约为 150 MiB。这大于 Pod 的 100 MiB 请求,但在 Pod 的 200 MiB 限制内。

NAME                        CPU(cores)   MEMORY(bytes)
memory-demo                 <something>  162856960

删除您的 Pod

kubectl delete pod memory-demo --namespace=mem-example

超过容器的内存限制

如果节点有可用内存,容器可以超过其内存请求。但容器不允许使用超过其内存限制的内存。如果容器分配的内存超过其限制,则容器将成为终止候选对象。如果容器继续消耗超过其限制的内存,则容器将被终止。如果被终止的容器可以重启,kubelet 会像处理其他任何类型的运行时错误一样重启它。

在本练习中,您将创建一个尝试分配超过其限制的内存的 Pod。以下是包含一个容器的 Pod 的配置文件,该容器的内存请求为 50 MiB,内存限制为 100 MiB

apiVersion: v1
kind: Pod
metadata:
  name: memory-demo-2
  namespace: mem-example
spec:
  containers:
  - name: memory-demo-2-ctr
    image: polinux/stress
    resources:
      requests:
        memory: "50Mi"
      limits:
        memory: "100Mi"
    command: ["stress"]
    args: ["--vm", "1", "--vm-bytes", "250M", "--vm-hang", "1"]

在配置文件的 args 部分,您可以看到容器将尝试分配 250 MiB 的内存,远高于 100 MiB 的限制。

创建 Pod

kubectl apply -f https://k8s.io/examples/pods/resource/memory-request-limit-2.yaml --namespace=mem-example

查看有关 Pod 的详细信息

kubectl get pod memory-demo-2 --namespace=mem-example

此时,容器可能正在运行或已被杀死。重复前面的命令,直到容器被杀死

NAME            READY     STATUS      RESTARTS   AGE
memory-demo-2   0/1       OOMKilled   1          24s

更详细地查看容器状态

kubectl get pod memory-demo-2 --output=yaml --namespace=mem-example

输出显示容器因内存不足 (OOM) 而被杀死

lastState:
   terminated:
     containerID: 65183c1877aaec2e8427bc95609cc52677a454b56fcb24340dbd22917c23b10f
     exitCode: 137
     finishedAt: 2017-06-20T20:52:19Z
     reason: OOMKilled
     startedAt: null

本练习中的容器可以重启,因此 kubelet 会重启它。重复此命令几次,以查看容器被反复杀死和重启

kubectl get pod memory-demo-2 --namespace=mem-example

输出显示容器被杀死、重启、再次杀死、再次重启,等等

kubectl get pod memory-demo-2 --namespace=mem-example
NAME            READY     STATUS      RESTARTS   AGE
memory-demo-2   0/1       OOMKilled   1          37s

kubectl get pod memory-demo-2 --namespace=mem-example
NAME            READY     STATUS    RESTARTS   AGE
memory-demo-2   1/1       Running   2          40s

查看有关 Pod 历史记录的详细信息

kubectl describe pod memory-demo-2 --namespace=mem-example

输出显示容器反复启动和失败

... Normal  Created   Created container with id 66a3a20aa7980e61be4922780bf9d24d1a1d8b7395c09861225b0eba1b1f8511
... Warning BackOff   Back-off restarting failed container

查看有关集群节点的详细信息

kubectl describe nodes

输出包含容器因内存不足而被杀死的记录

Warning OOMKilling Memory cgroup out of memory: Kill process 4481 (stress) score 1994 or sacrifice child

删除您的 Pod

kubectl delete pod memory-demo-2 --namespace=mem-example

指定节点无法满足的内存请求

内存请求和限制与容器相关联,但将 Pod 视为具有内存请求和限制是有帮助的。Pod 的内存请求是 Pod 中所有容器的内存请求之和。同样,Pod 的内存限制是 Pod 中所有容器的限制之和。

Pod 调度基于请求。只有当节点有足够的可用内存来满足 Pod 的内存请求时,Pod 才会被调度到该节点上运行。

在本练习中,您将创建一个 Pod,它的内存请求过大,超过了集群中任何节点的容量。以下是包含一个容器的 Pod 的配置文件,该容器的内存请求为 1000 GiB,这很可能超过了集群中任何节点的容量。

apiVersion: v1
kind: Pod
metadata:
  name: memory-demo-3
  namespace: mem-example
spec:
  containers:
  - name: memory-demo-3-ctr
    image: polinux/stress
    resources:
      requests:
        memory: "1000Gi"
      limits:
        memory: "1000Gi"
    command: ["stress"]
    args: ["--vm", "1", "--vm-bytes", "150M", "--vm-hang", "1"]

创建 Pod

kubectl apply -f https://k8s.io/examples/pods/resource/memory-request-limit-3.yaml --namespace=mem-example

查看 Pod 状态

kubectl get pod memory-demo-3 --namespace=mem-example

输出显示 Pod 状态为 PENDING。也就是说,Pod 尚未被调度到任何节点上运行,并且它将无限期地保持在 PENDING 状态

kubectl get pod memory-demo-3 --namespace=mem-example
NAME            READY     STATUS    RESTARTS   AGE
memory-demo-3   0/1       Pending   0          25s

查看有关 Pod 的详细信息,包括事件

kubectl describe pod memory-demo-3 --namespace=mem-example

输出显示容器无法调度,因为节点的内存不足

Events:
  ...  Reason            Message
       ------            -------
  ...  FailedScheduling  No nodes are available that match all of the following predicates:: Insufficient memory (3).

内存单位

内存资源以字节为单位。您可以将内存表示为普通整数或使用以下后缀之一的定点整数:E、P、T、G、M、K、Ei、Pi、Ti、Gi、Mi、Ki。例如,以下近似表示相同的值

128974848, 129e6, 129M, 123Mi

删除您的 Pod

kubectl delete pod memory-demo-3 --namespace=mem-example

如果您没有指定内存限制

如果您没有为容器指定内存限制,则以下情况之一适用

  • 容器的内存使用量没有上限。容器可以使用其运行所在的节点上的所有可用内存,这反过来会导致 OOM Killer 被调用。此外,在发生 OOM 杀死的情况下,没有资源限制的容器被杀死的可能性更大。

  • 容器运行在具有默认内存限制的命名空间中,并且容器会自动分配默认限制。集群管理员可以使用 LimitRange 为内存限制指定默认值。

内存请求和限制的动机

通过为集群中运行的容器配置内存请求和限制,您可以有效地利用集群节点上可用的内存资源。通过保持 Pod 的内存请求较低,您可以为 Pod 提供一个很好的调度机会。通过拥有大于内存请求的内存限制,您可以完成两件事

  • Pod 可以有突发活动,在这种活动中它会使用碰巧可用的内存。
  • Pod 在突发期间可以使用的内存量限制在合理的范围内。

清理

删除您的命名空间。这将删除您为本任务创建的所有 Pod

kubectl delete namespace mem-example

下一步

针对应用程序开发者

针对集群管理员

上次修改时间:2023 年 8 月 24 日下午 6:38 PST: 使用 code_sample shortcode 代替 code shortcode (e8b136c3b3)