管理大页
在集群中配置和管理大页作为可调度资源。
功能状态:
Kubernetes v1.14 [stable]
(默认启用:true)Kubernetes 支持 Pod 中应用程序对预分配大页的分配和使用。本页描述了用户如何使用大页。
准备工作
Kubernetes 节点必须预分配大页,以便节点报告其大页容量。
节点可以预分配多种大小的大页,例如,/etc/default/grub
中的以下行分配 2*1GiB
的 1 GiB 大页和 512*2 MiB
的 2 MiB 大页。
GRUB_CMDLINE_LINUX="hugepagesz=1G hugepages=2 hugepagesz=2M hugepages=512"
节点将自动发现并报告所有大页资源作为可调度资源。
当您描述节点时,您应该在 Capacity
和 Allocatable
部分看到类似以下内容:
Capacity:
cpu: ...
ephemeral-storage: ...
hugepages-1Gi: 2Gi
hugepages-2Mi: 1Gi
memory: ...
pods: ...
Allocatable:
cpu: ...
ephemeral-storage: ...
hugepages-1Gi: 2Gi
hugepages-2Mi: 1Gi
memory: ...
pods: ...
注意
对于动态分配的页面(启动后),Kubelet 需要重新启动以反映新的分配。API
大页可以通过容器级资源需求来使用,使用资源名称 hugepages-<size>
,其中 <size>
是特定节点支持的最紧凑的二进制表示的整数值。例如,如果一个节点支持 2048KiB 和 1048576KiB 的页面大小,它将暴露可调度资源 hugepages-2Mi
和 hugepages-1Gi
。与 CPU 或内存不同,大页不支持超额使用。请注意,请求大页资源时,也必须请求内存或 CPU 资源。
一个 Pod 可以在单个 Pod 规约中消费多种大页大小。在这种情况下,它必须为所有卷挂载使用 medium: HugePages-<hugepagesize>
标记。
apiVersion: v1
kind: Pod
metadata:
name: huge-pages-example
spec:
containers:
- name: example
image: fedora:latest
command:
- sleep
- inf
volumeMounts:
- mountPath: /hugepages-2Mi
name: hugepage-2mi
- mountPath: /hugepages-1Gi
name: hugepage-1gi
resources:
limits:
hugepages-2Mi: 100Mi
hugepages-1Gi: 2Gi
memory: 100Mi
requests:
memory: 100Mi
volumes:
- name: hugepage-2mi
emptyDir:
medium: HugePages-2Mi
- name: hugepage-1gi
emptyDir:
medium: HugePages-1Gi
一个 Pod 只有在请求一种大小的大页时才可以使用 medium: HugePages
。
apiVersion: v1
kind: Pod
metadata:
name: huge-pages-example
spec:
containers:
- name: example
image: fedora:latest
command:
- sleep
- inf
volumeMounts:
- mountPath: /hugepages
name: hugepage
resources:
limits:
hugepages-2Mi: 100Mi
memory: 100Mi
requests:
memory: 100Mi
volumes:
- name: hugepage
emptyDir:
medium: HugePages
- 大页请求必须等于限制。如果指定了限制但未指定请求,则这是默认行为。
- 大页在容器范围内隔离,因此每个容器在自己的 cgroup 沙箱中都有一个限制,正如容器规约中请求的那样。
- 由大页支持的 EmptyDir 卷不能消耗超过 Pod 请求的大页内存。
- 通过
shmget()
和SHM_HUGETLB
使用大页的应用程序必须使用与proc/sys/vm/hugetlb_shm_group
匹配的补充组运行。 - 命名空间中的大页使用可以通过 ResourceQuota 控制,类似于使用
hugepages-<size>
令牌的其他计算资源(如cpu
或memory
)。
最后修改于 2024 年 6 月 6 日太平洋标准时间上午 12:21:修复功能状态 (53da5f74ab)