Operator 模式

Operator 是 Kubernetes 的软件扩展,它利用自定义资源来管理应用程序及其组件。Operator 遵循 Kubernetes 原则,特别是控制循环

动机

operator 模式旨在捕捉管理服务或一组服务的人工 operator 的关键目标。负责特定应用程序和服务的操作员对系统应如何运行、如何部署以及出现问题时如何反应有深入的了解。

在 Kubernetes 上运行工作负载的人员通常喜欢使用自动化来处理重复性任务。operator 模式捕获了如何编写代码来自动化 Kubernetes 本身提供的功能之外的任务。

Kubernetes 中的 Operator

Kubernetes 专为自动化而设计。开箱即用,你可以从 Kubernetes 的核心获得许多内置的自动化功能。你可以使用 Kubernetes 自动化部署和运行工作负载,并且你可以自动化 Kubernetes 如何执行此操作。

Kubernetes 的 operator 模式概念允许你通过将控制器链接到一个或多个自定义资源来扩展集群的行为,而无需修改 Kubernetes 本身的代码。Operator 是 Kubernetes API 的客户端,充当自定义资源的控制器。

Operator 示例

你可以使用 Operator 来自动化的一些事情包括:

  • 按需部署应用程序
  • 获取和恢复该应用程序状态的备份
  • 处理应用程序代码的升级以及相关更改,例如数据库架构或额外的配置设置
  • 将 Service 发布到不支持 Kubernetes API 来发现它们的应用程序
  • 模拟集群全部或部分故障以测试其弹性
  • 为分布式应用程序选择领导者,而无需内部成员选举过程

Operator 的更详细信息是什么样的?这是一个示例:

  1. 名为 SampleDB 的自定义资源,可以将其配置到集群中。
  2. 一个 Deployment,确保运行一个包含 Operator 控制器部分的 Pod。
  3. Operator 代码的容器镜像。
  4. 控制器代码,查询控制平面以找出配置了哪些 SampleDB 资源。
  5. Operator 的核心是代码,用于告诉 API 服务器如何使现实与配置的资源相匹配。
    • 如果添加新的 SampleDB,Operator 将设置 PersistentVolumeClaims 以提供持久数据库存储,一个 StatefulSet 来运行 SampleDB 和一个 Job 来处理初始配置。
    • 如果删除它,Operator 将获取快照,然后确保也删除 StatefulSet 和卷。
  6. Operator 还管理定期数据库备份。对于每个 SampleDB 资源,Operator 确定何时创建可以连接到数据库并进行备份的 Pod。这些 Pod 将依赖于包含数据库连接详细信息和凭据的 ConfigMap 和/或 Secret。
  7. 由于 Operator 旨在为其管理的资源提供强大的自动化功能,因此将有其他支持代码。在此示例中,代码会检查数据库是否正在运行旧版本,如果是,则创建为你升级它的 Job 对象。

部署 Operator

部署 Operator 的最常见方法是将自定义资源定义及其关联的控制器添加到集群中。控制器通常在控制平面之外运行,就像你运行任何容器化应用程序一样。例如,你可以在集群中作为 Deployment 运行控制器。

使用 Operator

部署 Operator 后,你将通过添加、修改或删除 Operator 使用的资源类型来使用它。按照上面的示例,你将为 Operator 本身设置一个 Deployment,然后

kubectl get SampleDB                   # find configured databases

kubectl edit SampleDB/example-database # manually change some settings

…就是这样!Operator 将负责应用更改以及保持现有服务的良好状态。

编写自己的 Operator

如果生态系统中没有实现你想要的行为的 Operator,你可以编写自己的 Operator。

你还可以使用任何可以充当Kubernetes API 客户端的语言/运行时来实现 Operator(即控制器)。

以下是一些可用于编写自己的云原生 Operator 的库和工具。

下一步

此页面上的项目是指提供 Kubernetes 所需功能的第三方产品或项目。Kubernetes 项目的作者不对这些第三方产品或项目负责。有关更多详细信息,请参阅 CNCF 网站指南

在提出添加额外第三方链接的更改之前,您应该阅读内容指南

上次修改时间:2024 年 7 月 16 日下午 2:32(太平洋标准时间):更新 Java Operator SDK 的 GitHub 仓库 URL (3c7af1e126)