Operator 模式
Operator 是 Kubernetes 的软件扩展,它利用自定义资源来管理应用程序及其组件。Operator 遵循 Kubernetes 原则,特别是控制循环。
动机
“Operator 模式”旨在捕捉人类操作员管理服务或一组服务时的关键目标。负责特定应用程序和服务的人类操作员对系统应如何运行、如何部署以及出现问题时如何响应都有深入的了解。
在 Kubernetes 上运行工作负载的人通常喜欢使用自动化来处理重复性任务。Operator 模式捕捉了如何编写代码来自动化超出 Kubernetes 本身提供的任务。
Kubernetes 中的 Operator
Kubernetes 旨在实现自动化。开箱即用,你可以从 Kubernetes 的核心获得大量内置自动化。你可以使用 Kubernetes 自动化部署和运行工作负载,并且可以自动化 Kubernetes 如何做到这一点。
Kubernetes 的Operator 模式概念允许你通过将控制器链接到一个或多个自定义资源来扩展集群的行为,而无需修改 Kubernetes 本身的代码。Operator 是 Kubernetes API 的客户端,它们充当自定义资源的控制器。
Operator 示例
你可以使用 Operator 自动化的事情包括:
- 按需部署应用程序
- 备份和恢复应用程序状态
- 处理应用程序代码升级以及相关更改,例如数据库模式或额外配置设置
- 向不支持 Kubernetes API 的应用程序发布服务以发现它们
- 模拟集群全部或部分故障以测试其弹性
- 为没有内部成员选举过程的分布式应用程序选择领导者
更详细的 Operator 示例是什么样的?这是一个示例:
- 一个名为 SampleDB 的自定义资源,你可以将其配置到集群中。
- 一个 Deployment,它确保正在运行的 Pod 包含 Operator 的控制器部分。
- Operator 代码的容器镜像。
- 控制器代码,它查询控制平面以找出配置了哪些 SampleDB 资源。
- Operator 的核心是代码,用于告诉 API 服务器如何使现实与配置的资源匹配。
- 如果你添加了一个新的 SampleDB,Operator 会设置 PersistentVolumeClaim 以提供持久数据库存储,一个 StatefulSet 来运行 SampleDB,以及一个 Job 来处理初始配置。
- 如果你删除它,Operator 会创建一个快照,然后确保 StatefulSet 和 Volume 也被删除。
- Operator 还管理定期数据库备份。对于每个 SampleDB 资源,Operator 决定何时创建可以连接到数据库并进行备份的 Pod。这些 Pod 将依赖于包含数据库连接详细信息和凭据的 ConfigMap 和/或 Secret。
- 由于 Operator 旨在为其管理的资源提供强大的自动化,因此会有一个额外的支持代码。对于此示例,代码会检查数据库是否正在运行旧版本,如果是,则创建 Job 对象为您升级它。
部署 Operator
部署 Operator 最常见的方法是向集群添加自定义资源定义及其关联的控制器。控制器通常在控制平面之外运行,就像您运行任何容器化应用程序一样。例如,您可以在集群中以 Deployment 的形式运行控制器。
使用 Operator
部署 Operator 后,您可以通过添加、修改或删除 Operator 使用的资源类型来使用它。按照上面的示例,您将为 Operator 本身设置一个 Deployment,然后:
kubectl get SampleDB # find configured databases
kubectl edit SampleDB/example-database # manually change some settings
...就是这样!Operator 将负责应用更改并保持现有服务良好运行。
编写自己的 Operator
如果生态系统中没有实现所需行为的 Operator,您可以编写自己的 Operator。
您也可以使用任何可以作为 Kubernetes API 客户端的语言/运行时来实现 Operator(即控制器)。
以下是一些可用于编写您自己的云原生 Operator 的库和工具。
- Charmed Operator 框架
- Java Operator SDK
- Kopf (Kubernetes Operator Pythonic Framework)
- kube-rs (Rust)
- kubebuilder
- KubeOps (.NET Operator SDK)
- Mast
- Metacontroller 以及您自己实现的 WebHook
- Operator Framework
- shell-operator
下一步
- 阅读 CNCF Operator 白皮书。
- 了解更多关于自定义资源的信息
- 在OperatorHub.io上查找适合您用例的现成 Operator
- 发布您的 Operator 以供他人使用
- 阅读 CoreOS 的原始文章,该文章介绍了 Operator 模式(这是原始文章的存档版本)。
- 阅读 Google Cloud 关于构建 Operator 最佳实践的文章
本页面上的项目指的是提供 Kubernetes 所需功能的第三方产品或项目。Kubernetes 项目作者不对这些第三方产品或项目负责。有关更多详细信息,请参阅 CNCF 网站指南。
在提议添加额外第三方链接的更改之前,你应该阅读内容指南。