Kubernetes 指标参考

Kubernetes 组件导出的指标数据的详细信息。

指标 (v1.32)

本页面详细介绍了不同 Kubernetes 组件导出的指标。你可以使用 HTTP scrape 查询这些组件的指标端点,并获取 Prometheus 格式的当前指标数据。

稳定 Kubernetes 指标列表

稳定指标遵循严格的 API 契约,在其生命周期内不能添加或删除任何标签。

apiserver_admission_controller_admission_duration_seconds
准入控制器延迟直方图(单位:秒),按名称标识,并按每个操作、API 资源和类型(验证或准入)细分。
  • STABLE
  • 直方图
  • nameoperationrejectedtype
apiserver_admission_step_admission_duration_seconds
准入子步骤延迟直方图(单位:秒),按每个操作、API 资源和步骤类型(验证或准入)细分。
  • STABLE
  • 直方图
  • operationrejectedtype
apiserver_admission_webhook_admission_duration_seconds
准入 Webhook 延迟直方图(单位:秒),按名称标识,并按每个操作、API 资源和类型(验证或准入)细分。
  • STABLE
  • 直方图
  • nameoperationrejectedtype
apiserver_current_inflight_requests
在最后一秒内,此 apiserver 按请求类型划分的当前使用的最大并发请求限制数。
  • STABLE
  • Gauge
  • request_kind
apiserver_longrunning_requests
所有活跃的长时间运行的 apiserver 请求的 Gauge,按 verb、group、version、resource、scope 和 component 细分。并非所有请求都以这种方式跟踪。
  • STABLE
  • Gauge
  • componentgroupresourcescopesubresourceverbversion
apiserver_request_duration_seconds
按每个 verb、dry run 值、group、version、resource、subresource、scope 和 component 细分响应延迟分布(单位:秒)。
  • STABLE
  • 直方图
  • componentdry_rungroupresourcescopesubresourceverbversion
apiserver_request_total
apiserver 请求的 Counter,按每个 verb、dry run 值、group、version、resource、scope、component 和 HTTP 响应码细分。
  • STABLE
  • Counter
  • codecomponentdry_rungroupresourcescopesubresourceverbversion
apiserver_requested_deprecated_apis
已启用的废弃 API 的 Gauge,按 API group、version、resource、subresource 和 removed_release 细分。
  • STABLE
  • Gauge
  • groupremoved_releaseresourcesubresourceversion
apiserver_response_sizes
按每个 group、version、verb、resource、subresource、scope 和 component 细分响应大小分布(单位:字节)。
  • STABLE
  • 直方图
  • componentgroupresourcescopesubresourceverbversion
apiserver_storage_objects
按 kind 划分的最后一次检查时存储的对象数量。如果发生获取错误,该值为 -1。
  • STABLE
  • Gauge
  • resource
apiserver_storage_size_bytes
物理分配的存储数据库文件大小(单位:字节)。
  • STABLE
  • Custom
  • storage_cluster_id
container_cpu_usage_seconds_total
容器消耗的累计 CPU 时间(单位:核心秒)
  • STABLE
  • Custom
  • containerpodnamespace
container_memory_working_set_bytes
容器当前的 working set(单位:字节)
  • STABLE
  • Custom
  • containerpodnamespace
container_start_time_seconds
容器启动时间(自 Unix epoch 以来的秒数)
  • STABLE
  • Custom
  • containerpodnamespace
cronjob_controller_job_creation_skew_duration_seconds
CronJob 计划运行时间与相应 Job 创建时间之间的时间差
  • STABLE
  • 直方图
job_controller_job_pods_finished_total
已完成并被完全跟踪的 Pod 数量
  • STABLE
  • Counter
  • completion_moderesult
job_controller_job_sync_duration_seconds
同步一个 Job 所花费的时间
  • STABLE
  • 直方图
  • actioncompletion_moderesult
job_controller_job_syncs_total
Job 同步次数
  • STABLE
  • Counter
  • actioncompletion_moderesult
job_controller_jobs_finished_total
已完成 Job 的数量
  • STABLE
  • Counter
  • completion_modereasonresult
kube_pod_resource_limit
集群上工作负载的资源限制,按 Pod 细分。这显示了调度器和 Kubelet 期望的每个 Pod 的资源使用量以及资源的单位(如果存在)。
  • STABLE
  • Custom
  • namespacepodnodeschedulerpriorityresourceunit
kube_pod_resource_request
集群上工作负载请求的资源,按 Pod 细分。这显示了调度器和 Kubelet 期望的每个 Pod 的资源使用量以及资源的单位(如果存在)。
  • STABLE
  • Custom
  • namespacepodnodeschedulerpriorityresourceunit
kubernetes_healthcheck
此指标记录了单个健康检查的结果。
  • STABLE
  • Gauge
  • nametype
kubernetes_healthchecks_total
此指标记录了所有健康检查的结果。
  • STABLE
  • Counter
  • namestatustype
node_collector_evictions_total
自当前 NodeController 实例启动以来发生的 Node 驱逐次数。
  • STABLE
  • Counter
  • zone
node_cpu_usage_seconds_total
节点消耗的累计 CPU 时间(单位:核心秒)
  • STABLE
  • Custom
node_memory_working_set_bytes
节点当前的 working set(单位:字节)
  • STABLE
  • Custom
pod_cpu_usage_seconds_total
Pod 消耗的累计 CPU 时间(单位:核心秒)
  • STABLE
  • Custom
  • podnamespace
pod_memory_working_set_bytes
Pod 当前的 working set(单位:字节)
  • STABLE
  • Custom
  • podnamespace
resource_scrape_error
获取容器指标时出错则为 1,否则为 0
  • STABLE
  • Custom
scheduler_framework_extension_point_duration_seconds
运行特定扩展点所有插件的延迟。
  • STABLE
  • 直方图
  • extension_pointprofilestatus
scheduler_pending_pods
待定 Pod 的数量,按队列类型划分。'active' 表示 activeQ 中的 Pod 数量;'backoff' 表示 backoffQ 中的 Pod 数量;'unschedulable' 表示调度器尝试调度失败的 unschedulablePods 中的 Pod 数量;'gated' 表示调度器因 Pod 被门控而从未尝试调度的 unschedulable Pod 数量。
  • STABLE
  • Gauge
  • queue
scheduler_pod_scheduling_attempts
成功调度 Pod 的尝试次数。
  • STABLE
  • 直方图
scheduler_pod_scheduling_duration_seconds
Pod 调度端到端延迟,可能包括多次调度尝试。
  • STABLE
  • 直方图
  • attempts
  • 1.29.0
scheduler_preemption_attempts_total
集群迄今为止的总抢占尝试次数
  • STABLE
  • Counter
scheduler_preemption_victims
选定的抢占牺牲者数量
  • STABLE
  • 直方图
scheduler_queue_incoming_pods_total
按事件和队列类型添加到调度队列的 Pod 数量。
  • STABLE
  • Counter
  • eventqueue
scheduler_schedule_attempts_total
调度 Pod 的尝试次数,按结果划分。'unschedulable' 表示 Pod 无法调度,而 'error' 表示调度器内部问题。
  • STABLE
  • Counter
  • profileresult
scheduler_scheduling_attempt_duration_seconds
调度尝试延迟(单位:秒)(调度算法 + 绑定)
  • STABLE
  • 直方图
  • profileresult

Beta Kubernetes 指标列表

Beta 指标遵循比稳定指标更宽松的 API 契约。在 Beta 指标的生命周期内,不能移除标签,但可以在 Beta 阶段添加标签。这保证了 Beta 指标会遵循现有的仪表盘和警报,同时也允许将来进行修改。

apiserver_cel_compilation_duration_seconds
CEL 编译时间(单位:秒)。
  • BETA
  • 直方图
apiserver_cel_evaluation_duration_seconds
CEL 评估时间(单位:秒)。
  • BETA
  • 直方图
apiserver_flowcontrol_current_executing_requests
API 优先级和公平性子系统中处于初始执行阶段(对于 WATCH)或任何执行阶段(对于非 WATCH)的请求数量
  • BETA
  • Gauge
  • flow_schemapriority_level
apiserver_flowcontrol_current_executing_seats
API 优先级和公平性子系统中当前正在执行的请求(WATCH 的初始阶段,否则为任何阶段)所占用的并发(座位数)
  • BETA
  • Gauge
  • flow_schemapriority_level
apiserver_flowcontrol_current_inqueue_requests
当前在 API 优先级和公平性子系统队列中等待的请求数量
  • BETA
  • Gauge
  • flow_schemapriority_level
apiserver_flowcontrol_dispatched_requests_total
由 API 优先级和公平性子系统执行的请求数量
  • BETA
  • Counter
  • flow_schemapriority_level
apiserver_flowcontrol_nominal_limit_seats
为每个优先级级别配置的名义执行座位数
  • BETA
  • Gauge
  • priority_level
apiserver_flowcontrol_rejected_requests_total
API 优先级和公平性子系统拒绝的请求数量
  • BETA
  • Counter
  • flow_schemapriority_levelreason
apiserver_flowcontrol_request_wait_duration_seconds
请求在其队列中等待的时间长度
  • BETA
  • 直方图
  • executeflow_schemapriority_level
apiserver_validating_admission_policy_check_duration_seconds
单个验证表达式的验证准入延迟(单位:秒),按策略标记,并进一步包括绑定的生效操作。
  • BETA
  • 直方图
  • enforcement_actionerror_typepolicypolicy_binding
apiserver_validating_admission_policy_check_total
验证准入策略检查总数,按策略标记,并进一步按绑定的生效操作标识。
  • BETA
  • Counter
  • enforcement_actionerror_typepolicypolicy_binding
disabled_metrics_total
已禁用指标的数量。
  • BETA
  • Counter
hidden_metrics_total
隐藏指标的数量。
  • BETA
  • Counter
kubernetes_feature_enabled
此指标记录了 K8s 特性所处阶段和启用状态的数据。
  • BETA
  • Gauge
  • namestage
registered_metrics_total
按稳定性级别和废弃版本划分的已注册指标数量。
  • BETA
  • Counter
  • deprecated_versionstability_level
scheduler_pod_scheduling_sli_duration_seconds
Pod 调度端到端延迟,从 Pod 进入调度队列开始计算,可能涉及多次调度尝试。
  • BETA
  • 直方图
  • attempts

Alpha Kubernetes 指标列表

Alpha 指标没有任何 API 保证。使用这些指标风险自担,后续的 Kubernetes 版本可能会完全移除这些指标,或以破坏现有仪表盘和警报的方式修改 API。

aggregator_discovery_aggregation_count_total
Discovery 被聚合次数的 Counter
  • ALPHA
  • Counter
aggregator_openapi_v2_regeneration_count
OpenAPI v2 spec 再生成次数的 Counter,按导致再生成的 APIService 名称和原因细分。
  • ALPHA
  • Counter
  • apiservicereason
aggregator_openapi_v2_regeneration_duration
OpenAPI v2 spec 再生成持续时间的 Gauge(单位:秒)。
  • ALPHA
  • Gauge
  • reason
aggregator_unavailable_apiservice
被标记为不可用的 APIService 的 Gauge,按 APIService 名称细分。
  • ALPHA
  • Custom
  • name
aggregator_unavailable_apiservice_total
被标记为不可用的 APIService 的 Counter,按 APIService 名称和原因细分。
  • ALPHA
  • Counter
  • namereason
apiextensions_apiserver_validation_ratcheting_seconds
在 UPDATE 期间,用于 CRDValidationRatcheting 目的比较旧值与新值所需的时间(单位:秒)。
  • ALPHA
  • 直方图
apiextensions_openapi_v2_regeneration_count
OpenAPI v2 spec 再生成次数的 Counter,按导致再生成的 CRD 名称和原因细分。
  • ALPHA
  • Counter
  • crdreason
apiextensions_openapi_v3_regeneration_count
OpenAPI v3 spec 再生成次数的 Counter,按 group、version、导致再生成的 CRD 和原因细分。
  • ALPHA
  • Counter
  • crdgroupreasonversion
apiserver_admission_match_condition_evaluation_errors_total
准入匹配条件评估错误计数,按包含匹配条件的资源的名称标识,并按包含 matchConditions 的每种类型(webhook 或 policy)、操作和准入类型(validate 或 admit)细分。
  • ALPHA
  • Counter
  • kindnameoperationtype
apiserver_admission_match_condition_evaluation_seconds
准入匹配条件评估时间(单位:秒),按名称标识,并按包含 matchConditions 的每种类型(webhook 或 policy)、操作和类型(validate 或 admit)细分。
  • ALPHA
  • 直方图
  • kindnameoperationtype
apiserver_admission_match_condition_exclusions_total
准入匹配条件评估排除计数,按包含匹配条件的资源的名称标识,并按包含 matchConditions 的每种类型(webhook 或 policy)、操作和准入类型(validate 或 admit)细分。
  • ALPHA
  • Counter
  • kindnameoperationtype
apiserver_admission_step_admission_duration_seconds_summary
准入子步骤延迟总结(单位:秒),按每个操作、API 资源和步骤类型(验证或准入)细分。
  • ALPHA
  • Summary
  • operationrejectedtype
apiserver_admission_webhook_fail_open_count
准入 Webhook Fail Open 计数,按名称标识,并按每个准入类型(验证或准入)细分。
  • ALPHA
  • Counter
  • nametype
apiserver_admission_webhook_rejection_count
准入 Webhook 拒绝计数,按名称标识,并按每个准入类型(验证或准入)和操作细分。附加标签指定错误类型(如果发生错误,则为 calling_webhook_error 或 apiserver_internal_error;否则为 no_error),如果 webhook 使用 HTTP 状态码拒绝请求(当码大于等于 400 时被 apiserver 遵守),则可选地指定非零拒绝码。大于 600 的码将被截断为 600,以保持指标基数受限。
  • ALPHA
  • Counter
  • error_typenameoperationrejection_codetype
apiserver_admission_webhook_request_total
准入 Webhook 请求总数,按名称标识,并按每个准入类型(验证或准入)和操作细分。附加标签指定请求是否被拒绝以及 HTTP 状态码。大于 600 的码将被截断为 600,以保持指标基数受限。
  • ALPHA
  • Counter
  • codenameoperationrejectedtype
apiserver_audit_error_total
未正确审计的审计事件的 Counter。Plugin 标识受错误影响的插件。
  • ALPHA
  • Counter
  • plugin
apiserver_audit_event_total
生成并发送到审计后端的审计事件的 Counter。
  • ALPHA
  • Counter
apiserver_audit_level_total
审计事件策略级别的 Counter(每个请求 1 个)。
  • ALPHA
  • Counter
  • level
apiserver_audit_requests_rejected_total
由于审计日志后端出错而被拒绝的 apiserver 请求的 Counter。
  • ALPHA
  • Counter
apiserver_authentication_config_controller_automatic_reload_last_timestamp_seconds
按状态和 apiserver 标识划分的认证配置最后一次自动重新加载的时间戳。
  • ALPHA
  • Gauge
  • apiserver_id_hashstatus
apiserver_authentication_config_controller_automatic_reloads_total
按状态和 apiserver 标识划分的认证配置自动重新加载总次数。
  • ALPHA
  • Counter
  • apiserver_id_hashstatus
apiserver_authentication_jwt_authenticator_latency_seconds
JWT 认证操作延迟(单位:秒)。这是仅针对缓存未命中时认证 token 所花费的时间(即缓存中未找到 token 时)。
  • ALPHA
  • 直方图
  • jwt_issuer_hashresult
apiserver_authorization_config_controller_automatic_reload_last_timestamp_seconds
按状态和 apiserver 标识划分的授权配置最后一次自动重新加载的时间戳。
  • ALPHA
  • Gauge
  • apiserver_id_hashstatus
apiserver_authorization_config_controller_automatic_reloads_total
按状态和 apiserver 标识划分的授权配置自动重新加载总次数。
  • ALPHA
  • Counter
  • apiserver_id_hashstatus
apiserver_authorization_decisions_total
授权者做出的最终决定总数,按授权者类型、名称和决定细分。
  • ALPHA
  • Counter
  • decisionnametype
apiserver_authorization_match_condition_evaluation_errors_total
当授权 webhook 遇到匹配条件错误时,错误的总数,按授权者类型和名称细分。
  • ALPHA
  • Counter
  • nametype
apiserver_authorization_match_condition_evaluation_seconds
授权匹配条件评估时间(单位:秒),按授权者类型和名称细分。
  • ALPHA
  • 直方图
  • nametype
apiserver_authorization_match_condition_exclusions_total
由于匹配条件排除而跳过授权 Webhook 的总排除次数。
  • ALPHA
  • Counter
  • nametype
apiserver_authorization_webhook_duration_seconds
请求延迟(单位:秒)。
  • ALPHA
  • 直方图
  • nameresult
apiserver_authorization_webhook_evaluations_fail_open_total
由于 webhook 超时或错误导致的 NoOpinion 结果。
  • ALPHA
  • Counter
  • nameresult
apiserver_authorization_webhook_evaluations_total
到授权 Webhook 的往返次数。
  • ALPHA
  • Counter
  • nameresult
apiserver_cache_list_fetched_objects_total
在处理 LIST 请求过程中从 watch cache 中读取的对象数量
  • ALPHA
  • Counter
  • indexresource_prefix
apiserver_cache_list_returned_objects_total
从 watch cache 返回的 LIST 请求的对象数量
  • ALPHA
  • Counter
  • resource_prefix
apiserver_cache_list_total
从 watch cache 处理的 LIST 请求数量
  • ALPHA
  • Counter
  • indexresource_prefix
apiserver_certificates_registry_csr_honored_duration_total
已颁发的带有被遵循的请求持续时间的 CSR 总数,按 signer 细分(仅指定 kubernetes.io signer 名称)
  • ALPHA
  • Counter
  • signerName
apiserver_certificates_registry_csr_requested_duration_total
已颁发的带有请求持续时间的 CSR 总数,按 signer 细分(仅指定 kubernetes.io signer 名称)
  • ALPHA
  • Counter
  • signerName
apiserver_client_certificate_expiration_seconds
用于认证请求的证书剩余生命周期的分布。
  • ALPHA
  • 直方图
apiserver_clusterip_repair_ip_errors_total
修复循环在 ClusterIPs 上检测到的错误数量,按错误类型细分:leak, repair, full, outOfRange, duplicate, unknown, invalid
  • ALPHA
  • Counter
  • type
apiserver_clusterip_repair_reconcile_errors_total
ClusterIP 修复协调循环中的协调失败次数
  • ALPHA
  • Counter
apiserver_conversion_webhook_duration_seconds
转换 Webhook 请求延迟
  • ALPHA
  • 直方图
  • failure_typeresult
apiserver_conversion_webhook_request_total
带有成功/失败以及失败错误类型的转换 Webhook 请求的 Counter
  • ALPHA
  • Counter
  • failure_typeresult
apiserver_crd_conversion_webhook_duration_seconds
CRD Webhook 转换持续时间(单位:秒)
  • ALPHA
  • 直方图
  • crd_namefrom_versionsucceededto_version
apiserver_current_inqueue_requests
在最后一秒内,此 apiserver 按请求类型划分的最大排队请求数量。
  • ALPHA
  • Gauge
  • request_kind
apiserver_delegated_authn_request_duration_seconds
请求延迟(单位:秒)。按状态码细分。
  • ALPHA
  • 直方图
  • code
apiserver_delegated_authn_request_total
按状态码划分的 HTTP 请求数量。
  • ALPHA
  • Counter
  • code
apiserver_delegated_authz_request_duration_seconds
请求延迟(单位:秒)。按状态码细分。
  • ALPHA
  • 直方图
  • code
apiserver_delegated_authz_request_total
按状态码划分的 HTTP 请求数量。
  • ALPHA
  • Counter
  • code
apiserver_egress_dialer_dial_duration_seconds
Dial 延迟直方图(单位:秒),按协议 (http-connect 或 grpc)、传输方式 (tcp 或 uds) 标记。
  • ALPHA
  • 直方图
  • protocoltransport
apiserver_egress_dialer_dial_failure_count
Dial 失败计数,按协议 (http-connect 或 grpc)、传输方式 (tcp 或 uds) 和阶段 (connect 或 proxy) 标记。阶段指示 Dial 在哪个阶段失败。
  • ALPHA
  • Counter
  • protocolstagetransport
apiserver_egress_dialer_dial_start_total
Dial 启动次数,按协议 (http-connect 或 grpc) 和传输方式 (tcp 或 uds) 标记。
  • ALPHA
  • Counter
  • protocoltransport
apiserver_encryption_config_controller_automatic_reload_failures_total
按 apiserver 标识划分的加密配置自动重新加载失败总次数。
  • ALPHA
  • Counter
  • apiserver_id_hash
  • 1.30.0
apiserver_encryption_config_controller_automatic_reload_last_timestamp_seconds
按 apiserver 标识划分的加密配置最后一次成功或失败自动重新加载的时间戳。
  • ALPHA
  • Gauge
  • apiserver_id_hashstatus
apiserver_encryption_config_controller_automatic_reload_success_total
按 apiserver 标识划分的加密配置自动重新加载成功总次数。
  • ALPHA
  • Counter
  • apiserver_id_hash
  • 1.30.0
apiserver_encryption_config_controller_automatic_reloads_total
按 apiserver 标识划分的加密配置重新加载成功和失败总次数。
  • ALPHA
  • Counter
  • apiserver_id_hashstatus
apiserver_envelope_encryption_dek_cache_fill_percent
缓存槽位中当前被缓存 DEK 占用的百分比。
  • ALPHA
  • Gauge
apiserver_envelope_encryption_dek_cache_inter_arrival_time_seconds
转换请求到达间隔时间(单位:秒)。
  • ALPHA
  • 直方图
  • transformation_type
apiserver_envelope_encryption_dek_source_cache_size
数据加密密钥 (DEK) 源缓存中的记录数量。重启时,此值是服务器将向 KMS 插件发起的解密 RPC 调用次数的近似值。
  • ALPHA
  • Gauge
  • provider_name
apiserver_envelope_encryption_invalid_key_id_from_status_total
Status RPC 调用返回无效 keyID 的次数,按错误类型细分。
  • ALPHA
  • Counter
  • errorprovider_name
apiserver_envelope_encryption_key_id_hash_last_timestamp_seconds
最后一次使用 keyID 的时间(单位:秒)。
  • ALPHA
  • Gauge
  • apiserver_id_hashkey_id_hashprovider_nametransformation_type
apiserver_envelope_encryption_key_id_hash_status_last_timestamp_seconds
Status RPC 调用最后一次返回 keyID 的时间(单位:秒)。
  • ALPHA
  • Gauge
  • apiserver_id_hashkey_id_hashprovider_name
apiserver_envelope_encryption_key_id_hash_total
使用 keyID 的次数,按转换类型、提供者和 apiserver 标识细分。
  • ALPHA
  • Counter
  • apiserver_id_hashkey_id_hashprovider_nametransformation_type
apiserver_envelope_encryption_kms_operations_latency_seconds
KMS 操作持续时间(包含 gRPC 错误码状态总数)。
  • ALPHA
  • 直方图
  • grpc_status_codemethod_nameprovider_name
apiserver_externaljwt_fetch_keys_data_timestamp
外部 signer 返回的最后一次成功的 FetchKeys data_timestamp 值的 Unix 时间戳(单位:秒)
  • ALPHA
  • Gauge
apiserver_externaljwt_fetch_keys_request_total
同步支持的 JWK 的总尝试次数
  • ALPHA
  • Counter
  • code
apiserver_externaljwt_fetch_keys_success_timestamp
上一次成功的 FetchKeys 请求的 Unix 时间戳(秒)
  • ALPHA
  • Gauge
apiserver_externaljwt_request_duration_seconds
调用 external-jwt-signer 的请求持续时间和时间
  • ALPHA
  • 直方图
  • codemethod
apiserver_externaljwt_sign_request_total
签名 JWT 的总尝试次数
  • ALPHA
  • Counter
  • code
apiserver_flowcontrol_current_inqueue_seats
API 优先级和公平性子系统中当前在队列中等待的座位数
  • ALPHA
  • Gauge
  • flow_schemapriority_level
apiserver_flowcontrol_current_limit_seats
每个优先级级别可用的当前派生执行座位数
  • ALPHA
  • Gauge
  • priority_level
apiserver_flowcontrol_current_r
R(上次更改的时间)
  • ALPHA
  • Gauge
  • priority_level
apiserver_flowcontrol_demand_seats
每纳秒结束时观察到的 (每个优先级级别可使用的座位数) / (该级别的标称座位数)
  • ALPHA
  • TimingRatioHistogram
  • priority_level
apiserver_flowcontrol_demand_seats_average
在上一个调整周期内,按时间加权的 demand_seats 平均值
  • ALPHA
  • Gauge
  • priority_level
apiserver_flowcontrol_demand_seats_high_watermark
在上一个调整周期内,demand_seats 的最高水位线
  • ALPHA
  • Gauge
  • priority_level
apiserver_flowcontrol_demand_seats_smoothed
平滑的座位需求
  • ALPHA
  • Gauge
  • priority_level
apiserver_flowcontrol_demand_seats_stdev
在上一个调整周期内,按时间加权的 demand_seats 标准差
  • ALPHA
  • Gauge
  • priority_level
apiserver_flowcontrol_dispatch_r
R(上次分派的时间)
  • ALPHA
  • Gauge
  • priority_level
apiserver_flowcontrol_epoch_advance_total
队列集的进度表向后跳跃的次数
  • ALPHA
  • Counter
  • priority_levelsuccess
apiserver_flowcontrol_latest_s
S(最近分派的请求)
  • ALPHA
  • Gauge
  • priority_level
apiserver_flowcontrol_lower_limit_seats
配置的每个优先级级别可用的执行座位数的下限
  • ALPHA
  • Gauge
  • priority_level
apiserver_flowcontrol_next_discounted_s_bounds
队列中 S(队列中最旧的等待请求)- 估计的进行中工作量的最小值和最大值
  • ALPHA
  • Gauge
  • boundpriority_level
apiserver_flowcontrol_next_s_bounds
队列中 S(队列中最旧的等待请求)的最小值和最大值
  • ALPHA
  • Gauge
  • boundpriority_level
apiserver_flowcontrol_priority_level_request_utilization
每纳秒结束时观察到的等待中或处于任何执行阶段(但 WATCHes 仅为初始阶段)的请求数(占相关限制的比例)
  • ALPHA
  • TimingRatioHistogram
  • phasepriority_level
apiserver_flowcontrol_priority_level_seat_utilization
每纳秒结束时观察到的任何执行阶段(但 WATCHes 仅为初始阶段)的座位利用率
  • ALPHA
  • TimingRatioHistogram
  • priority_level
  • phase:executing
apiserver_flowcontrol_read_vs_write_current_requests
每纳秒结束时观察到的等待中或处于常规执行阶段的请求数(占相关限制的比例)
  • ALPHA
  • TimingRatioHistogram
  • phaserequest_kind
apiserver_flowcontrol_request_concurrency_in_use
API 优先级和公平性子系统中当前正在执行的请求(WATCH 的初始阶段,否则为任何阶段)所占用的并发(座位数)
  • ALPHA
  • Gauge
  • flow_schemapriority_level
  • 1.31.0
apiserver_flowcontrol_request_concurrency_limit
为每个优先级级别配置的名义执行座位数
  • ALPHA
  • Gauge
  • priority_level
  • 1.30.0
apiserver_flowcontrol_request_dispatch_no_accommodation_total
由于缺乏可用座位,分派尝试未能安排成功的次数
  • ALPHA
  • Counter
  • flow_schemapriority_level
apiserver_flowcontrol_request_execution_seconds
API 优先级和公平性子系统中请求执行的初始阶段(对于 WATCH)或任何阶段(对于非 WATCH)的持续时间
  • ALPHA
  • 直方图
  • flow_schemapriority_leveltype
apiserver_flowcontrol_request_queue_length_after_enqueue
请求入队后,在 API 优先级和公平性子系统中看到的队列长度
  • ALPHA
  • 直方图
  • flow_schemapriority_level
apiserver_flowcontrol_seat_fair_frac
可使用并发的每个优先级级别分配的服务器并发的公平份额
  • ALPHA
  • Gauge
apiserver_flowcontrol_target_seats
座位分配目标
  • ALPHA
  • Gauge
  • priority_level
apiserver_flowcontrol_upper_limit_seats
配置的每个优先级级别可用的执行座位数的上限
  • ALPHA
  • Gauge
  • priority_level
apiserver_flowcontrol_watch_count_samples
在 API 优先级和公平性中对变动请求的观察者计数
  • ALPHA
  • 直方图
  • flow_schemapriority_level
apiserver_flowcontrol_work_estimated_seats
在 API 优先级和公平性中与请求关联的估计座位数(初始座位数和最终座位数的最大值)
  • ALPHA
  • 直方图
  • flow_schemapriority_level
apiserver_init_events_total
按资源类型划分的,在 watch 缓存中处理的初始化事件计数。
  • ALPHA
  • Counter
  • resource
apiserver_kube_aggregator_x509_insecure_sha1_total
统计其服务证书中包含不安全 SHA1 签名的服务器的请求数,或由于不安全 SHA1 签名导致的连接失败数(二者择一,取决于运行时环境)
  • ALPHA
  • Counter
apiserver_kube_aggregator_x509_missing_san_total
统计其服务证书中缺少 SAN 扩展的服务器的请求数,或由于缺少 x509 证书 SAN 扩展导致的连接失败数(二者择一,取决于运行时环境)
  • ALPHA
  • Counter
apiserver_nodeport_repair_port_errors_total
按错误类型(泄露、修复、满、超出范围、重复、未知)划分的修复循环在端口上检测到的错误数
  • ALPHA
  • Counter
  • type
apiserver_nodeport_repair_reconcile_errors_total
NodePort 修复协调循环中的协调失败数
  • ALPHA
  • Counter
apiserver_request_aborts_total
apiserver 可能由于超时而中止的请求数,按 group、version、verb、resource、subresource 和 scope 划分
  • ALPHA
  • Counter
  • groupresourcescopesubresourceverbversion
apiserver_request_body_size_bytes
按 resource 和 verb 划分的 Apiserver 请求正文大小(字节)。
  • ALPHA
  • 直方图
  • resourceverb
apiserver_request_filter_duration_seconds
按过滤器类型划分的请求过滤器延迟分布(秒)
  • ALPHA
  • 直方图
  • filter
apiserver_request_post_timeout_total
跟踪关联请求被 apiserver 超时后请求处理程序的活动
  • ALPHA
  • Counter
  • sourcestatus
apiserver_request_sli_duration_seconds
按 verb、group、version、resource、subresource、scope 和 component 划分的响应延迟分布(不包括 webhook 持续时间和优先级与公平性队列等待时间),单位为秒。
  • ALPHA
  • 直方图
  • componentgroupresourcescopesubresourceverbversion
apiserver_request_slo_duration_seconds
按 verb、group、version、resource、subresource、scope 和 component 划分的响应延迟分布(不包括 webhook 持续时间和优先级与公平性队列等待时间),单位为秒。
  • ALPHA
  • 直方图
  • componentgroupresourcescopesubresourceverbversion
  • 1.27.0
apiserver_request_terminations_total
apiserver 自我保护终止的请求数。
  • ALPHA
  • Counter
  • codecomponentgroupresourcescopesubresourceverbversion
apiserver_request_timestamp_comparison_time
UPDATE 或 PATCH 请求中比较旧对象与新对象所花费的时间
  • ALPHA
  • 直方图
  • code_path
apiserver_rerouted_request_total
由于本地 apiserver 无法处理,而被代理到对等 kube apiserver 的请求总数
  • ALPHA
  • Counter
  • code
apiserver_selfrequest_total
按每个 verb、API resource 和 subresource 划分的 apiserver 自请求计数。
  • ALPHA
  • Counter
  • resourcesubresourceverb
apiserver_storage_data_key_generation_duration_seconds
数据加密密钥 (DEK) 生成操作的延迟(秒)。
  • ALPHA
  • 直方图
apiserver_storage_data_key_generation_failures_total
数据加密密钥 (DEK) 生成失败的总次数。
  • ALPHA
  • Counter
apiserver_storage_db_total_size_in_bytes
存储数据库文件实际分配的总大小(字节)。
  • ALPHA
  • Gauge
  • endpoint
  • 1.28.0
apiserver_storage_decode_errors_total
按对象类型划分的存储对象解码错误数
  • ALPHA
  • Counter
  • resource
apiserver_storage_envelope_transformation_cache_misses_total
访问密钥解密密钥 (KEK) 时的总缓存未命中数。
  • ALPHA
  • Counter
apiserver_storage_events_received_total
按类型划分的接收到的 etcd 事件数。
  • ALPHA
  • Counter
  • resource
apiserver_storage_list_evaluated_objects_total
在处理存储 LIST 请求过程中测试的对象数
  • ALPHA
  • Counter
  • resource
apiserver_storage_list_fetched_objects_total
在处理存储 LIST 请求过程中从存储读取的对象数
  • ALPHA
  • Counter
  • resource
apiserver_storage_list_returned_objects_total
存储 LIST 请求返回的对象数
  • ALPHA
  • Counter
  • resource
apiserver_storage_list_total
处理的存储 LIST 请求数
  • ALPHA
  • Counter
  • resource
apiserver_storage_transformation_duration_seconds
值转换操作的延迟(秒)。
  • ALPHA
  • 直方图
  • transformation_typetransformer_prefix
apiserver_storage_transformation_operations_total
转换总数。成功的转换状态为 'OK',转换失败时状态字符串会不同。status、resource 和 transformation_type 字段可用于告警。例如,可以使用 transformation_type(如 from_storage 用于解密,to_storage 用于加密)监控加密/解密失败。此外,这些字段可用于确保对每个资源应用正确的转换器。
  • ALPHA
  • Counter
  • resourcestatustransformation_typetransformer_prefix
apiserver_stream_translator_requests_total
StreamTranslatorProxy 处理的请求总数,该代理处理流式 RemoteCommand/V5
  • ALPHA
  • Counter
  • code
apiserver_stream_tunnel_requests_total
StreamTunnelProxy 处理的请求总数,该代理处理流式 PortForward/V2
  • ALPHA
  • Counter
  • code
apiserver_terminated_watchers_total
按资源类型划分的,因无响应而关闭的观察者计数。
  • ALPHA
  • Counter
  • resource
apiserver_tls_handshake_errors_total
因 'TLS handshake error from' 错误而丢弃的请求数
  • ALPHA
  • Counter
apiserver_watch_cache_consistent_read_total
缓存一致性读取计数。
  • ALPHA
  • Counter
  • fallbackresourcesuccess
apiserver_watch_cache_events_dispatched_total
按资源类型划分的,在 watch 缓存中分派的事件计数。
  • ALPHA
  • Counter
  • resource
apiserver_watch_cache_events_received_total
按资源类型划分的,在 watch 缓存中接收的事件计数。
  • ALPHA
  • Counter
  • resource
apiserver_watch_cache_initializations_total
按资源类型划分的,watch 缓存初始化计数。
  • ALPHA
  • Counter
  • resource
apiserver_watch_cache_read_wait_seconds
等待 watch 缓存变为最新的时间分布直方图。
  • ALPHA
  • 直方图
  • resource
apiserver_watch_cache_resource_version
按资源类型划分的,watch 缓存的当前资源版本。
  • ALPHA
  • Gauge
  • resource
apiserver_watch_events_sizes
Watch 事件大小分布(字节)
  • ALPHA
  • 直方图
  • groupkindversion
apiserver_watch_events_total
在 watch 客户端发送的事件数
  • ALPHA
  • Counter
  • groupkindversion
apiserver_watch_list_duration_seconds
按 group、version、resource 和 scope 划分的 watch list 请求的响应延迟分布(秒)。
  • ALPHA
  • 直方图
  • groupresourcescopeversion
apiserver_webhooks_x509_insecure_sha1_total
统计其服务证书中包含不安全 SHA1 签名的服务器的请求数,或由于不安全 SHA1 签名导致的连接失败数(二者择一,取决于运行时环境)
  • ALPHA
  • Counter
apiserver_webhooks_x509_missing_san_total
统计其服务证书中缺少 SAN 扩展的服务器的请求数,或由于缺少 x509 证书 SAN 扩展导致的连接失败数(二者择一,取决于运行时环境)
  • ALPHA
  • Counter
attach_detach_controller_attachdetach_controller_forced_detaches
A/D 控制器执行强制分离的次数
  • ALPHA
  • Counter
  • reason
attachdetach_controller_total_volumes
A/D 控制器中的卷数
  • ALPHA
  • Custom
  • plugin_namestate
authenticated_user_requests
按用户名划分的认证请求计数。
  • ALPHA
  • Counter
  • username
authentication_attempts
认证尝试计数。
  • ALPHA
  • Counter
  • result
authentication_duration_seconds
按结果划分的认证持续时间(秒)。
  • ALPHA
  • 直方图
  • result
authentication_token_cache_active_fetch_count
  • ALPHA
  • Gauge
  • status
authentication_token_cache_fetch_total
  • ALPHA
  • Counter
  • status
authentication_token_cache_request_duration_seconds
  • ALPHA
  • 直方图
  • status
authentication_token_cache_request_total
  • ALPHA
  • Counter
  • status
authorization_attempts_total
按结果划分的授权尝试计数。结果可以是 'allowed'(允许)、'denied'(拒绝)、'no-opinion'(无意见)或 'error'(错误)。
  • ALPHA
  • Counter
  • result
authorization_duration_seconds
按结果划分的授权持续时间(秒)。
  • ALPHA
  • 直方图
  • result
cloud_provider_webhook_request_duration_seconds
请求延迟(单位:秒)。按状态码细分。
  • ALPHA
  • 直方图
  • codewebhook
cloud_provider_webhook_request_total
按状态码划分的 HTTP 请求数量。
  • ALPHA
  • Counter
  • codewebhook
clustertrustbundle_publisher_sync_duration_seconds
同步集群信任捆绑包所花费的时间。
  • ALPHA
  • 直方图
  • code
clustertrustbundle_publisher_sync_total
集群信任捆绑包发布者中发生的同步次数。
  • ALPHA
  • Counter
  • code
container_swap_usage_bytes
容器当前交换使用量(字节)。仅在非 Windows 系统上报告
  • ALPHA
  • Custom
  • containerpodnamespace
csi_operations_seconds
CSI (Container Storage Interface) 操作持续时间,按 gRPC 错误码状态计数
  • ALPHA
  • 直方图
  • driver_namegrpc_status_codemethod_namemigrated
dra_grpc_operations_duration_seconds
DRA gRPC 操作的持续时间(秒)
  • ALPHA
  • 直方图
  • driver_namegrpc_status_codemethod_name
dra_operations_duration_seconds
Pod 启动或停止时,处理 Pod 引用的所有 ResourceClaims 所花费时间的延迟直方图(秒)。通过操作名称(PrepareResources 或 UnprepareResources)识别,并按操作成功与否划分。失败操作的数量通过直方图的总计数提供。
  • ALPHA
  • 直方图
  • is_erroroperation_name
endpoint_slice_controller_changes
EndpointSlice 更改数
  • ALPHA
  • Counter
  • operation
endpoint_slice_controller_desired_endpoint_slices
在完美端点分配下将存在的 EndpointSlices 数
  • ALPHA
  • Gauge
endpoint_slice_controller_endpoints_added_per_sync
每次 Service 同步时添加的端点数
  • ALPHA
  • 直方图
endpoint_slice_controller_endpoints_desired
期望的端点数
  • ALPHA
  • Gauge
endpoint_slice_controller_endpoints_removed_per_sync
每次 Service 同步时移除的端点数
  • ALPHA
  • 直方图
endpoint_slice_controller_endpointslices_changed_per_sync
每次 Service 同步时更改的 EndpointSlices 数
  • ALPHA
  • 直方图
  • topologytraffic_distribution
endpoint_slice_controller_num_endpoint_slices
EndpointSlices 数
  • ALPHA
  • Gauge
endpoint_slice_controller_services_count_by_traffic_distribution
使用特定 trafficDistribution 的服务数
  • ALPHA
  • Gauge
  • traffic_distribution
endpoint_slice_controller_syncs
EndpointSlice 同步次数
  • ALPHA
  • Counter
  • result
endpoint_slice_mirroring_controller_addresses_skipped_per_sync
每次 Endpoints 同步时因无效或超出 MaxEndpointsPerSubset 而跳过的地址数
  • ALPHA
  • 直方图
endpoint_slice_mirroring_controller_changes
EndpointSlice 更改数
  • ALPHA
  • Counter
  • operation
endpoint_slice_mirroring_controller_desired_endpoint_slices
在完美端点分配下将存在的 EndpointSlices 数
  • ALPHA
  • Gauge
endpoint_slice_mirroring_controller_endpoints_added_per_sync
每次 Endpoints 同步时添加的端点数
  • ALPHA
  • 直方图
endpoint_slice_mirroring_controller_endpoints_desired
期望的端点数
  • ALPHA
  • Gauge
endpoint_slice_mirroring_controller_endpoints_removed_per_sync
每次 Endpoints 同步时移除的端点数
  • ALPHA
  • 直方图
endpoint_slice_mirroring_controller_endpoints_sync_duration
syncEndpoints() 的持续时间(秒)
  • ALPHA
  • 直方图
endpoint_slice_mirroring_controller_endpoints_updated_per_sync
每次 Endpoints 同步时更新的端点数
  • ALPHA
  • 直方图
endpoint_slice_mirroring_controller_num_endpoint_slices
EndpointSlices 数
  • ALPHA
  • Gauge
ephemeral_volume_controller_create_failures_total
PersistentVolumeClaim 创建请求数
  • ALPHA
  • Counter
ephemeral_volume_controller_create_total
PersistentVolumeClaim 创建请求数
  • ALPHA
  • Counter
etcd_bookmark_counts
按类型划分的 etcd 书签数(进度通知事件)。
  • ALPHA
  • Gauge
  • resource
etcd_lease_object_counts
附加到单个 etcd 租约的对象数。
  • ALPHA
  • 直方图
etcd_request_duration_seconds
按每个操作和对象类型划分的 etcd 请求延迟(秒)。
  • ALPHA
  • 直方图
  • operationtype
etcd_request_errors_total
按每个操作和对象类型划分的 etcd 失败请求计数。
  • ALPHA
  • Counter
  • operationtype
etcd_requests_total
按每个操作和对象类型划分的 etcd 请求计数。
  • ALPHA
  • Counter
  • operationtype
etcd_version_info
Etcd 服务器的二进制版本
  • ALPHA
  • Gauge
  • binary_version
field_validation_request_duration_seconds
按每个字段验证值划分的响应延迟分布(秒)
  • ALPHA
  • 直方图
  • field_validation
force_cleaned_failed_volume_operation_errors_total
kubelet 启动期间重建失败后,强制清理失败的卷数。
  • ALPHA
  • Counter
force_cleaned_failed_volume_operations_total
kubelet 启动期间重建失败后,强制清理的卷数。这包括成功和失败的清理。
  • ALPHA
  • Counter
garbagecollector_controller_resources_sync_error_total
垃圾收集器资源同步错误数
  • ALPHA
  • Counter
horizontal_pod_autoscaler_controller_metric_computation_duration_seconds
HPA 控制器计算一个指标所花费的时间(秒)。标签 'action' 可以是 'scale_down'(缩容)、'scale_up'(扩容)或 'none'(无)。标签 'error' 可以是 'spec'(规格错误)、'internal'(内部错误)或 'none'(无)。标签 'metric_type' 对应于 HPA.spec.metrics[*].type
  • ALPHA
  • 直方图
  • actionerrormetric_type
horizontal_pod_autoscaler_controller_metric_computation_total
指标计算次数。标签 'action' 可以是 'scale_down'(缩容)、'scale_up'(扩容)或 'none'(无)。标签 'error' 可以是 'spec'(规格错误)、'internal'(内部错误)或 'none'(无)。标签 'metric_type' 对应于 HPA.spec.metrics[*].type
  • ALPHA
  • Counter
  • actionerrormetric_type
horizontal_pod_autoscaler_controller_reconciliation_duration_seconds
HPA 控制器协调一次所花费的时间(秒)。标签 'action' 可以是 'scale_down'(缩容)、'scale_up'(扩容)或 'none'(无)。标签 'error' 可以是 'spec'(规格错误)、'internal'(内部错误)或 'none'(无)。注意,如果在协调过程中同时发生规格错误和内部错误,则在 `error` 标签中报告先发生的错误。
  • ALPHA
  • 直方图
  • actionerror
horizontal_pod_autoscaler_controller_reconciliations_total
HPA 控制器的协调次数。标签 'action' 可以是 'scale_down'(缩容)、'scale_up'(扩容)或 'none'(无)。标签 'error' 可以是 'spec'(规格错误)、'internal'(内部错误)或 'none'(无)。注意,如果在协调过程中同时发生规格错误和内部错误,则在 `error` 标签中报告先发生的错误。
  • ALPHA
  • Counter
  • actionerror
job_controller_job_finished_indexes_total
完成的索引数。 status 标签的可能值为:"succeeded"(成功)、"failed"(失败)。 backoffLimit 标签的可能值为:"perIndex"(按索引)和 "global"(全局)。
  • ALPHA
  • Counter
  • backoffLimitstatus
job_controller_job_pods_creation_total
Job 控制器创建的 Pod 数,带有 Pod 创建原因的标签。此指标还区分使用不同 PodReplacementPolicy 设置创建的 Pod。 "reason" 标签的可能值为:"new"(新)、"recreate_terminating_or_failed"(重新创建终止或失败的)、"recreate_failed"(重新创建失败的)。 "status" 标签的可能值为:"succeeded"(成功)、"failed"(失败)。
  • ALPHA
  • Counter
  • reasonstatus
job_controller_jobs_by_external_controller_total
外部控制器管理的 Job 数
  • ALPHA
  • Counter
  • controller_name
job_controller_pod_failures_handled_by_failure_policy_total
由失败策略处理的失败 Pod 数,具体取决于根据匹配规则应用的失败策略操作。 action 标签的可能值对应于失败策略规则操作的可能值,即:"FailJob"(作业失败)、"Ignore"(忽略)和 "Count"(计数)。
  • ALPHA
  • Counter
  • action
job_controller_terminated_pods_tracking_finalizer_total
具有 finalizer batch.kubernetes.io/job-tracking 的终止 Pod 数 (phase=Failed|Succeeded)。event 标签可以是 "add"(添加)或 "delete"(删除)。
  • ALPHA
  • Counter
  • event
kube_apiserver_clusterip_allocator_allocated_ips
测量为服务分配的 IP 数的 Gauge 指标
  • ALPHA
  • Gauge
  • cidr
kube_apiserver_clusterip_allocator_allocation_duration_seconds
按 ServiceCIDR 分配 Cluster IP 的持续时间(秒)
  • ALPHA
  • 直方图
  • cidr
kube_apiserver_clusterip_allocator_allocation_errors_total
尝试分配 Cluster IP 的错误数
  • ALPHA
  • Counter
  • cidrscope
kube_apiserver_clusterip_allocator_allocation_total
Cluster IP 分配次数
  • ALPHA
  • Counter
  • cidrscope
kube_apiserver_clusterip_allocator_available_ips
测量服务可用 IP 数的 Gauge 指标
  • ALPHA
  • Gauge
  • cidr
kube_apiserver_nodeport_allocator_allocated_ports
测量为服务分配的 NodePort 数的 Gauge 指标
  • ALPHA
  • Gauge
kube_apiserver_nodeport_allocator_allocation_errors_total
尝试分配 NodePort 的错误数
  • ALPHA
  • Counter
  • scope
kube_apiserver_nodeport_allocator_allocation_total
NodePort 分配次数
  • ALPHA
  • Counter
  • scope
kube_apiserver_nodeport_allocator_available_ports
测量服务可用 NodePort 数的 Gauge 指标
  • ALPHA
  • Gauge
kube_apiserver_pod_logs_backend_tls_failure_total
由于 kubelet 服务器 TLS 验证失败而导致的 pods/logs 请求总数
  • ALPHA
  • Counter
kube_apiserver_pod_logs_insecure_backend_total
按 usage 类型划分的 pods/logs 请求总数:enforce_tls(强制 TLS)、skip_tls_allowed(允许跳过 TLS)、skip_tls_denied(拒绝跳过 TLS)
  • ALPHA
  • Counter
  • usage
kube_apiserver_pod_logs_pods_logs_backend_tls_failure_total
由于 kubelet 服务器 TLS 验证失败而导致的 pods/logs 请求总数
  • ALPHA
  • Counter
  • 1.27.0
kube_apiserver_pod_logs_pods_logs_insecure_backend_total
按 usage 类型划分的 pods/logs 请求总数:enforce_tls(强制 TLS)、skip_tls_allowed(允许跳过 TLS)、skip_tls_denied(拒绝跳过 TLS)
  • ALPHA
  • Counter
  • usage
  • 1.27.0
kubelet_active_pods
kubelet 视为活动并在准入新 Pod 时考虑的 Pod 数。如果 Pod 不是来自 apiserver,则 static 为 true。
  • ALPHA
  • Gauge
  • static
kubelet_admission_rejections_total
Kubelet 拒绝的 Pod 准入请求累计数。
  • ALPHA
  • Counter
  • reason
kubelet_certificate_manager_client_expiration_renew_errors
证书续订错误计数。
  • ALPHA
  • Counter
kubelet_certificate_manager_client_ttl_seconds
Kubelet 客户端证书的 TTL(存活时间)的 Gauge 指标。该值表示直到证书到期的时间(秒),如果已过期则为负值。如果客户端证书无效或未使用,该值为 +INF。
  • ALPHA
  • Gauge
kubelet_certificate_manager_server_rotation_seconds
上一个证书在轮换前存活的秒数直方图。
  • ALPHA
  • 直方图
kubelet_certificate_manager_server_ttl_seconds
Kubelet 服务证书最短 TTL(存活时间)的 Gauge 指标。该值表示直到证书到期的时间(秒),如果已过期则为负值。如果服务证书无效或未使用,该值为 +INF。
  • ALPHA
  • Gauge
kubelet_cgroup_manager_duration_seconds
cgroup 管理器操作的持续时间(秒)。按方法划分。
  • ALPHA
  • 直方图
  • operation_type
kubelet_cgroup_version
主机上的 cgroup 版本。
  • ALPHA
  • Gauge
kubelet_container_aligned_compute_resources_count
按对齐类型划分的,分配给容器的对齐计算资源累计数。
  • ALPHA
  • Counter
  • boundaryscope
kubelet_container_log_filesystem_used_bytes
容器日志在文件系统上使用的字节数。
  • ALPHA
  • Custom
  • uidnamespacepodcontainer
kubelet_containers_per_pod_count
每个 Pod 的容器数。
  • ALPHA
  • 直方图
kubelet_cpu_manager_exclusive_cpu_allocation_count
分配给在此节点上运行的容器的专属 CPU 总数
  • ALPHA
  • Gauge
kubelet_cpu_manager_pinning_errors_total
需要 CPU 核心绑定的分配失败次数。
  • ALPHA
  • Counter
kubelet_cpu_manager_pinning_requests_total
需要 CPU 核心绑定的分配次数。
  • ALPHA
  • Counter
kubelet_cpu_manager_shared_pool_size_millicores
非 Guaranteed QoS Pod 的共享 CPU 池大小,单位为毫核。
  • ALPHA
  • Gauge
kubelet_credential_provider_plugin_duration
凭据提供程序插件执行持续时间(秒)
  • ALPHA
  • 直方图
  • plugin_name
kubelet_credential_provider_plugin_errors
凭据提供程序插件错误数
  • ALPHA
  • Counter
  • plugin_name
kubelet_desired_pods
kubelet 被指示运行的 Pod 数。如果 Pod 不是来自 apiserver,则 static 为 true。
  • ALPHA
  • Gauge
  • static
kubelet_device_plugin_alloc_duration_seconds
处理设备插件 Allocation 请求的持续时间(秒)。按资源名称划分。
  • ALPHA
  • 直方图
  • resource_name
kubelet_device_plugin_registration_total
设备插件注册累计数。按资源名称划分。
  • ALPHA
  • Counter
  • resource_name
kubelet_evented_pleg_connection_error_count
与 CRI 运行时建立流式连接过程中遇到的错误数。
  • ALPHA
  • Counter
kubelet_evented_pleg_connection_latency_seconds
与 CRI 运行时建立流式连接的延迟(秒)。
  • ALPHA
  • 直方图
kubelet_evented_pleg_connection_success_count
获取流式客户端以接收 CRI 事件的次数。
  • ALPHA
  • Counter
kubelet_eviction_stats_age_seconds
统计信息收集时间与根据这些统计信息通过驱逐信号驱逐 Pod 时间之间的间隔
  • ALPHA
  • 直方图
  • eviction_signal
kubelet_evictions
按驱逐信号划分的 Pod 驱逐累计数
  • ALPHA
  • Counter
  • eviction_signal
kubelet_graceful_shutdown_end_time_seconds
上次优雅关闭结束时间(自 Unix 纪元以来的秒数)
  • ALPHA
  • Gauge
kubelet_graceful_shutdown_start_time_seconds
上次优雅关闭开始时间(自 Unix 纪元以来的秒数)
  • ALPHA
  • Gauge
kubelet_http_inflight_requests
进行中的 http 请求数
  • ALPHA
  • Gauge
  • long_runningmethodpathserver_type
kubelet_http_requests_duration_seconds
处理 http 请求的持续时间(秒)
  • ALPHA
  • 直方图
  • long_runningmethodpathserver_type
kubelet_http_requests_total
服务器启动以来接收到的 http 请求数
  • ALPHA
  • Counter
  • long_runningmethodpathserver_type
kubelet_image_garbage_collected_total
kubelet 垃圾收集的镜像总数,无论是通过磁盘使用量还是镜像年龄。
  • ALPHA
  • Counter
  • reason
kubelet_image_pull_duration_seconds
拉取镜像的持续时间(秒)。
  • ALPHA
  • 直方图
  • image_size_in_bytes
kubelet_lifecycle_handler_http_fallbacks_total
生命周期处理程序从 https 成功回退到 http 的次数。
  • ALPHA
  • Counter
kubelet_managed_ephemeral_containers
此 kubelet 管理的 Pod 中当前临时容器的数量。
  • ALPHA
  • Gauge
kubelet_memory_manager_pinning_errors_total
需要内存页绑定的分配失败次数。
  • ALPHA
  • Counter
kubelet_memory_manager_pinning_requests_total
需要内存页绑定的分配次数。
  • ALPHA
  • Counter
kubelet_mirror_pods
kubelet 将尝试创建的镜像 Pod 数(每个准入的静态 Pod 一个)
  • ALPHA
  • Gauge
kubelet_node_name
节点的名称。计数始终为 1。
  • ALPHA
  • Gauge
  • node
kubelet_node_startup_duration_seconds
节点启动总持续时间(秒)。
  • ALPHA
  • Gauge
kubelet_node_startup_post_registration_duration_seconds
节点注册后启动持续时间(秒)。
  • ALPHA
  • Gauge
kubelet_node_startup_pre_kubelet_duration_seconds
kubelet 启动前节点启动持续时间(秒)。
  • ALPHA
  • Gauge
kubelet_node_startup_pre_registration_duration_seconds
注册前节点启动持续时间(秒)。
  • ALPHA
  • Gauge
kubelet_node_startup_registration_duration_seconds
节点注册期间启动持续时间(秒)。
  • ALPHA
  • Gauge
kubelet_orphan_pod_cleaned_volumes
上次周期性扫描中卷被清理的孤立 Pod 总数。
  • ALPHA
  • Gauge
kubelet_orphan_pod_cleaned_volumes_errors
上次周期性扫描中卷清理失败的孤立 Pod 数。
  • ALPHA
  • Gauge
kubelet_orphaned_runtime_pods_total
在容器运行时中检测到但在 Pod 工作程序中未知晓的 Pod 数。这通常表示 kubelet 在 Pod 在 API 或本地配置中被强制删除时重启了,这是不寻常的。
  • ALPHA
  • Counter
kubelet_pleg_discard_events
PLEG 中的丢弃事件数。
  • ALPHA
  • Counter
kubelet_pleg_last_seen_seconds
最后一次看到 PLEG 活动时的时间戳(秒)。
  • ALPHA
  • Gauge
kubelet_pleg_relist_duration_seconds
PLEG 中重新列出 Pod 的持续时间(秒)。
  • ALPHA
  • 直方图
kubelet_pleg_relist_interval_seconds
PLEG 中重新列出之间的间隔(秒)。
  • ALPHA
  • 直方图
kubelet_pod_resources_endpoint_errors_get
对 PodResource Get 端点返回错误的请求数。按服务器 API 版本划分。
  • ALPHA
  • Counter
  • server_api_version
kubelet_pod_resources_endpoint_errors_get_allocatable
对 PodResource GetAllocatableResources 端点返回错误的请求数。按服务器 API 版本划分。
  • ALPHA
  • Counter
  • server_api_version
kubelet_pod_resources_endpoint_errors_list
对 PodResource List 端点返回错误的请求数。按服务器 API 版本划分。
  • ALPHA
  • Counter
  • server_api_version
kubelet_pod_resources_endpoint_requests_get
对 PodResource Get 端点的请求数。按服务器 API 版本划分。
  • ALPHA
  • Counter
  • server_api_version
kubelet_pod_resources_endpoint_requests_get_allocatable
对 PodResource GetAllocatableResources 端点的请求数。按服务器 API 版本划分。
  • ALPHA
  • Counter
  • server_api_version
kubelet_pod_resources_endpoint_requests_list
对 PodResource List 端点的请求数。按服务器 API 版本划分。
  • ALPHA
  • Counter
  • server_api_version
kubelet_pod_resources_endpoint_requests_total
对 PodResource 端点的累计请求数。按服务器 API 版本划分。
  • ALPHA
  • Counter
  • server_api_version
kubelet_pod_start_duration_seconds
从 kubelet 第一次看到 Pod 到 Pod 开始运行的持续时间(秒)
  • ALPHA
  • 直方图
kubelet_pod_start_sli_duration_seconds
启动一个 Pod 的持续时间(秒),不包括拉取镜像和运行 Init 容器的时间,测量范围从 Pod 创建时间戳到所有容器报告为已启动并通过 watch 被观察到为止
  • ALPHA
  • 直方图
kubelet_pod_start_total_duration_seconds
Pod 创建以来启动一个 Pod 的持续时间(秒),包括拉取镜像和运行 Init 容器的时间,测量范围从 Pod 创建时间戳到所有容器报告为已启动并通过 watch 被观察到为止
  • ALPHA
  • 直方图
kubelet_pod_status_sync_duration_seconds
同步 Pod 状态更新的持续时间(秒)。测量范围从检测到 Pod 状态更改到该 Pod 的 API 成功更新为止,即使期间发生了多个 Pod 状态更改。
  • ALPHA
  • 直方图
kubelet_pod_worker_duration_seconds
同步单个 Pod 的持续时间(秒)。按操作类型划分:create(创建)、update(更新)或 sync(同步)
  • ALPHA
  • 直方图
  • operation_type
kubelet_pod_worker_start_duration_seconds
从 kubelet 看到 Pod 到启动工作程序的持续时间(秒)。
  • ALPHA
  • 直方图
kubelet_preemptions
按抢占资源划分的 Pod 抢占累计数
  • ALPHA
  • Counter
  • preemption_signal
kubelet_restarted_pods_total
由于在 kubelet 监视时被删除并以相同的 UID 重新创建而重启的 Pod 数(静态 Pod 常见,API Pod 极为罕见)
  • ALPHA
  • Counter
  • static
kubelet_run_podsandbox_duration_seconds
run_podsandbox 操作的持续时间(秒)。按 RuntimeClass.Handler 划分。
  • ALPHA
  • 直方图
  • runtime_handler
kubelet_run_podsandbox_errors_total
按 RuntimeClass.Handler 划分的 run_podsandbox 操作错误累计数。
  • ALPHA
  • Counter
  • runtime_handler
kubelet_running_containers
当前运行的容器数
  • ALPHA
  • Gauge
  • container_state
kubelet_running_pods
具有运行中 Pod 沙箱的 Pod 数
  • ALPHA
  • Gauge
kubelet_runtime_operations_duration_seconds
运行时操作的持续时间(秒)。按操作类型划分。
  • ALPHA
  • 直方图
  • operation_type
kubelet_runtime_operations_errors_total
按操作类型划分的运行时操作错误累计数。
  • ALPHA
  • Counter
  • operation_type
kubelet_runtime_operations_total
按操作类型划分的运行时操作累计数。
  • ALPHA
  • Counter
  • operation_type
kubelet_server_expiration_renew_errors
证书续订错误计数。
  • ALPHA
  • Counter
kubelet_sleep_action_terminated_early_total
生命周期 sleep 处理程序在完成前被终止的次数
  • ALPHA
  • Counter
kubelet_started_containers_errors_total
启动容器时的错误累计数
  • ALPHA
  • Counter
  • codecontainer_type
kubelet_started_containers_total
已启动容器的累计数
  • ALPHA
  • Counter
  • container_type
kubelet_started_host_process_containers_errors_total
启动 hostprocess 容器时的错误累计数。此指标仅在 Windows 上收集。
  • ALPHA
  • Counter
  • codecontainer_type
kubelet_started_host_process_containers_total
已启动 hostprocess 容器的累计数。此指标仅在 Windows 上收集。
  • ALPHA
  • Counter
  • container_type
kubelet_started_pods_errors_total
启动 Pod 时的错误累计数
  • ALPHA
  • Counter
kubelet_started_pods_total
已启动 Pod 的累计数
  • ALPHA
  • Counter
kubelet_topology_manager_admission_duration_ms
处理 Pod 准入请求的持续时间(毫秒)。
  • ALPHA
  • 直方图
kubelet_topology_manager_admission_errors_total
资源无法对齐的准入请求失败次数。
  • ALPHA
  • Counter
kubelet_topology_manager_admission_requests_total
资源需要对齐的准入请求次数。
  • ALPHA
  • Counter
kubelet_volume_metric_collection_duration_seconds
计算卷统计信息的持续时间(秒)
  • ALPHA
  • 直方图
  • metric_source
kubelet_volume_stats_available_bytes
卷中的可用字节数
  • ALPHA
  • Custom
  • namespacepersistentvolumeclaim
kubelet_volume_stats_capacity_bytes
卷的容量(字节)
  • ALPHA
  • Custom
  • namespacepersistentvolumeclaim
kubelet_volume_stats_health_status_abnormal
异常卷健康状态。计数为 1 或 0。1 表示卷不健康,0 表示卷健康
  • ALPHA
  • Custom
  • namespacepersistentvolumeclaim
kubelet_volume_stats_inodes
卷中最大 inode 数
  • ALPHA
  • Custom
  • namespacepersistentvolumeclaim
kubelet_volume_stats_inodes_free
卷中空闲 inode 数
  • ALPHA
  • Custom
  • namespacepersistentvolumeclaim
kubelet_volume_stats_inodes_used
卷中使用中的 inode 数
  • ALPHA
  • Custom
  • namespacepersistentvolumeclaim
kubelet_volume_stats_used_bytes
卷中使用中的字节数
  • ALPHA
  • Custom
  • namespacepersistentvolumeclaim
kubelet_working_pods
kubelet 实际运行的 Pod 数,按生命周期阶段划分,以及 Pod 是期望的、孤立的还是仅运行时(也是孤立的),以及 Pod 是否为静态。孤立 Pod 已从本地配置中移除或在 API 中被强制删除,并消耗了其他不可见的资源。
  • ALPHA
  • Gauge
  • configlifecyclestatic
kubeproxy_iptables_ct_state_invalid_dropped_packets_total
iptables 为解决 conntrack 问题而丢弃的数据包
  • ALPHA
  • Custom
kubeproxy_iptables_localhost_nodeports_accepted_packets_total
loopback 接口 NodePort 上接受的数据包数
  • ALPHA
  • Custom
kubeproxy_network_programming_duration_seconds
集群内网络编程延迟(秒)
  • ALPHA
  • 直方图
kubeproxy_proxy_healthz_total
代理 healthz HTTP 状态累计数
  • ALPHA
  • Counter
  • code
kubeproxy_proxy_livez_total
代理 livez HTTP 状态累计数
  • ALPHA
  • Counter
  • code
kubeproxy_sync_full_proxy_rules_duration_seconds
完全重新同步的 SyncProxyRules 延迟(秒)
  • ALPHA
  • 直方图
kubeproxy_sync_partial_proxy_rules_duration_seconds
部分重新同步的 SyncProxyRules 延迟(秒)
  • ALPHA
  • 直方图
kubeproxy_sync_proxy_rules_duration_seconds
SyncProxyRules 延迟(秒)
  • ALPHA
  • 直方图
kubeproxy_sync_proxy_rules_endpoint_changes_pending
待处理的代理规则 Endpoint 更改
  • ALPHA
  • Gauge
kubeproxy_sync_proxy_rules_endpoint_changes_total
累计代理规则端点变更
  • ALPHA
  • Counter
kubeproxy_sync_proxy_rules_iptables_last
kube-proxy 在上次同步中写入的 iptables 规则数量
  • ALPHA
  • Gauge
  • table
kubeproxy_sync_proxy_rules_iptables_partial_restore_failures_total
累计代理 iptables 部分恢复失败
  • ALPHA
  • Counter
kubeproxy_sync_proxy_rules_iptables_restore_failures_total
累计代理 iptables 恢复失败
  • ALPHA
  • Counter
kubeproxy_sync_proxy_rules_iptables_total
kube-proxy 所拥有的 iptables 规则总数
  • ALPHA
  • Gauge
  • table
kubeproxy_sync_proxy_rules_last_queued_timestamp_seconds
上次代理规则同步排队的时间戳
  • ALPHA
  • Gauge
kubeproxy_sync_proxy_rules_last_timestamp_seconds
上次代理规则成功同步的时间戳
  • ALPHA
  • Gauge
kubeproxy_sync_proxy_rules_nftables_cleanup_failures_total
累计代理 nftables 清理失败
  • ALPHA
  • Counter
kubeproxy_sync_proxy_rules_nftables_sync_failures_total
累计代理 nftables 同步失败
  • ALPHA
  • Counter
kubeproxy_sync_proxy_rules_no_local_endpoints_total
具有 Local 流量策略且没有端点的服务数量
  • ALPHA
  • Gauge
  • traffic_policy
kubeproxy_sync_proxy_rules_service_changes_pending
待处理的代理规则服务变更
  • ALPHA
  • Gauge
kubeproxy_sync_proxy_rules_service_changes_total
累计代理规则服务变更
  • ALPHA
  • Counter
kubernetes_build_info
一个常量值为 '1' 的指标,带有标签,表示构建 Kubernetes 所使用的 major、minor、git 版本、git commit、git tree state、构建日期、Go 版本和编译器,以及其运行的平台。
  • ALPHA
  • Gauge
  • build_datecompilergit_commitgit_tree_stategit_versiongo_versionmajorminorplatform
leader_election_master_status
一个 gauge 指标,表示报告系统是否是相关租约的主控者,0 表示备份,1 表示主控。'name' 是用于标识租约的字符串。请确保按名称进行分组。
  • ALPHA
  • Gauge
  • name
leader_election_slowpath_total
在续订 leader 租约时执行的慢路径总数。'name' 是用于标识租约的字符串。请确保按名称进行分组。
  • ALPHA
  • Counter
  • name
node_authorizer_graph_actions_duration_seconds
节点授权器中图操作持续时间的直方图。
  • ALPHA
  • 直方图
  • operation
node_collector_unhealthy_nodes_in_zone
按区域衡量的未就绪节点数量的 gauge 指标。
  • ALPHA
  • Gauge
  • zone
node_collector_update_all_nodes_health_duration_seconds
NodeController 更新所有节点健康状况所需的持续时间(秒)。
  • ALPHA
  • 直方图
node_collector_update_node_health_duration_seconds
NodeController 更新单个节点健康状况所需的持续时间(秒)。
  • ALPHA
  • 直方图
node_collector_zone_health
按区域衡量的健康节点百分比的 gauge 指标。
  • ALPHA
  • Gauge
  • zone
node_collector_zone_size
按区域衡量的注册节点数量的 gauge 指标。
  • ALPHA
  • Gauge
  • zone
node_controller_cloud_provider_taint_removal_delay_seconds
节点创建后 NodeController 移除单个节点云提供商污点的秒数。
  • ALPHA
  • 直方图
node_controller_initial_node_sync_delay_seconds
节点创建后 NodeController 完成单个节点初始同步的秒数。
  • ALPHA
  • 直方图
node_ipam_controller_cidrset_allocation_tries_per_request
每次 Service 同步时添加的端点数
  • ALPHA
  • 直方图
  • clusterCIDR
node_ipam_controller_cidrset_cidrs_allocations_total
衡量 CIDR 分配总数的计数器。
  • ALPHA
  • Counter
  • clusterCIDR
node_ipam_controller_cidrset_cidrs_releases_total
衡量 CIDR 释放总数的计数器。
  • ALPHA
  • Counter
  • clusterCIDR
node_ipam_controller_cidrset_usage_cidrs
衡量已分配 CIDR 百分比的 gauge 指标。
  • ALPHA
  • Gauge
  • clusterCIDR
node_ipam_controller_cirdset_max_cidrs
可分配的最大 CIDR 数量。
  • ALPHA
  • Gauge
  • clusterCIDR
node_swap_usage_bytes
节点当前以字节为单位的 swap 用量。仅在非 Windows 系统上报告。
  • ALPHA
  • Custom
plugin_manager_total_plugins
插件管理器中的插件数量。
  • ALPHA
  • Custom
  • socket_pathstate
pod_gc_collector_force_delete_pod_errors_total
Pod GC Controller 启动以来,强制删除 Pod 时遇到的错误数量。
  • ALPHA
  • Counter
  • namespacereason
pod_gc_collector_force_delete_pods_total
Pod GC Controller 启动以来,正在被强制删除的 Pod 数量。
  • ALPHA
  • Counter
  • namespacereason
pod_security_errors_total
阻止正常评估的错误数量。非致命错误可能导致使用最新的受限配置文件进行评估。
  • ALPHA
  • Counter
  • fatalrequest_operationresourcesubresource
pod_security_evaluations_total
发生的策略评估数量,不包括被忽略或豁免的请求。
  • ALPHA
  • Counter
  • decisionmodepolicy_levelpolicy_versionrequest_operationresourcesubresource
pod_security_exemptions_total
豁免的请求数量,不包括被忽略或超出范围的请求。
  • ALPHA
  • Counter
  • request_operationresourcesubresource
pod_swap_usage_bytes
Pod 当前以字节为单位的 swap 用量。仅在非 Windows 系统上报告。
  • ALPHA
  • Custom
  • podnamespace
prober_probe_duration_seconds
探测响应的持续时间(秒)。
  • ALPHA
  • 直方图
  • containernamespacepodprobe_type
prober_probe_total
按结果衡量的容器的累计 liveness、readiness 或 startup 探测次数。
  • ALPHA
  • Counter
  • containernamespacepodpod_uidprobe_typeresult
pv_collector_bound_pv_count
衡量当前已绑定持久卷数量的 gauge 指标。
  • ALPHA
  • Custom
  • storage_class
pv_collector_bound_pvc_count
衡量当前已绑定持久卷声明数量的 gauge 指标。
  • ALPHA
  • Custom
  • namespacestorage_classvolume_attributes_class
pv_collector_total_pv_count
衡量持久卷总数的 gauge 指标。
  • ALPHA
  • Custom
  • plugin_namevolume_mode
pv_collector_unbound_pv_count
衡量当前未绑定持久卷数量的 gauge 指标。
  • ALPHA
  • Custom
  • storage_class
pv_collector_unbound_pvc_count
衡量当前未绑定持久卷声明数量的 gauge 指标。
  • ALPHA
  • Custom
  • namespacestorage_classvolume_attributes_class
reconstruct_volume_operations_errors_total
kubelet 启动时从操作系统重建失败的卷数量。
  • ALPHA
  • Counter
reconstruct_volume_operations_total
kubelet 启动时尝试从操作系统重建的卷数量。这包括成功和失败的重建。
  • ALPHA
  • Counter
replicaset_controller_sorting_deletion_age_ratio
所选被删除 Pod 的年龄与当前最年轻 Pod 的年龄(当时)的比率。应小于 2。此指标旨在衡量 LogarithmicScaleDown 功能门在副本集缩减时对 Pod 排序(和删除)的粗略效果。计算和报告时仅考虑 Ready 状态的 Pod。
  • ALPHA
  • 直方图
resourceclaim_controller_allocated_resource_claims
已分配的 ResourceClaim 数量。
  • ALPHA
  • Gauge
resourceclaim_controller_create_attempts_total
ResourceClaim 创建请求数量。
  • ALPHA
  • Counter
resourceclaim_controller_create_failures_total
ResourceClaim 创建请求失败数量。
  • ALPHA
  • Counter
resourceclaim_controller_resource_claims
ResourceClaim 数量。
  • ALPHA
  • Gauge
rest_client_dns_resolution_duration_seconds
DNS 解析器延迟(秒)。按主机细分。
  • ALPHA
  • 直方图
  • host
rest_client_exec_plugin_call_total
对 exec 插件的调用次数,按遇到的事件类型(no_error、plugin_execution_error、plugin_not_found_error、client_internal_error)和可选的退出代码进行划分。仅当插件调用成功时,退出代码才设置为 0。
  • ALPHA
  • Counter
  • call_statuscode
rest_client_exec_plugin_certificate_rotation_age
上次 auth exec 插件客户端证书在轮换前存活秒数的直方图。如果 auth exec 插件客户端证书未使用,则直方图不包含数据。
  • ALPHA
  • 直方图
rest_client_exec_plugin_ttl_seconds
auth exec 插件管理的客户端证书的最短 TTL(存活时间)的 gauge 指标。值为距离证书过期时间的秒数(如果已过期则为负值)。如果 auth exec 插件未使用或未管理 TLS 证书,则值为 +INF。
  • ALPHA
  • Gauge
rest_client_rate_limiter_duration_seconds
客户端限速器延迟(秒)。按动词和主机细分。
  • ALPHA
  • 直方图
  • hostverb
rest_client_request_duration_seconds
请求延迟(秒)。按动词和主机细分。
  • ALPHA
  • 直方图
  • hostverb
rest_client_request_retries_total
请求重试次数,按状态码、动词和主机划分。
  • ALPHA
  • Counter
  • codehostverb
rest_client_request_size_bytes
请求大小(字节)。按动词和主机细分。
  • ALPHA
  • 直方图
  • hostverb
rest_client_requests_total
HTTP 请求次数,按状态码、方法和主机划分。
  • ALPHA
  • Counter
  • codehostmethod
rest_client_response_size_bytes
响应大小(字节)。按动词和主机细分。
  • ALPHA
  • 直方图
  • hostverb
rest_client_transport_cache_entries
内部缓存中的传输条目数量。
  • ALPHA
  • Gauge
rest_client_transport_create_calls_total
获取新传输的调用次数,按操作结果划分:hit:从缓存获取,miss:创建并添加到缓存,uncacheable:创建但不缓存。
  • ALPHA
  • Counter
  • result
retroactive_storageclass_errors_total
追溯性 StorageClass 分配给持久卷声明的总失败次数。
  • ALPHA
  • Counter
retroactive_storageclass_total
追溯性 StorageClass 分配给持久卷声明的总次数。
  • ALPHA
  • Counter
root_ca_cert_publisher_sync_duration_seconds
root ca 证书发布者中发生的命名空间同步次数。
  • ALPHA
  • 直方图
  • code
root_ca_cert_publisher_sync_total
root ca 证书发布者中发生的命名空间同步次数。
  • ALPHA
  • Counter
  • code
running_managed_controllers
指示控制器实例当前正在哪里运行。
  • ALPHA
  • Gauge
  • managername
scheduler_event_handling_duration_seconds
事件处理延迟(秒)。
  • ALPHA
  • 直方图
  • event
scheduler_goroutines
按其执行的工作(如绑定)划分的正在运行的 goroutine 数量。
  • ALPHA
  • Gauge
  • operation
scheduler_inflight_events
调度队列中当前跟踪的事件数量。
  • ALPHA
  • Gauge
  • event
scheduler_permit_wait_duration_seconds
等待许可的持续时间。
  • ALPHA
  • 直方图
  • result
scheduler_plugin_evaluation_total
按每个插件和扩展点(仅在 PreFilter、Filter、PreScore 和 Score 中可用)衡量的调度 Pod 的尝试次数。
  • ALPHA
  • Counter
  • extension_pointpluginprofile
scheduler_plugin_execution_duration_seconds
在特定扩展点运行插件的持续时间。
  • ALPHA
  • 直方图
  • extension_pointpluginstatus
scheduler_preemption_goroutines_duration_seconds
运行抢占 goroutine 的持续时间(秒)。
  • ALPHA
  • 直方图
  • result
scheduler_preemption_goroutines_execution_total
执行的抢占 goroutine 数量。
  • ALPHA
  • Counter
  • result
scheduler_queueing_hint_execution_duration_seconds
运行插件排队提示函数的持续时间。
  • ALPHA
  • 直方图
  • eventhintplugin
scheduler_scheduler_cache_size
调度器缓存中的节点、Pod 和假定的(已绑定)Pod 数量。
  • ALPHA
  • Gauge
  • type
scheduler_scheduling_algorithm_duration_seconds
调度算法延迟(秒)。
  • ALPHA
  • 直方图
scheduler_unschedulable_pods
按插件名称细分的不可调度 Pod 数量。一个 Pod 会为其导致其无法调度的所有插件增加 gauge 值,因此此指标仅在按插件细分时才有意义。
  • ALPHA
  • Gauge
  • pluginprofile
scheduler_volume_binder_cache_requests_total
请求卷绑定缓存的总次数。
  • ALPHA
  • Counter
  • operation
scheduler_volume_scheduling_stage_error_total
卷调度阶段错误计数。
  • ALPHA
  • Counter
  • operation
scrape_error
获取容器指标时出错则为 1,否则为 0
  • ALPHA
  • Custom
  • 1.29.0
selinux_warning_controller_selinux_volume_conflict
使用相同卷的两个 Pod 之间的冲突。
  • ALPHA
  • Custom
  • propertypod1_namespacepod1_namepod1_valuepod2_namespacepod2_namepod2_value
service_controller_loadbalancer_sync_total
一个指标,计算由于集群上的服务/节点变更导致任何负载均衡器被配置的次数。
  • ALPHA
  • Counter
service_controller_nodesync_error_total
一个指标,计算由于集群上的节点变更导致任何负载均衡器被配置并出错的次数。
  • ALPHA
  • Counter
service_controller_nodesync_latency_seconds
一个指标,衡量 nodesync 的延迟,该 nodesync 在集群节点更新时更新负载均衡器主机。
  • ALPHA
  • 直方图
service_controller_update_loadbalancer_host_latency_seconds
一个指标,衡量更新每个负载均衡器主机的延迟。
  • ALPHA
  • 直方图
serviceaccount_invalid_legacy_auto_token_uses_total
已使用的累计无效自动生成旧令牌。
  • ALPHA
  • Counter
serviceaccount_legacy_auto_token_uses_total
已使用的累计自动生成旧令牌。
  • ALPHA
  • Counter
serviceaccount_legacy_manual_token_uses_total
已使用的累计手动创建旧令牌。
  • ALPHA
  • Counter
serviceaccount_legacy_tokens_total
已使用的累计旧服务账户令牌。
  • ALPHA
  • Counter
serviceaccount_stale_tokens_total
已使用的累计过时投射服务账户令牌。
  • ALPHA
  • Counter
serviceaccount_valid_tokens_total
已使用的累计有效投射服务账户令牌。
  • ALPHA
  • Counter
storage_count_attachable_volumes_in_use
衡量正在使用的卷数量。
  • ALPHA
  • Custom
  • nodevolume_plugin
storage_operation_duration_seconds
存储操作持续时间。
  • ALPHA
  • 直方图
  • migratedoperation_namestatusvolume_plugin
taint_eviction_controller_pod_deletion_duration_seconds
污点效应激活 Pod 与通过 TaintEvictionController 删除 Pod 之间的延迟(秒)。
  • ALPHA
  • 直方图
taint_eviction_controller_pod_deletions_total
TaintEvictionController 启动以来删除的 Pod 总数。
  • ALPHA
  • Counter
ttl_after_finished_controller_job_deletion_duration_seconds
作业符合删除条件后到被删除所需的时间。
  • ALPHA
  • 直方图
volume_manager_selinux_container_errors_total
kubelet 无法计算容器 SELinux 上下文时的错误数量。kubelet 无法启动此类 Pod 并会重试,因此此指标的值可能不代表实际容器数量。
  • ALPHA
  • Gauge
  • access_mode
volume_manager_selinux_container_warnings_total
kubelet 无法计算容器 SELinux 上下文但被忽略的错误数量。当 SELinuxMountReadWriteOncePod 功能扩展到所有卷访问模式时,这些错误将成为实际错误。
  • ALPHA
  • Gauge
  • access_mode
volume_manager_selinux_pod_context_mismatch_errors_total
当 Pod 为使用相同卷的容器定义不同 SELinux 上下文时发生的错误数量。kubelet 无法启动此类 Pod 并会重试,因此此指标的值可能不代表实际 Pod 数量。
  • ALPHA
  • Gauge
  • access_mode
volume_manager_selinux_pod_context_mismatch_warnings_total
当 Pod 为使用相同卷的容器定义不同 SELinux 上下文时发生的错误数量。这些错误尚未成为实际错误,但当 SELinuxMountReadWriteOncePod 功能扩展到所有卷访问模式时,它们将成为实际错误。
  • ALPHA
  • Gauge
  • access_mode
volume_manager_selinux_volume_context_mismatch_errors_total
当 Pod 使用的卷已以与 Pod 所需不同的 SELinux 上下文挂载时发生的错误数量。kubelet 无法启动此类 Pod 并会重试,因此此指标的值可能不代表实际 Pod 数量。
  • ALPHA
  • Gauge
  • access_modevolume_plugin
volume_manager_selinux_volume_context_mismatch_warnings_total
当 Pod 使用的卷已以与 Pod 所需不同的 SELinux 上下文挂载时发生的错误数量。这些错误尚未成为实际错误,但当 SELinuxMountReadWriteOncePod 功能扩展到所有卷访问模式时,它们将成为实际错误。
  • ALPHA
  • Gauge
  • access_modevolume_plugin
volume_manager_selinux_volumes_admitted_total
SELinux 上下文正常并将被使用 mount -o context 选项挂载的卷数量。
  • ALPHA
  • Gauge
  • access_modevolume_plugin
volume_manager_total_volumes
卷管理器中的卷数量。
  • ALPHA
  • Custom
  • plugin_namestate
volume_operation_total_errors
卷操作错误总数。
  • ALPHA
  • Counter
  • operation_nameplugin_name
volume_operation_total_seconds
存储操作端到端持续时间(秒)。
  • ALPHA
  • 直方图
  • operation_nameplugin_name
watch_cache_capacity
按资源类型划分的 watch 缓存总容量。
  • ALPHA
  • Gauge
  • resource
watch_cache_capacity_decrease_total
按资源类型划分的 watch 缓存容量减少事件总数。
  • ALPHA
  • Counter
  • resource
watch_cache_capacity_increase_total
按资源类型划分的 watch 缓存容量增加事件总数。
  • ALPHA
  • Counter
  • resource
workqueue_adds_total
workqueue 处理的总添加次数。
  • ALPHA
  • Counter
  • name
workqueue_depth
workqueue 当前深度。
  • ALPHA
  • Gauge
  • name
workqueue_longest_running_processor_seconds
workqueue 最长运行处理器的运行时间(秒)。
  • ALPHA
  • Gauge
  • name
workqueue_queue_duration_seconds
项目在 workqueue 中停留直到被请求的时间(秒)。
  • ALPHA
  • 直方图
  • name
workqueue_retries_total
workqueue 处理的总重试次数。
  • ALPHA
  • Counter
  • name
workqueue_unfinished_work_seconds
已完成的正在进行中且未被 work_duration 观测到的工作时间(秒)。值较大表示线程卡住。可以通过观察此值的增长率来推断卡住的线程数量。
  • ALPHA
  • Gauge
  • name
workqueue_work_duration_seconds
处理 workqueue 中项目所需的时间(秒)。
  • ALPHA
  • 直方图
  • name

本页面是自动生成的。

如果您打算报告此页面的问题,请在问题描述中提及该页面是自动生成的。修复可能需要在 Kubernetes 项目的其他地方进行。

最后修改于太平洋标准时间 2024 年 11 月 11 日晚上 9:01:更新 v1.32 版本的指标参考 (5144bd5ce4)