Kubernetes 指标参考

Kubernetes 组件导出的指标数据的详细信息。

指标 (v1.34)

本页详细介绍了不同 Kubernetes 组件导出的指标。您可以使用 HTTP scraping 的方式查询这些组件的指标端点,并以 Prometheus 格式获取当前的指标数据。

稳定 Kubernetes 指标列表

稳定指标遵守严格的 API 合约,在整个生命周期中,稳定指标的标签不能被添加或移除。

apiserver_admission_controller_admission_duration_seconds
Admission controller 延迟直方图(秒),按名称标识,并按每个操作、API 资源和类型(validate 或 admit)进行分解。
  • STABLE
  • Histogram
  • nameoperationrejectedtype
apiserver_admission_step_admission_duration_seconds
Admission 子步骤延迟直方图(秒),按每个操作、API 资源和步骤类型(validate 或 admit)进行分解。
  • STABLE
  • Histogram
  • operationrejectedtype
apiserver_admission_webhook_admission_duration_seconds
Admission webhook 延迟直方图(秒),按名称标识,并按每个操作、API 资源和类型(validate 或 admit)进行分解。
  • STABLE
  • Histogram
  • nameoperationrejectedtype
apiserver_current_inflight_requests
上秒内此 apiserver 每个请求类型的当前使用中的 inflight 请求限制的最大数量。
  • STABLE
  • Gauge
  • request_kind
apiserver_longrunning_requests
所有活动的长期 apiserver 请求的 Gauge,按 verb、group、version、resource、scope 和 component 进行分解。并非所有请求都以此方式跟踪。
  • STABLE
  • Gauge
  • componentgroupresourcescopesubresourceverbversion
apiserver_request_duration_seconds
每个 verb、dry run 值、group、version、resource、subresource、scope 和 component 的响应延迟分布(秒)。
  • STABLE
  • Histogram
  • componentdry_rungroupresourcescopesubresourceverbversion
apiserver_request_total
每个 verb、dry run 值、group、version、resource、scope、component 和 HTTP 响应代码的 apiserver 请求计数器。
  • STABLE
  • Counter
  • codecomponentdry_rungroupresourcescopesubresourceverbversion
apiserver_requested_deprecated_apis
已请求的已弃用 API 的 Gauge,按 API group、version、resource、subresource 和 removed_release 进行分解。
  • STABLE
  • Gauge
  • groupremoved_releaseresourcesubresourceversion
apiserver_response_sizes
每个 group、version、verb、resource、subresource、scope 和 component 的响应大小分布(字节)。
  • STABLE
  • Histogram
  • componentgroupresourcescopesubresourceverbversion
apiserver_storage_objects
上次检查时存储的对象数量,按 kind 分类。如果出现获取错误,值为 -1。
  • STABLE
  • Gauge
  • 资源
apiserver_storage_size_bytes
存储数据库文件物理分配的大小(字节)。
  • STABLE
  • Custom
  • storage_cluster_id
container_cpu_usage_seconds_total
容器消耗的总 CPU 时间(核心秒)。
  • STABLE
  • Custom
  • containerpodnamespace
container_memory_working_set_bytes
容器的当前工作集(字节)。
  • STABLE
  • Custom
  • containerpodnamespace
container_start_time_seconds
容器启动时间(自 Unix 纪元以来,单位秒)。
  • STABLE
  • Custom
  • containerpodnamespace
cronjob_controller_job_creation_skew_duration_seconds
cronjob 计划运行时间与相应 job 创建时间之间的间隔(秒)。
  • STABLE
  • Histogram
job_controller_job_pods_finished_total
已完全跟踪的完成的 Pod 数量。
  • STABLE
  • Counter
  • completion_moderesult
job_controller_job_sync_duration_seconds
同步 job 所花费的时间(秒)。
  • STABLE
  • Histogram
  • actioncompletion_moderesult
job_controller_job_syncs_total
job 同步次数。
  • STABLE
  • Counter
  • actioncompletion_moderesult
job_controller_jobs_finished_total
完成的 job 数量。
  • STABLE
  • Counter
  • completion_modereasonresult
kube_pod_resource_limit
集群中工作负载的资源限制,按 Pod 分解。显示调度器和 kubelet 为每个 Pod 期望的资源使用量,以及资源单位(如果存在)。
  • STABLE
  • Custom
  • namespacepodnodeschedulerpriorityresourceunit
kube_pod_resource_request
集群中工作负载的资源请求,按 Pod 分解。显示调度器和 kubelet 为每个 Pod 期望的资源使用量,以及资源单位(如果存在)。
  • STABLE
  • Custom
  • namespacepodnodeschedulerpriorityresourceunit
kubernetes_healthcheck
此指标记录单次健康检查的结果。
  • STABLE
  • Gauge
  • nametype
kubernetes_healthchecks_total
此指标记录所有健康检查的结果。
  • STABLE
  • Counter
  • namestatustype
node_collector_evictions_total
自 NodeController 当前实例启动以来发生的 Node 驱逐次数。
  • STABLE
  • Counter
  • zone
node_cpu_usage_seconds_total
节点消耗的总 CPU 时间(核心秒)。
  • STABLE
  • Custom
node_memory_working_set_bytes
节点的当前工作集(字节)。
  • STABLE
  • Custom
pod_cpu_usage_seconds_total
Pod 消耗的总 CPU 时间(核心秒)。
  • STABLE
  • Custom
  • podnamespace
pod_memory_working_set_bytes
Pod 的当前工作集(字节)。
  • STABLE
  • Custom
  • podnamespace
resource_scrape_error
获取容器指标时出错为 1,否则为 0。
  • STABLE
  • Custom
scheduler_framework_extension_point_duration_seconds
运行特定扩展点的所有插件的延迟(秒)。
  • STABLE
  • Histogram
  • extension_pointprofilestatus
scheduler_pending_pods
待定 Pod 的数量,按队列类型划分。“active”表示 activeQ 中的 Pod 数量;“backoff”表示 backoffQ 中的 Pod 数量;“unschedulable”表示调度器尝试调度但失败的 unschedulablePods 中的 Pod 数量;“gated”表示调度器从未尝试调度且被阻止的 unschedulable Pod 的数量。
  • STABLE
  • Gauge
  • queue
scheduler_pod_scheduling_attempts
成功调度 Pod 的尝试次数。
  • STABLE
  • Histogram
scheduler_preemption_attempts_total
集群中到目前为止的总抢占尝试次数。
  • STABLE
  • Counter
scheduler_preemption_victims
选定的抢占受害者数量。
  • STABLE
  • Histogram
scheduler_queue_incoming_pods_total
添加到调度队列的 Pod 数量,按事件和队列类型划分。
  • STABLE
  • Counter
  • eventqueue
scheduler_schedule_attempts_total
调度 Pod 的尝试次数,按结果划分。“unschedulable”表示 Pod 无法调度,“error”表示调度器内部问题。
  • STABLE
  • Counter
  • profileresult
scheduler_scheduling_attempt_duration_seconds
调度尝试延迟(秒)(调度算法 + 绑定)。
  • STABLE
  • Histogram
  • profileresult

Beta Kubernetes 指标列表

Beta 指标的 API 合约比其稳定版本更宽松。在 Beta 指标的生命周期中,不能删除标签,但可以添加标签。这保证了 Beta 指标能够兼容现有的仪表板和告警,同时允许未来的修改。

apiserver_cel_compilation_duration_seconds
CEL 编译时间(秒)。
  • BETA
  • Histogram
apiserver_cel_evaluation_duration_seconds
CEL 评估时间(秒)。
  • BETA
  • Histogram
apiserver_flowcontrol_current_executing_requests
API 优先级和公平性子系统中处于初始(对于 WATCH)或任何(对于非 WATCH)执行阶段的请求数量。
  • BETA
  • Gauge
  • flow_schemapriority_level
apiserver_flowcontrol_current_executing_seats
API 优先级和公平性子系统中当前正在执行的(对于 WATCH 为初始阶段,否则为任何阶段)请求占用的并发量(seat 数量)。
  • BETA
  • Gauge
  • flow_schemapriority_level
apiserver_flowcontrol_current_inqueue_requests
API 优先级和公平性子系统中当前在队列中等待的请求数量。
  • BETA
  • Gauge
  • flow_schemapriority_level
apiserver_flowcontrol_dispatched_requests_total
API 优先级和公平性子系统执行的请求数量。
  • BETA
  • Counter
  • flow_schemapriority_level
apiserver_flowcontrol_nominal_limit_seats
为每个优先级级别配置的名义执行 seat 数量。
  • BETA
  • Gauge
  • priority_level
apiserver_flowcontrol_rejected_requests_total
API 优先级和公平性子系统拒绝的请求数量。
  • BETA
  • Counter
  • flow_schemapriority_levelreason
apiserver_flowcontrol_request_wait_duration_seconds
请求在队列中等待的时间。
  • BETA
  • Histogram
  • executeflow_schemapriority_level
apiserver_validating_admission_policy_check_duration_seconds
验证 admission 的单个验证表达式的延迟(秒),由策略标记,并包含绑定的和采取的执行操作。
  • BETA
  • Histogram
  • enforcement_actionerror_typepolicypolicy_binding
apiserver_validating_admission_policy_check_total
验证 admission 策略检查总数,由策略标记,并由绑定和执行的操作进一步标识。
  • BETA
  • Counter
  • enforcement_actionerror_typepolicypolicy_binding
apiserver_validation_declarative_validation_mismatch_total
核心类型的声明性验证结果与手工验证结果不匹配的次数。
  • BETA
  • Counter
apiserver_validation_declarative_validation_panic_total
声明性验证在验证期间恐慌的次数。
  • BETA
  • Counter
disabled_metrics_total
已禁用指标的数量。
  • BETA
  • Counter
hidden_metrics_total
隐藏指标的数量。
  • BETA
  • Counter
kubernetes_feature_enabled
此指标记录有关 k8s 功能的阶段和启用情况的数据。
  • BETA
  • Gauge
  • namestage
prober_probe_total
容器的存活、就绪或启动探测的总次数,按结果划分。
  • BETA
  • Counter
  • containernamespacepodpod_uidprobe_typeresult
registered_metrics_total
注册指标的数量,按稳定性级别和弃用版本进行分解。
  • BETA
  • Counter
  • deprecated_versionstability_level
scheduler_pod_scheduling_sli_duration_seconds
Pod 调度完成的端到端延迟,从 Pod 进入调度队列开始,可能涉及多次调度尝试。
  • BETA
  • Histogram
  • attempts

Alpha Kubernetes 指标列表

Alpha 指标没有任何 API 保证。使用这些指标风险自负,Kubernetes 的后续版本可能会完全删除这些指标,或修改 API,从而破坏现有的仪表板和告警。

aggregator_discovery_aggregation_count_total
发现被聚合的次数计数器。
  • ALPHA
  • Counter
aggregator_openapi_v2_regeneration_count
OpenAPI v2 spec 重生计数器,按导致此操作的 APIService 名称和原因进行分解。
  • ALPHA
  • Counter
  • apiservicereason
aggregator_openapi_v2_regeneration_duration
OpenAPI v2 spec 重生持续时间(秒)的 Gauge。
  • ALPHA
  • Gauge
  • reason
aggregator_unavailable_apiservice
标记为不可用的 APIServices 的 Gauge,按 APIService 名称进行分解。
  • ALPHA
  • Custom
  • name
aggregator_unavailable_apiservice_total
标记为不可用的 APIServices 的计数器,按 APIService 名称和原因进行分解。
  • ALPHA
  • Counter
  • namereason
apiextensions_apiserver_validation_ratcheting_seconds
在 UPDATE 操作期间,用于 CRDValidationRatcheting 的新旧对象比较时间(秒)。
  • ALPHA
  • Histogram
apiextensions_openapi_v2_regeneration_count
OpenAPI v2 spec 重生计数器,按导致此操作的 CRD 名称和原因进行分解。
  • ALPHA
  • Counter
  • crdreason
apiextensions_openapi_v3_regeneration_count
OpenAPI v3 spec 重生计数器,按 group、version、导致此操作的 CRD 和原因进行分解。
  • ALPHA
  • Counter
  • crdgroupreasonversion
apiserver_admission_match_condition_evaluation_errors_total
Admission 匹配条件评估错误计数,按包含匹配条件的资源名称标识,并按包含 matchConditions(webhook 或 policy)的每个 kind、操作和 admission 类型(validate 或 admit)进行分解。
  • ALPHA
  • Counter
  • kindnameoperationtype
apiserver_admission_match_condition_evaluation_seconds
Admission 匹配条件评估时间(秒),按名称标识,并按包含 matchConditions(webhook 或 policy)的每个 kind、操作和类型(validate 或 admit)进行分解。
  • ALPHA
  • Histogram
  • kindnameoperationtype
apiserver_admission_match_condition_exclusions_total
Admission 匹配条件评估排除计数,按包含匹配条件的资源名称标识,并按包含 matchConditions(webhook 或 policy)的每个 kind、操作和 admission 类型(validate 或 admit)进行分解。
  • ALPHA
  • Counter
  • kindnameoperationtype
apiserver_admission_step_admission_duration_seconds_summary
Admission 子步骤延迟摘要(秒),按每个操作、API 资源和步骤类型(validate 或 admit)进行分解。
  • ALPHA
  • 总结
  • operationrejectedtype
apiserver_admission_webhook_fail_open_count
Admission webhook 容错计数,按名称标识,并按每个 admission 类型(validating 或 admit)进行分解。
  • ALPHA
  • Counter
  • nametype
apiserver_admission_webhook_rejection_count
Admission webhook 拒绝计数,按名称标识,并按每个 admission 类型(validating 或 admit)和操作进行分解。其他标签指定错误类型(calling_webhook_error 或 apiserver_internal_error,如果发生错误;否则为 no_error),以及可选的非零拒绝代码(如果 webhook 使用 HTTP 状态码拒绝请求,当代码大于等于 400 时,apiserver 将接受)。代码大于 600 会截断为 600,以保持指标的基数有限。
  • ALPHA
  • Counter
  • error_typenameoperationrejection_codetype
apiserver_admission_webhook_request_total
Admission webhook 请求总数,按名称标识,并按每个 admission 类型(validating 或 admit)和操作进行分解。其他标签指定请求是否被拒绝以及 HTTP 状态码。代码大于 600 会截断为 600,以保持指标的基数有限。
  • ALPHA
  • Counter
  • codenameoperationrejectedtype
apiserver_audit_error_total
未能正确审计的审计事件计数器。Plugin 标识受错误影响的插件。
  • ALPHA
  • Counter
  • plugin
apiserver_audit_event_total
生成的审计事件数,发送到审计后端。
  • ALPHA
  • Counter
apiserver_audit_level_total
审计事件的策略级别计数器(每个请求 1 个)。
  • ALPHA
  • Counter
  • level
apiserver_audit_requests_rejected_total
由于审计日志后端出错而拒绝的 apiserver 请求计数器。
  • ALPHA
  • Counter
apiserver_authentication_config_controller_automatic_reload_last_timestamp_seconds
身份验证配置最后一次自动重载的时间戳,按状态和 apiserver 身份进行分解。
  • ALPHA
  • Gauge
  • apiserver_id_hashstatus
apiserver_authentication_config_controller_automatic_reloads_total
身份验证配置自动重载总次数,按状态和 apiserver 身份进行分解。
  • ALPHA
  • Counter
  • apiserver_id_hashstatus
apiserver_authentication_jwt_authenticator_latency_seconds
JWT 身份验证操作的延迟(秒)。这是仅在缓存未命中时(即 token 不在缓存中)花费的身份验证时间。
  • ALPHA
  • Histogram
  • jwt_issuer_hashresult
apiserver_authorization_config_controller_automatic_reload_last_timestamp_seconds
授权配置最后一次自动重载的时间戳,按状态和 apiserver 身份进行分解。
  • ALPHA
  • Gauge
  • apiserver_id_hashstatus
apiserver_authorization_config_controller_automatic_reloads_total
授权配置自动重载总次数,按状态和 apiserver 身份进行分解。
  • ALPHA
  • Counter
  • apiserver_id_hashstatus
apiserver_authorization_decisions_total
授权器做出的终端决策总数,按授权器类型、名称和决策进行分解。
  • ALPHA
  • Counter
  • decisionnametype
apiserver_authorization_match_condition_evaluation_errors_total
授权 webhook 遇到匹配条件错误时的总错误数,按授权器类型和名称进行分解。
  • ALPHA
  • Counter
  • nametype
apiserver_authorization_match_condition_evaluation_seconds
Authorization 匹配条件评估时间(秒),按授权器类型和名称进行分解。
  • ALPHA
  • Histogram
  • nametype
apiserver_authorization_match_condition_exclusions_total
当授权 webhook 因匹配条件排除而被跳过时的总排除数。
  • ALPHA
  • Counter
  • nametype
apiserver_authorization_webhook_duration_seconds
请求延迟(秒)。
  • ALPHA
  • Histogram
  • nameresult
apiserver_authorization_webhook_evaluations_fail_open_total
由于 webhook 超时或错误导致的 NoOpinion 结果。
  • ALPHA
  • Counter
  • nameresult
apiserver_authorization_webhook_evaluations_total
到授权 webhook 的往返次数。
  • ALPHA
  • Counter
  • nameresult
apiserver_cache_list_fetched_objects_total
在服务 LIST 请求的过程中,从 watch cache 读取的对象数量。
  • ALPHA
  • Counter
  • indexresource_prefix
apiserver_cache_list_returned_objects_total
从 watch cache 返回的 LIST 请求的对象数量。
  • ALPHA
  • Counter
  • resource_prefix
apiserver_cache_list_total
从 watch cache 服务的 LIST 请求数量。
  • ALPHA
  • Counter
  • indexresource_prefix
apiserver_certificates_registry_csr_honored_duration_total
已颁发的 CSR 的总数,其请求的持续时间得到了满足,按 signer 划分(仅特定标识 kubernetes.io signer 名称)。
  • ALPHA
  • Counter
  • signerName
apiserver_certificates_registry_csr_requested_duration_total
已颁发的 CSR 的总数,其请求的持续时间得到了满足,按 signer 划分(仅特定标识 kubernetes.io signer 名称)。
  • ALPHA
  • Counter
  • signerName
apiserver_client_certificate_expiration_seconds
用于身份验证请求的证书剩余有效期的分布。
  • ALPHA
  • Histogram
apiserver_clusterip_repair_ip_errors_total
由修复循环检测到的 clusterip 错误数量,按错误类型分解:leak、repair、full、outOfRange、duplicate、unknown、invalid。
  • ALPHA
  • Counter
  • type
apiserver_clusterip_repair_reconcile_errors_total
clusterip 修复协调循环中的协调失败次数。
  • ALPHA
  • Counter
apiserver_conversion_webhook_duration_seconds
转换 webhook 请求延迟(秒)。
  • ALPHA
  • Histogram
  • failure_typeresult
apiserver_conversion_webhook_request_total
成功/失败的转换 webhook 请求计数器,以及失败的错误类型。
  • ALPHA
  • Counter
  • failure_typeresult
apiserver_crd_conversion_webhook_duration_seconds
CRD webhook 转换持续时间(秒)。
  • ALPHA
  • Histogram
  • crd_namefrom_versionsucceededto_version
apiserver_current_inqueue_requests
上秒内此 apiserver 每个请求类型的排队请求的最大数量。
  • ALPHA
  • Gauge
  • request_kind
apiserver_delegated_authn_request_duration_seconds
请求延迟(秒)。按状态码分解。
  • ALPHA
  • Histogram
  • code
apiserver_delegated_authn_request_total
按状态码分区的 HTTP 请求数量。
  • ALPHA
  • Counter
  • code
apiserver_delegated_authz_request_duration_seconds
请求延迟(秒)。按状态码分解。
  • ALPHA
  • Histogram
  • code
apiserver_delegated_authz_request_total
按状态码分区的 HTTP 请求数量。
  • ALPHA
  • Counter
  • code
apiserver_egress_dialer_dial_duration_seconds
拨号延迟直方图(秒),按协议(http-connect 或 grpc)和传输(tcp 或 uds)标记。
  • ALPHA
  • Histogram
  • protocoltransport
apiserver_egress_dialer_dial_failure_count
拨号失败计数,按协议(http-connect 或 grpc)、传输(tcp 或 uds)和阶段(connect 或 proxy)标记。阶段指示拨号失败的阶段。
  • ALPHA
  • Counter
  • protocolstagetransport
apiserver_egress_dialer_dial_start_total
拨号开始次数,按协议(http-connect 或 grpc)和传输(tcp 或 uds)标记。
  • ALPHA
  • Counter
  • protocoltransport
apiserver_encryption_config_controller_automatic_reload_failures_total
加密配置自动重载失败总次数,按 apiserver 身份进行分解。
  • ALPHA
  • Counter
  • apiserver_id_hash
  • 1.30.0
apiserver_encryption_config_controller_automatic_reload_last_timestamp_seconds
加密配置最后一次成功或失败的自动重载的时间戳,按 apiserver 身份进行分解。
  • ALPHA
  • Gauge
  • apiserver_id_hashstatus
apiserver_encryption_config_controller_automatic_reload_success_total
加密配置自动重载成功总次数,按 apiserver 身份进行分解。
  • ALPHA
  • Counter
  • apiserver_id_hash
  • 1.30.0
apiserver_encryption_config_controller_automatic_reloads_total
加密配置重载成功与失败的总次数,按 apiserver 身份进行分解。
  • ALPHA
  • Counter
  • apiserver_id_hashstatus
apiserver_envelope_encryption_dek_cache_fill_percent
缓存 DEK 占用的缓存槽百分比。
  • ALPHA
  • Gauge
apiserver_envelope_encryption_dek_cache_inter_arrival_time_seconds
转换请求的到达间隔时间(秒)。
  • ALPHA
  • Histogram
  • transformation_type
apiserver_envelope_encryption_dek_source_cache_size
数据加密密钥(DEK)源缓存中的记录数。重启时,此值近似服务器将调用 KMS 插件的解密 RPC 调用次数。
  • ALPHA
  • Gauge
  • provider_name
apiserver_envelope_encryption_invalid_key_id_from_status_total
从 Status RPC 调用返回无效 keyID 的次数,按错误进行分解。
  • ALPHA
  • Counter
  • errorprovider_name
apiserver_envelope_encryption_key_id_hash_last_timestamp_seconds
使用 keyID 的最后一次时间(秒)。
  • ALPHA
  • Gauge
  • apiserver_id_hashkey_id_hashprovider_nametransformation_type
apiserver_envelope_encryption_key_id_hash_status_last_timestamp_seconds
从 Status RPC 调用返回 keyID 的最后一次时间(秒)。
  • ALPHA
  • Gauge
  • apiserver_id_hashkey_id_hashprovider_name
apiserver_envelope_encryption_key_id_hash_total
使用 keyID 的次数,按转换类型、提供商和 apiserver 身份进行分解。
  • ALPHA
  • Counter
  • apiserver_id_hashkey_id_hashprovider_nametransformation_type
apiserver_envelope_encryption_kms_operations_latency_seconds
KMS 操作持续时间,按 gRPC 错误码状态总数。
  • ALPHA
  • Histogram
  • grpc_status_codemethod_nameprovider_name
apiserver_externaljwt_fetch_keys_data_timestamp
外部签名者返回的最后一个成功 FetchKeys data_timestamp 值的 Unix 时间戳(秒)。
  • ALPHA
  • Gauge
apiserver_externaljwt_fetch_keys_request_total
同步受支持 JWK 的总尝试次数。
  • ALPHA
  • Counter
  • code
apiserver_externaljwt_fetch_keys_success_timestamp
最后一个成功 FetchKeys 请求的 Unix 时间戳(秒)。
  • ALPHA
  • Gauge
apiserver_externaljwt_request_duration_seconds
对 external-jwt-signer 的调用请求持续时间。
  • ALPHA
  • Histogram
  • codemethod
apiserver_externaljwt_sign_request_total
签名 JWT 的总尝试次数。
  • ALPHA
  • Counter
  • code
apiserver_flowcontrol_current_inqueue_seats
API 优先级和公平性子系统中队列中当前等待的 seat 数量。
  • ALPHA
  • Gauge
  • flow_schemapriority_level
apiserver_flowcontrol_current_limit_seats
每个优先级级别可用的当前派生的执行 seat 数量。
  • ALPHA
  • Gauge
  • priority_level
apiserver_flowcontrol_current_r
R(最后更改时间)。
  • ALPHA
  • Gauge
  • priority_level
apiserver_flowcontrol_demand_seats
每纳秒结束时的观察值:(每个优先级级别可用的 seat 数量)/(该级别的名义 seat 数量)。
  • ALPHA
  • TimingRatioHistogram
  • priority_level
apiserver_flowcontrol_demand_seats_average
过去调整期间 demand_seats 的时间加权平均值。
  • ALPHA
  • Gauge
  • priority_level
apiserver_flowcontrol_demand_seats_high_watermark
过去调整期间 demand_seats 的高水位线。
  • ALPHA
  • Gauge
  • priority_level
apiserver_flowcontrol_demand_seats_smoothed
平滑的 seat 需求。
  • ALPHA
  • Gauge
  • priority_level
apiserver_flowcontrol_demand_seats_stdev
过去调整期间 demand_seats 的时间加权标准差。
  • ALPHA
  • Gauge
  • priority_level
apiserver_flowcontrol_dispatch_r
R(最后分派时间)。
  • ALPHA
  • Gauge
  • priority_level
apiserver_flowcontrol_epoch_advance_total
队列集进度计向前跳跃的次数。
  • ALPHA
  • Counter
  • priority_levelsuccess
apiserver_flowcontrol_latest_s
S(最近分派的请求)。
  • ALPHA
  • Gauge
  • priority_level
apiserver_flowcontrol_lower_limit_seats
每个优先级级别可用的执行 seat 数量的配置下限。
  • ALPHA
  • Gauge
  • priority_level
apiserver_flowcontrol_next_discounted_s_bounds
队列中 S(最旧等待请求)- 估计的在制品(work in progress)的最小值和最大值。
  • ALPHA
  • Gauge
  • boundpriority_level
apiserver_flowcontrol_next_s_bounds
队列中 S(最旧等待请求)的最小值和最大值。
  • ALPHA
  • Gauge
  • boundpriority_level
apiserver_flowcontrol_priority_level_request_utilization
每纳秒结束时的观察值:等待或处于任何执行阶段的请求数量(仅对于 WATCH,为初始阶段)。
  • ALPHA
  • TimingRatioHistogram
  • phasepriority_level
apiserver_flowcontrol_priority_level_seat_utilization
每纳秒结束时的观察值:用于任何执行阶段的 seat 利用率(仅对于 WATCH,为初始阶段)。
  • ALPHA
  • TimingRatioHistogram
  • priority_level
  • phase:executing
apiserver_flowcontrol_read_vs_write_current_requests
每纳秒结束时的观察值:等待或处于常规执行阶段的请求数量(占相关限制的比例)。
  • ALPHA
  • TimingRatioHistogram
  • phaserequest_kind
apiserver_flowcontrol_request_concurrency_in_use
API 优先级和公平性子系统中当前正在执行的(对于 WATCH 为初始阶段,否则为任何阶段)请求占用的并发量(seat 数量)。
  • ALPHA
  • Gauge
  • flow_schemapriority_level
  • 1.31.0
apiserver_flowcontrol_request_concurrency_limit
为每个优先级级别配置的名义执行 seat 数量。
  • ALPHA
  • Gauge
  • priority_level
  • 1.30.0
apiserver_flowcontrol_request_dispatch_no_accommodation_total
由于缺乏可用 seat 而导致分派尝试不成功的次数。
  • ALPHA
  • Counter
  • flow_schemapriority_level
apiserver_flowcontrol_request_execution_seconds
API 优先级和公平性子系统中请求执行的初始阶段(对于 WATCH)或任何阶段(对于非 WATCH)的持续时间。
  • ALPHA
  • Histogram
  • flow_schemapriority_leveltype
apiserver_flowcontrol_request_queue_length_after_enqueue
API 优先级和公平性子系统中队列的长度,在请求入队后可见。
  • ALPHA
  • Histogram
  • flow_schemapriority_level
apiserver_flowcontrol_seat_fair_frac
为每个可用的优先级级别分配服务器并发量的公平分数。
  • ALPHA
  • Gauge
apiserver_flowcontrol_target_seats
Seat 分配目标。
  • ALPHA
  • Gauge
  • priority_level
apiserver_flowcontrol_upper_limit_seats
每个优先级级别可用的执行 seat 数量的配置上限。
  • ALPHA
  • Gauge
  • priority_level
apiserver_flowcontrol_watch_count_samples
API 优先级和公平性系统中变异请求的监视器数量。
  • ALPHA
  • Histogram
  • flow_schemapriority_level
apiserver_flowcontrol_work_estimated_seats
API 优先级和公平性系统中与请求关联的估计 seat 数量(初始 seat 和最终 seat 的最大值)。
  • ALPHA
  • Histogram
  • flow_schemapriority_level
apiserver_init_events_total
按资源类型分解的 watch cache 中处理的 init 事件计数器。
  • ALPHA
  • Counter
  • 资源
apiserver_kube_aggregator_x509_insecure_sha1_total
计算连接到具有不安全 SHA1 签名的服务器证书的服务器的请求数量,或因不安全 SHA1 签名导致的连接失败数量(二者之一,取决于运行环境)。
  • ALPHA
  • Counter
apiserver_kube_aggregator_x509_missing_san_total
计算连接到缺少 SAN 扩展的服务器证书的服务器的请求数量,或因缺少 x509 证书 SAN 扩展导致的连接失败数量(二者之一,取决于运行环境)。
  • ALPHA
  • Counter
apiserver_nodeport_repair_port_errors_total
由修复循环检测到的端口错误数量,按错误类型分解:leak、repair、full、outOfRange、duplicate、unknown。
  • ALPHA
  • Counter
  • type
apiserver_nodeport_repair_reconcile_errors_total
nodeport 修复协调循环中的协调失败次数。
  • ALPHA
  • Counter
apiserver_request_aborts_total
apiserver 中止的请求数量,可能由于超时,按 group、version、verb、resource、subresource 和 scope 分解。
  • ALPHA
  • Counter
  • groupresourcescopesubresourceverbversion
apiserver_request_body_size_bytes
apiserver 请求体大小(字节),按资源和 verb 分解。
  • ALPHA
  • Histogram
  • resourceverb
apiserver_request_filter_duration_seconds
请求过滤器延迟分布(秒),按过滤器类型。
  • ALPHA
  • Histogram
  • filter
apiserver_request_post_timeout_total
跟踪请求处理器在 apiserver 超时后活动。
  • ALPHA
  • Counter
  • sourcestatus
apiserver_request_sli_duration_seconds
响应延迟分布(不包括 webhook 持续时间和优先级与公平性队列等待时间,单位秒),按 verb、group、version、resource、subresource、scope 和 component 分解。
  • ALPHA
  • Histogram
  • componentgroupresourcescopesubresourceverbversion
apiserver_request_slo_duration_seconds
响应延迟分布(不包括 webhook 持续时间和优先级与公平性队列等待时间,单位秒),按 verb、group、version、resource、subresource、scope 和 component 分解。
  • ALPHA
  • Histogram
  • componentgroupresourcescopesubresourceverbversion
  • 1.27.0
apiserver_request_terminations_total
apiserver 自我防御终止的请求数量。
  • ALPHA
  • Counter
  • codecomponentgroupresourcescopesubresourceverbversion
apiserver_request_timestamp_comparison_time
UPDATE 或 PATCH 请求中比较旧对象与新对象所需的时间。
  • ALPHA
  • Histogram
  • code_path
apiserver_rerouted_request_total
由于本地 apiserver 无法处理,已代理到对等 kube apiserver 的请求总数。
  • ALPHA
  • Counter
  • code
apiserver_selfrequest_total
apiserver 自请求计数器,按 verb、API 资源和 subresource 分解。
  • ALPHA
  • Counter
  • resourcesubresourceverb
apiserver_storage_data_key_generation_duration_seconds
数据加密密钥(DEK)生成操作的延迟(秒)。
  • ALPHA
  • Histogram
apiserver_storage_data_key_generation_failures_total
数据加密密钥(DEK)生成操作失败的总次数。
  • ALPHA
  • Counter
apiserver_storage_db_total_size_in_bytes
存储数据库文件物理分配的总大小(字节)。
  • ALPHA
  • Gauge
  • endpoint
  • 1.28.0
apiserver_storage_decode_errors_total
存储对象解码错误数,按对象类型分解。
  • ALPHA
  • Counter
  • 资源
apiserver_storage_envelope_transformation_cache_misses_total
访问密钥解密密钥(KEK)时的缓存未命中总次数。
  • ALPHA
  • Counter
apiserver_storage_events_received_total
接收到的 etcd 事件数,按 kind 分解。
  • ALPHA
  • Counter
  • 资源
apiserver_storage_list_evaluated_objects_total
在服务存储中的 LIST 请求期间测试的对象数量。
  • ALPHA
  • Counter
  • 资源
apiserver_storage_list_fetched_objects_total
在服务 LIST 请求期间从存储中读取的对象数量。
  • ALPHA
  • Counter
  • 资源
apiserver_storage_list_returned_objects_total
从存储中返回的 LIST 请求的对象数量。
  • ALPHA
  • Counter
  • 资源
apiserver_storage_list_total
从存储中服务的 LIST 请求数量。
  • ALPHA
  • Counter
  • 资源
apiserver_storage_transformation_duration_seconds
值转换操作的延迟(秒)。
  • ALPHA
  • Histogram
  • transformation_typetransformer_prefix
apiserver_storage_transformation_operations_total
转换总次数。成功的转换状态为 'OK',失败时状态字符串会变化。status、resource 和 transformation_type 字段可用于告警。例如,您可以使用 transformation_type 监控加密/解密失败(例如,from_storage 用于解密,to_storage 用于加密)。此外,这些字段还可用于确保对每个资源应用正确的 transformer。
  • ALPHA
  • Counter
  • resourcestatustransformation_typetransformer_prefix
apiserver_stream_translator_requests_total
由 StreamTranslatorProxy 处理的请求总数,该代理处理流式 RemoteCommand/V5。
  • ALPHA
  • Counter
  • code
apiserver_stream_tunnel_requests_total
由 StreamTunnelProxy 处理的请求总数,该代理处理流式 PortForward/V2。
  • ALPHA
  • Counter
  • code
apiserver_terminated_watchers_total
因无响应而关闭的监视器计数器,按资源类型分解。
  • ALPHA
  • Counter
  • 资源
apiserver_tls_handshake_errors_total
由于“TLS 握手错误”而丢弃的请求数量。
  • ALPHA
  • Counter
apiserver_watch_cache_consistent_read_total
缓存一致性读取计数器。
  • ALPHA
  • Counter
  • fallbackresourcesuccess
apiserver_watch_cache_events_dispatched_total
watch cache 中分派的事件计数器,按资源类型分解。
  • ALPHA
  • Counter
  • 资源
apiserver_watch_cache_events_received_total
watch cache 中接收到的事件计数器,按资源类型分解。
  • ALPHA
  • Counter
  • 资源
apiserver_watch_cache_initializations_total
watch cache 初始化计数器,按资源类型分解。
  • ALPHA
  • Counter
  • 资源
apiserver_watch_cache_read_wait_seconds
等待 watch cache 变新的时间直方图(秒)。
  • ALPHA
  • Histogram
  • 资源
apiserver_watch_cache_resource_version
watch cache 的当前资源版本,按资源类型分解。
  • ALPHA
  • Gauge
  • 资源
apiserver_watch_events_sizes
Watch 事件大小分布(字节)。
  • ALPHA
  • Histogram
  • groupkindversion
apiserver_watch_events_total
发送到 watch 客户端的事件数量。
  • ALPHA
  • Counter
  • groupkindversion
apiserver_watch_list_duration_seconds
watch list 请求响应延迟分布(秒),按 group、version、resource 和 scope 分解。
  • ALPHA
  • Histogram
  • groupresourcescopeversion
apiserver_webhooks_x509_insecure_sha1_total
计算连接到具有不安全 SHA1 签名的服务器证书的服务器的请求数量,或因不安全 SHA1 签名导致的连接失败数量(二者之一,取决于运行环境)。
  • ALPHA
  • Counter
apiserver_webhooks_x509_missing_san_total
计算连接到缺少 SAN 扩展的服务器证书的服务器的请求数量,或因缺少 x509 证书 SAN 扩展导致的连接失败数量(二者之一,取决于运行环境)。
  • ALPHA
  • Counter
attach_detach_controller_attachdetach_controller_forced_detaches
A/D Controller 执行强制分离的次数。
  • ALPHA
  • Counter
  • reason
attachdetach_controller_total_volumes
A/D Controller 中的卷数量。
  • ALPHA
  • Custom
  • plugin_namestate
authenticated_user_requests
已认证请求计数器,按用户名分解。
  • ALPHA
  • Counter
  • username
authentication_attempts
认证尝试计数器。
  • ALPHA
  • Counter
  • result
authentication_duration_seconds
身份验证持续时间(秒),按结果分解。
  • ALPHA
  • Histogram
  • result
authentication_token_cache_active_fetch_count
  • ALPHA
  • Gauge
  • status
authentication_token_cache_fetch_total
  • ALPHA
  • Counter
  • status
authentication_token_cache_request_duration_seconds
  • ALPHA
  • Histogram
  • status
authentication_token_cache_request_total
  • ALPHA
  • Counter
  • status
authorization_attempts_total
授权尝试计数器,按结果分解。结果可以是 'allowed'、'denied'、'no-opinion' 或 'error'。
  • ALPHA
  • Counter
  • result
authorization_duration_seconds
授权持续时间(秒),按结果分解。
  • ALPHA
  • Histogram
  • result
cloud_provider_webhook_request_duration_seconds
请求延迟(秒)。按状态码分解。
  • ALPHA
  • Histogram
  • codewebhook
cloud_provider_webhook_request_total
按状态码分区的 HTTP 请求数量。
  • ALPHA
  • Counter
  • codewebhook
clustertrustbundle_publisher_sync_duration_seconds
同步集群信任捆绑(cluster trust bundle)所花费的时间(秒)。
  • ALPHA
  • Histogram
  • code
clustertrustbundle_publisher_sync_total
集群信任捆绑发布器中发生的同步次数。
  • ALPHA
  • Counter
  • code
container_swap_usage_bytes
容器当前交换使用量(字节)。仅在非 Windows 系统上报告。
  • ALPHA
  • Custom
  • containerpodnamespace
csi_operations_seconds
Container Storage Interface 操作持续时间,按 gRPC 错误码状态总数。
  • ALPHA
  • Histogram
  • driver_namegrpc_status_codemethod_namemigrated
device_taint_eviction_controller_pod_deletion_duration_seconds
设备污点效果激活到 DeviceTaintEvictionController 删除 Pod 之间的时间(秒)。
  • ALPHA
  • Histogram
device_taint_eviction_controller_pod_deletions_total
自启动以来,DeviceTaintEvictionController 删除的 Pod 总数。
  • ALPHA
  • Counter
dra_grpc_operations_duration_seconds
DRA gRPC 操作的持续时间(秒)。
  • ALPHA
  • Histogram
  • driver_namegrpc_status_codemethod_name
dra_operations_duration_seconds
Pod 启动或停止时,处理 Pod 引用的所有 ResourceClaims 的持续时间直方图(秒)。按操作成功与否标识(PrepareResources 或 UnprepareResources)。通过直方图的总数提供失败操作的数量。
  • ALPHA
  • Histogram
  • is_erroroperation_name
endpoint_slice_controller_changes
EndpointSlice 更改次数。
  • ALPHA
  • Counter
  • operation
endpoint_slice_controller_desired_endpoint_slices
完美分配端点后应存在的 EndpointSlice 数量。
  • ALPHA
  • Gauge
endpoint_slice_controller_endpoints_added_per_sync
每次 Service 同步添加的端点数量。
  • ALPHA
  • Histogram
endpoint_slice_controller_endpoints_desired
期望的端点数量。
  • ALPHA
  • Gauge
endpoint_slice_controller_endpoints_removed_per_sync
每次 Service 同步移除的端点数量。
  • ALPHA
  • Histogram
endpoint_slice_controller_endpointslices_changed_per_sync
每次 Service 同步更改的 EndpointSlice 数量。
  • ALPHA
  • Histogram
  • topologytraffic_distribution
endpoint_slice_controller_num_endpoint_slices
EndpointSlice 数量。
  • ALPHA
  • Gauge
endpoint_slice_controller_services_count_by_traffic_distribution
使用特定流量分发的 Service 数量。
  • ALPHA
  • Gauge
  • traffic_distribution
endpoint_slice_controller_syncs
EndpointSlice 同步次数。
  • ALPHA
  • Counter
  • result
endpoint_slice_mirroring_controller_addresses_skipped_per_sync
由于地址无效或超过 MaxEndpointsPerSubset,每次 Endpoints 同步跳过的地址数量。
  • ALPHA
  • Histogram
endpoint_slice_mirroring_controller_changes
EndpointSlice 更改次数。
  • ALPHA
  • Counter
  • operation
endpoint_slice_mirroring_controller_desired_endpoint_slices
完美分配端点后应存在的 EndpointSlice 数量。
  • ALPHA
  • Gauge
endpoint_slice_mirroring_controller_endpoints_added_per_sync
每次 Endpoints 同步添加的端点数量。
  • ALPHA
  • Histogram
endpoint_slice_mirroring_controller_endpoints_desired
期望的端点数量。
  • ALPHA
  • Gauge
endpoint_slice_mirroring_controller_endpoints_removed_per_sync
每次 Endpoints 同步移除的端点数量。
  • ALPHA
  • Histogram
endpoint_slice_mirroring_controller_endpoints_sync_duration
syncEndpoints() 的持续时间(秒)。
  • ALPHA
  • Histogram
endpoint_slice_mirroring_controller_endpoints_updated_per_sync
每次 Endpoints 同步更新的端点数量。
  • ALPHA
  • Histogram
endpoint_slice_mirroring_controller_num_endpoint_slices
EndpointSlice 数量。
  • ALPHA
  • Gauge
ephemeral_volume_controller_create_failures_total
PersistentVolumeClaim 创建请求数量。
  • ALPHA
  • Counter
ephemeral_volume_controller_create_total
PersistentVolumeClaim 创建请求数量。
  • ALPHA
  • Counter
etcd_bookmark_counts
etcd 书签(进度通知事件)数量,按 kind 分解。
  • ALPHA
  • Gauge
  • 资源
etcd_lease_object_counts
附加到单个 etcd lease 的对象数量。
  • ALPHA
  • Histogram
etcd_request_duration_seconds
Etcd 请求延迟(秒),按每个操作和对象类型。
  • ALPHA
  • Histogram
  • operationtype
etcd_request_errors_total
Etcd 失败请求计数,按每个操作和对象类型。
  • ALPHA
  • Counter
  • operationtype
etcd_requests_total
Etcd 请求计数,按每个操作和对象类型。
  • ALPHA
  • Counter
  • operationtype
etcd_version_info
Etcd 服务器的二进制版本。
  • ALPHA
  • Gauge
  • binary_version
field_validation_request_duration_seconds
响应延迟分布(秒),按每个字段验证值。
  • ALPHA
  • Histogram
  • field_validation
force_cleaned_failed_volume_operation_errors_total
在 kubelet 启动期间重建失败后,尝试强制清理的卷的错误数量。
  • ALPHA
  • Counter
force_cleaned_failed_volume_operations_total
在 kubelet 启动期间重建失败后,强制清理的卷的数量。这包括成功和失败的清理。
  • ALPHA
  • Counter
garbagecollector_controller_resources_sync_error_total
垃圾收集器资源同步错误数。
  • ALPHA
  • Counter
horizontal_pod_autoscaler_controller_metric_computation_duration_seconds
HPA 控制器计算一个指标所需的时间(秒)。标签 'action' 应为 'scale_down'、'scale_up' 或 'none'。标签 'error' 应为 'spec'、'internal' 或 'none'。标签 'metric_type' 对应 HPA.spec.metrics[*].type。
  • ALPHA
  • Histogram
  • actionerrormetric_type
horizontal_pod_autoscaler_controller_metric_computation_total
指标计算次数。标签 'action' 应为 'scale_down'、'scale_up' 或 'none'。同时,标签 'error' 应为 'spec'、'internal' 或 'none'。注意,如果在一次协调中发生 spec 和 internal 错误,则第一个发生的错误会报告在 `error` 标签中。
  • ALPHA
  • Counter
  • actionerrormetric_type
horizontal_pod_autoscaler_controller_reconciliation_duration_seconds
HPA 控制器一次协调所需的时间(秒)。标签 'action' 应为 'scale_down'、'scale_up' 或 'none'。同时,标签 'error' 应为 'spec'、'internal' 或 'none'。注意,如果在一次协调中发生 spec 和 internal 错误,则第一个发生的错误会报告在 `error` 标签中。
  • ALPHA
  • Histogram
  • actionerror
horizontal_pod_autoscaler_controller_reconciliations_total
HPA 控制器的协调次数。标签 'action' 应为 'scale_down'、'scale_up' 或 'none'。同时,标签 'error' 应为 'spec'、'internal' 或 'none'。注意,如果在一次协调中发生 spec 和 internal 错误,则第一个发生的错误会报告在 `error` 标签中。
  • ALPHA
  • Counter
  • actionerror
job_controller_job_finished_indexes_total
`完成的索引数量。status 标签的可能值为:"succeeded"、"failed"。backoffLimit 标签的可能值为:"perIndex" 和 "global"。`
  • ALPHA
  • Counter
  • backoffLimitstatus
job_controller_job_pods_creation_total
`Job controller 创建的 Pod 数量,根据 Pod 创建原因进行标记。此指标还区分了使用不同 PodReplacementPolicy 设置创建的 Pod。`reason` 标签的可能值为:`"new", "recreate_terminating_or_failed", "recreate_failed"。`status` 标签的可能值为:`"succeeded", "failed"。`
  • ALPHA
  • Counter
  • reasonstatus
job_controller_jobs_by_external_controller_total
由外部控制器管理的 Job 数量。
  • ALPHA
  • Counter
  • controller_name
job_controller_pod_failures_handled_by_failure_policy_total
`根据匹配规则应用失败策略后,由失败策略处理的失败 Pod 数量。action 标签的可能值对应于失败策略规则动作的可能值,这些值是:`"FailJob", "Ignore" and "Count"。`
  • ALPHA
  • Counter
  • action
job_controller_terminated_pods_tracking_finalizer_total
`已终止的 Pod(phase=Failed|Succeeded)的数量,这些 Pod 具有 finalizer batch.kubernetes.io/job-tracking。event 标签可以是 "add" 或 "delete"。`
  • ALPHA
  • Counter
  • event
kube_apiserver_clusterip_allocator_allocated_ips
衡量 Service 分配的 IP 地址数量的 Gauge。
  • ALPHA
  • Gauge
  • cidr
kube_apiserver_clusterip_allocator_allocation_duration_seconds
按 ServiceCIDR 分配 Cluster IP 的持续时间(秒)。
  • ALPHA
  • Histogram
  • cidr
kube_apiserver_clusterip_allocator_allocation_errors_total
尝试分配 Cluster IP 的错误数量。
  • ALPHA
  • Counter
  • cidrscope
kube_apiserver_clusterip_allocator_allocation_total
Cluster IP 分配数量。
  • ALPHA
  • Counter
  • cidrscope
kube_apiserver_clusterip_allocator_available_ips
衡量 Service 可用 IP 地址数量的 Gauge。
  • ALPHA
  • Gauge
  • cidr
kube_apiserver_nodeport_allocator_allocated_ports
衡量 Service 分配的 NodePort 数量的 Gauge。
  • ALPHA
  • Gauge
kube_apiserver_nodeport_allocator_allocation_errors_total
尝试分配 NodePort 的错误数量。
  • ALPHA
  • Counter
  • scope
kube_apiserver_nodeport_allocator_allocation_total
NodePort 分配数量。
  • ALPHA
  • Counter
  • scope
kube_apiserver_nodeport_allocator_available_ports
衡量 Service 可用 NodePort 数量的 Gauge。
  • ALPHA
  • Gauge
kube_apiserver_pod_logs_backend_tls_failure_total
由于 kubelet server TLS 验证失败而请求 pod/logs 的总次数。
  • ALPHA
  • Counter
kube_apiserver_pod_logs_insecure_backend_total
请求 pod/logs 的总次数,按使用类型划分:enforce_tls、skip_tls_allowed、skip_tls_denied。
  • ALPHA
  • Counter
  • usage
kube_apiserver_pod_logs_pods_logs_backend_tls_failure_total
由于 kubelet server TLS 验证失败而请求 pod/logs 的总次数。
  • ALPHA
  • Counter
  • 1.27.0
kube_apiserver_pod_logs_pods_logs_insecure_backend_total
请求 pod/logs 的总次数,按使用类型划分:enforce_tls、skip_tls_allowed、skip_tls_denied。
  • ALPHA
  • Counter
  • usage
  • 1.27.0
kubelet_active_pods
kubelet 视为活动的 Pod 数量,这些 Pod 在接纳新 Pod 时被考虑。如果 Pod 不是来自 apiserver,则 static 为 true。
  • ALPHA
  • Gauge
  • static
kubelet_admission_rejections_total
Kubelet 拒绝的 Pod Admission 总数。
  • ALPHA
  • Counter
  • reason
kubelet_certificate_manager_client_expiration_renew_errors
证书续订错误计数器。
  • ALPHA
  • Counter
kubelet_certificate_manager_client_ttl_seconds
Kubelet 客户端证书的 TTL(生存时间)Gauge。值为证书过期前的秒数(如果已过期则为负数)。如果客户端证书无效或未使用,值为 +INF。
  • ALPHA
  • Gauge
kubelet_certificate_manager_server_rotation_seconds
前一个证书在轮换前存活的秒数直方图。
  • ALPHA
  • Histogram
kubelet_certificate_manager_server_ttl_seconds
Kubelet 服务证书最短 TTL(生存时间)Gauge。值为证书过期前的秒数(如果已过期则为负数)。如果服务证书无效或未使用,值为 +INF。
  • ALPHA
  • Gauge
kubelet_cgroup_manager_duration_seconds
cgroup 管理器操作的持续时间(秒)。按方法分解。
  • ALPHA
  • Histogram
  • operation_type
kubelet_cgroup_version
主机上的 cgroup 版本。
  • ALPHA
  • Gauge
kubelet_container_aligned_compute_resources_count
按对齐类型分配给容器的对齐计算资源的累计数量。
  • ALPHA
  • Counter
  • boundaryscope
kubelet_container_aligned_compute_resources_failure_count
按对齐类型分配给容器的对齐计算资源的失败次数的累计数量。
  • ALPHA
  • Counter
  • boundaryscope
kubelet_container_log_filesystem_used_bytes
容器日志在文件系统上使用的字节数。
  • ALPHA
  • Custom
  • uidnamespacepodcontainer
kubelet_containers_per_pod_count
每个 pod 的容器数量。
  • ALPHA
  • Histogram
kubelet_cpu_manager_allocation_per_numa
每个 NUMA 节点的 CPU 分配数量。
  • ALPHA
  • Gauge
  • numa_node
kubelet_cpu_manager_exclusive_cpu_allocation_count
分配给在此节点上运行的容器的独占 CPU 的总数。
  • ALPHA
  • Gauge
kubelet_cpu_manager_pinning_errors_total
需要固定(pinning)的 CPU 核心分配中失败的数量。
  • ALPHA
  • Counter
kubelet_cpu_manager_pinning_requests_total
需要固定(pinning)的 CPU 核心分配的数量。
  • ALPHA
  • Counter
kubelet_cpu_manager_shared_pool_size_millicores
非保证 QoS pod 的共享 CPU 池的大小,以毫核为单位。
  • ALPHA
  • Gauge
kubelet_credential_provider_plugin_duration
凭证提供者插件执行的持续时间(秒)。
  • ALPHA
  • Histogram
  • plugin_name
kubelet_credential_provider_plugin_errors
凭证提供者插件的错误数量。
  • ALPHA
  • Counter
  • plugin_name
kubelet_desired_pods
Kubelet 被指示运行的 pod 数量。如果 pod 来自 apiserver 则 static 为 true。
  • ALPHA
  • Gauge
  • static
kubelet_device_plugin_alloc_duration_seconds
为设备插件的分配请求提供服务的持续时间(秒)。按资源名称细分。
  • ALPHA
  • Histogram
  • resource_name
kubelet_device_plugin_registration_total
设备插件注册的累计数量。按资源名称细分。
  • ALPHA
  • Counter
  • resource_name
kubelet_evented_pleg_connection_error_count
与 CRI 运行时建立流式连接时遇到的错误数量。
  • ALPHA
  • Counter
kubelet_evented_pleg_connection_latency_seconds
与 CRI 运行时建立流式连接的延迟(秒)。
  • ALPHA
  • Histogram
kubelet_evented_pleg_connection_success_count
获取用于接收 CRI 事件的流式客户端的次数。
  • ALPHA
  • Counter
kubelet_eviction_stats_age_seconds
统计信息收集时间和基于这些统计信息通过驱逐信号(eviction signal)驱逐 pod 的时间间隔(秒)。
  • ALPHA
  • Histogram
  • eviction_signal
kubelet_evictions
按驱逐信号(eviction signal)驱逐 pod 的累计数量。
  • ALPHA
  • Counter
  • eviction_signal
kubelet_graceful_shutdown_end_time_seconds
最后一次正常关机结束时间(自 Unix 纪元起,秒)。
  • ALPHA
  • Gauge
kubelet_graceful_shutdown_start_time_seconds
最后一次正常关机开始时间(自 Unix 纪元起,秒)。
  • ALPHA
  • Gauge
kubelet_http_inflight_requests
正在进行的 HTTP 请求数量。
  • ALPHA
  • Gauge
  • long_runningmethodpathserver_type
kubelet_http_requests_duration_seconds
处理 HTTP 请求的持续时间(秒)。
  • ALPHA
  • Histogram
  • long_runningmethodpathserver_type
kubelet_http_requests_total
自服务器启动以来接收到的 HTTP 请求数量。
  • ALPHA
  • Counter
  • long_runningmethodpathserver_type
kubelet_image_garbage_collected_total
Kubelet 通过垃圾回收(因磁盘使用或镜像年龄)收集的镜像总数。
  • ALPHA
  • Counter
  • reason
kubelet_image_pull_duration_seconds
拉取镜像的持续时间(秒)。
  • ALPHA
  • Histogram
  • image_size_in_bytes
kubelet_image_volume_mounted_errors_total
镜像卷挂载失败的数量。
  • ALPHA
  • Counter
kubelet_image_volume_mounted_succeed_total
镜像卷挂载成功的数量。
  • ALPHA
  • Counter
kubelet_image_volume_requested_total
请求的镜像卷数量。
  • ALPHA
  • Counter
kubelet_lifecycle_handler_http_fallbacks_total
生命周期处理器从 HTTPS 成功回退到 HTTP 的次数。
  • ALPHA
  • Counter
kubelet_managed_ephemeral_containers
此 Kubelet 管理的 Pod 中当前存在的临时容器数量。
  • ALPHA
  • Gauge
kubelet_memory_manager_pinning_errors_total
需要固定(pinning)的内存页面分配中失败的数量。
  • ALPHA
  • Counter
kubelet_memory_manager_pinning_requests_total
需要固定(pinning)的内存页面分配的数量。
  • ALPHA
  • Counter
kubelet_mirror_pods
Kubelet 将尝试创建的镜像 Pod 的数量(每个已接受的静态 Pod 一个)。
  • ALPHA
  • Gauge
kubelet_node_name
节点的名称。计数始终为 1。
  • ALPHA
  • Gauge
  • node
kubelet_node_startup_duration_seconds
节点启动的总持续时间(秒)。
  • ALPHA
  • Gauge
kubelet_node_startup_post_registration_duration_seconds
节点注册后启动的持续时间(秒)。
  • ALPHA
  • Gauge
kubelet_node_startup_pre_kubelet_duration_seconds
Kubelet 启动前节点启动的持续时间(秒)。
  • ALPHA
  • Gauge
kubelet_node_startup_pre_registration_duration_seconds
节点注册前启动的持续时间(秒)。
  • ALPHA
  • Gauge
kubelet_node_startup_registration_duration_seconds
节点注册期间启动的持续时间(秒)。
  • ALPHA
  • Gauge
kubelet_orphan_pod_cleaned_volumes
在上次定期扫描中清理了卷的孤立 Pod 的总数。
  • ALPHA
  • Gauge
kubelet_orphan_pod_cleaned_volumes_errors
在上次定期扫描中未能清理卷的孤立 Pod 的数量。
  • ALPHA
  • Gauge
kubelet_orphaned_runtime_pods_total
在容器运行时中检测到的,但未被 Pod 工作程序(pod worker)已知的 Pod 的数量。这通常表示 Kubelet 在 API 中或本地配置中的 Pod 被强制删除时重新启动,这是不寻常的。
  • ALPHA
  • Counter
kubelet_pleg_discard_events
PLEG 中的丢弃事件数量。
  • ALPHA
  • Counter
kubelet_pleg_last_seen_seconds
PLEG 最后一次被视为活跃的时间戳(秒)。
  • ALPHA
  • Gauge
kubelet_pleg_relist_duration_seconds
PLEG 中重新列出 Pod 的持续时间(秒)。
  • ALPHA
  • Histogram
kubelet_pleg_relist_interval_seconds
PLEG 中重新列表之间的间隔(秒)。
  • ALPHA
  • Histogram
kubelet_pod_resources_endpoint_errors_get
PodResource Get 端点返回错误的请求数量。按服务器 API 版本细分。
  • ALPHA
  • Counter
  • server_api_version
kubelet_pod_resources_endpoint_errors_get_allocatable
PodResource GetAllocatableResources 端点返回错误的请求数量。按服务器 API 版本细分。
  • ALPHA
  • Counter
  • server_api_version
kubelet_pod_resources_endpoint_errors_list
PodResource List 端点返回错误的请求数量。按服务器 API 版本细分。
  • ALPHA
  • Counter
  • server_api_version
kubelet_pod_resources_endpoint_requests_get
PodResource Get 端点的请求数量。按服务器 API 版本细分。
  • ALPHA
  • Counter
  • server_api_version
kubelet_pod_resources_endpoint_requests_get_allocatable
PodResource GetAllocatableResources 端点的请求数量。按服务器 API 版本细分。
  • ALPHA
  • Counter
  • server_api_version
kubelet_pod_resources_endpoint_requests_list
PodResource List 端点的请求数量。按服务器 API 版本细分。
  • ALPHA
  • Counter
  • server_api_version
kubelet_pod_resources_endpoint_requests_total
PodResource 端点的请求总数。按服务器 API 版本细分。
  • ALPHA
  • Counter
  • server_api_version
kubelet_pod_start_duration_seconds
从 Kubelet 第一次看到 Pod 到 Pod 开始运行的持续时间(秒)。
  • ALPHA
  • Histogram
kubelet_pod_start_sli_duration_seconds
启动 Pod 的持续时间(秒),不包括拉取镜像和运行 init 容器的时间,从 Pod 创建时间戳到所有容器报告为启动并通过 watch 观察到的时间。
  • ALPHA
  • Histogram
kubelet_pod_start_total_duration_seconds
自创建以来启动 Pod 的持续时间(秒),包括拉取镜像和运行 init 容器的时间,从 Pod 创建时间戳到所有容器报告为启动并通过 watch 观察到的时间。
  • ALPHA
  • Histogram
kubelet_pod_status_sync_duration_seconds
同步 Pod 状态更新的持续时间(秒)。测量从检测到状态更改到 Pod 状态成功更新到 API 的时间,即使中间发生多次 Pod 状态更改。
  • ALPHA
  • Histogram
kubelet_pod_worker_duration_seconds
同步单个 Pod 的持续时间(秒)。按操作类型细分:创建、更新或同步。
  • ALPHA
  • Histogram
  • operation_type
kubelet_pod_worker_start_duration_seconds
从 Kubelet 看到 Pod 到启动工作程序的持续时间(秒)。
  • ALPHA
  • Histogram
kubelet_preemptions
按抢占资源(preemption resource)抢占 Pod 的累计数量。
  • ALPHA
  • Counter
  • preemption_signal
kubelet_restarted_pods_total
Pod 被重新启动的数量,因为它们在 Kubelet 监视它们时被删除并用相同的 UID 重新创建(对于静态 Pod 很常见,对于 API Pod 极其罕见)。
  • ALPHA
  • Counter
  • static
kubelet_run_podsandbox_duration_seconds
run_podsandbox 操作的持续时间(秒)。按 RuntimeClass.Handler 细分。
  • ALPHA
  • Histogram
  • runtime_handler
kubelet_run_podsandbox_errors_total
按 RuntimeClass.Handler 记录的 run_podsandbox 操作错误的累计数量。
  • ALPHA
  • Counter
  • runtime_handler
kubelet_running_containers
当前正在运行的容器数量。
  • ALPHA
  • Gauge
  • container_state
kubelet_running_pods
具有正在运行的 Pod 沙箱的 Pod 数量。
  • ALPHA
  • Gauge
kubelet_runtime_operations_duration_seconds
运行时操作的持续时间(秒)。按操作类型细分。
  • ALPHA
  • Histogram
  • operation_type
kubelet_runtime_operations_errors_total
按操作类型记录的运行时操作错误的累计数量。
  • ALPHA
  • Counter
  • operation_type
kubelet_runtime_operations_total
按操作类型记录的运行时操作的总数。
  • ALPHA
  • Counter
  • operation_type
kubelet_server_expiration_renew_errors
证书续订错误计数器。
  • ALPHA
  • Counter
kubelet_sleep_action_terminated_early_total
生命周期 sleep 处理器(lifecycle sleep handler)提前终止的次数。
  • ALPHA
  • Counter
kubelet_started_containers_errors_total
启动容器时错误的累计数量。
  • ALPHA
  • Counter
  • codecontainer_type
kubelet_started_containers_total
启动的容器的累计数量。
  • ALPHA
  • Counter
  • container_type
kubelet_started_host_process_containers_errors_total
启动 hostprocess 容器时错误的累计数量。此指标仅在 Windows 上收集。
  • ALPHA
  • Counter
  • codecontainer_type
kubelet_started_host_process_containers_total
启动的 hostprocess 容器的累计数量。此指标仅在 Windows 上收集。
  • ALPHA
  • Counter
  • container_type
kubelet_started_pods_errors_total
启动 Pod 时错误的累计数量。
  • ALPHA
  • Counter
kubelet_started_pods_total
启动的 Pod 的累计数量。
  • ALPHA
  • Counter
kubelet_topology_manager_admission_duration_ms
处理 Pod 准入请求的持续时间(毫秒)。
  • ALPHA
  • Histogram
kubelet_topology_manager_admission_errors_total
准入请求失败的数量,其中资源无法对齐。
  • ALPHA
  • Counter
kubelet_topology_manager_admission_requests_total
准入请求的数量,其中资源需要对齐。
  • ALPHA
  • Counter
kubelet_volume_metric_collection_duration_seconds
计算卷统计信息的持续时间(秒)。
  • ALPHA
  • Histogram
  • metric_source
kubelet_volume_stats_available_bytes
卷中可用的字节数。
  • ALPHA
  • Custom
  • namespacepersistentvolumeclaim
kubelet_volume_stats_capacity_bytes
卷的容量(字节)。
  • ALPHA
  • Custom
  • namespacepersistentvolumeclaim
kubelet_volume_stats_health_status_abnormal
异常的卷健康状态。计数为 1 或 0。1 表示卷不健康,0 表示卷健康。
  • ALPHA
  • Custom
  • namespacepersistentvolumeclaim
kubelet_volume_stats_inodes
卷中的最大 inode 数量。
  • ALPHA
  • Custom
  • namespacepersistentvolumeclaim
kubelet_volume_stats_inodes_free
卷中可用的 inode 数量。
  • ALPHA
  • Custom
  • namespacepersistentvolumeclaim
kubelet_volume_stats_inodes_used
卷中使用的 inode 数量。
  • ALPHA
  • Custom
  • namespacepersistentvolumeclaim
kubelet_volume_stats_used_bytes
卷中使用的字节数。
  • ALPHA
  • Custom
  • namespacepersistentvolumeclaim
kubelet_working_pods
Kubelet 实际运行的 Pod 数量,按生命周期阶段、Pod 是否期望、孤立或仅运行时(也是孤立)以及 Pod 是否为静态 Pod 进行细分。孤立 Pod 已从本地配置中移除或在 API 中被强制删除,并占用不相关的资源。
  • ALPHA
  • Gauge
  • configlifecyclestatic
kubeproxy_conntrack_reconciler_deleted_entries_total
conntrack 协调器(conntrack reconciler)删除的 conntrack 流的总数。
  • ALPHA
  • Counter
  • ip_family
kubeproxy_conntrack_reconciler_sync_duration_seconds
ReconcileConntrackFlowsLatency 延迟(秒)。
  • ALPHA
  • Histogram
  • ip_family
kubeproxy_iptables_ct_state_invalid_dropped_packets_total
为解决 conntrack 问题而被 iptables 丢弃的数据包。
  • ALPHA
  • Custom
kubeproxy_iptables_localhost_nodeports_accepted_packets_total
在回环接口的 nodeports 上接受的数据包数量。
  • ALPHA
  • Custom
kubeproxy_network_programming_duration_seconds
集群网络编程延迟(秒)。
  • ALPHA
  • Histogram
  • ip_family
kubeproxy_proxy_healthz_total
代理 healthz HTTP 状态的总数。
  • ALPHA
  • Counter
  • code
kubeproxy_proxy_livez_total
代理 livez HTTP 状态的总数。
  • ALPHA
  • Counter
  • code
kubeproxy_sync_full_proxy_rules_duration_seconds
完整重新同步(full resync)的 SyncProxyRules 延迟(秒)。
  • ALPHA
  • Histogram
  • ip_family
kubeproxy_sync_partial_proxy_rules_duration_seconds
部分重新同步(partial resync)的 SyncProxyRules 延迟(秒)。
  • ALPHA
  • Histogram
  • ip_family
kubeproxy_sync_proxy_rules_duration_seconds
SyncProxyRules 延迟(秒)。
  • ALPHA
  • Histogram
  • ip_family
kubeproxy_sync_proxy_rules_endpoint_changes_pending
待处理的代理规则 Endpoint 更改。
  • ALPHA
  • Gauge
kubeproxy_sync_proxy_rules_endpoint_changes_total
代理规则 Endpoint 更改的总数。
  • ALPHA
  • Counter
kubeproxy_sync_proxy_rules_iptables_last
上次同步由 Kube-proxy 写入的 iptables 规则数量。
  • ALPHA
  • Gauge
  • ip_familytable
kubeproxy_sync_proxy_rules_iptables_partial_restore_failures_total
代理 iptables 部分恢复失败的总数。
  • ALPHA
  • Counter
  • ip_family
kubeproxy_sync_proxy_rules_iptables_restore_failures_total
代理 iptables 恢复失败的总数。
  • ALPHA
  • Counter
  • ip_family
kubeproxy_sync_proxy_rules_iptables_total
Kube-proxy 拥有的 iptables 规则总数。
  • ALPHA
  • Gauge
  • ip_familytable
kubeproxy_sync_proxy_rules_last_queued_timestamp_seconds
上次排队同步代理规则的时间。
  • ALPHA
  • Gauge
  • ip_family
kubeproxy_sync_proxy_rules_last_timestamp_seconds
上次成功同步代理规则的时间。
  • ALPHA
  • Gauge
  • ip_family
kubeproxy_sync_proxy_rules_nftables_cleanup_failures_total
代理 nftables 清理失败的总数。
  • ALPHA
  • Counter
  • ip_family
kubeproxy_sync_proxy_rules_nftables_sync_failures_total
代理 nftables 同步失败的总数。
  • ALPHA
  • Counter
  • ip_family
kubeproxy_sync_proxy_rules_no_local_endpoints_total
具有 Local 流量策略但没有 Endpoints 的服务的数量。
  • ALPHA
  • Gauge
  • ip_familytraffic_policy
kubeproxy_sync_proxy_rules_service_changes_pending
待处理的代理规则 Service 更改。
  • ALPHA
  • Gauge
kubeproxy_sync_proxy_rules_service_changes_total
代理规则 Service 更改的总数。
  • ALPHA
  • Counter
kubernetes_build_info
一个值为“1”的指标,带有 Kubernetes 构建时的主要版本、次要版本、git 版本、git commit、git tree 状态、构建日期、Go 版本和编译器,以及其运行的平台标签。
  • ALPHA
  • Gauge
  • build_datecompilergit_commitgit_tree_stategit_versiongo_versionmajorminorplatform
leader_election_master_status
指示报告系统是否为相关租约(lease)的主节点的 Gauge,0 表示备份,1 表示主节点。'name' 是用于识别租约的字符串。请确保按 name 分组。
  • ALPHA
  • Gauge
  • name
leader_election_slowpath_total
在续订 leader 租约时执行的慢路径(slow path)的总数。'name' 是用于识别租约的字符串。请确保按 name 分组。
  • ALPHA
  • Counter
  • name
node_authorizer_graph_actions_duration_seconds
节点授权器(node authorizer)中图操作(graph actions)的持续时间直方图。
  • ALPHA
  • Histogram
  • operation
node_collector_unhealthy_nodes_in_zone
Gauge,测量每个区域中未就绪(Not Ready)节点的数量。
  • ALPHA
  • Gauge
  • zone
node_collector_update_all_nodes_health_duration_seconds
NodeController 更新所有节点健康状况的持续时间(秒)。
  • ALPHA
  • Histogram
node_collector_update_node_health_duration_seconds
NodeController 更新单个节点健康状况的持续时间(秒)。
  • ALPHA
  • Histogram
node_collector_zone_health
Gauge,测量每个区域健康节点的百分比。
  • ALPHA
  • Gauge
  • zone
node_collector_zone_size
Gauge,测量每个区域注册节点的数量。
  • ALPHA
  • Gauge
  • zone
node_controller_cloud_provider_taint_removal_delay_seconds
NodeController 移除单个节点 cloud-provider taint 后的节点创建时间(秒)。
  • ALPHA
  • Histogram
node_controller_initial_node_sync_delay_seconds
NodeController 完成单个节点初始同步后的节点创建时间(秒)。
  • ALPHA
  • Histogram
node_ipam_controller_cidrset_allocation_tries_per_request
每次 Service 同步添加的端点数量。
  • ALPHA
  • Histogram
  • clusterCIDR
node_ipam_controller_cidrset_cidrs_allocations_total
计数器,测量 CIDR 分配的总数。
  • ALPHA
  • Counter
  • clusterCIDR
node_ipam_controller_cidrset_cidrs_releases_total
计数器,测量 CIDR 释放的总数。
  • ALPHA
  • Counter
  • clusterCIDR
node_ipam_controller_cidrset_usage_cidrs
Gauge,测量已分配 CIDR 的百分比。
  • ALPHA
  • Gauge
  • clusterCIDR
node_ipam_controller_cirdset_max_cidrs
可以分配的最大 CIDR 数量。
  • ALPHA
  • Gauge
  • clusterCIDR
node_swap_usage_bytes
节点的当前交换空间使用量(字节)。仅在非 Windows 系统上报告。
  • ALPHA
  • Custom
plugin_manager_total_plugins
插件管理器中的插件数量。
  • ALPHA
  • Custom
  • socket_pathstate
pod_gc_collector_force_delete_pod_errors_total
Pod GC 控制器启动以来,强制删除 Pod 时遇到的错误数量。
  • ALPHA
  • Counter
  • namespacereason
pod_gc_collector_force_delete_pods_total
Pod GC 控制器启动以来,被强制删除的 Pod 的数量。
  • ALPHA
  • Counter
  • namespacereason
pod_security_errors_total
阻止正常评估的错误数量。非致命错误可能导致使用最新的受限配置文件进行评估。
  • ALPHA
  • Counter
  • fatalrequest_operationresourcesubresource
pod_security_evaluations_total
发生的策略评估数量,不包括忽略或豁免的请求。
  • ALPHA
  • Counter
  • decisionmodepolicy_levelpolicy_versionrequest_operationresourcesubresource
pod_security_exemptions_total
豁免的请求数量,不包括忽略或超出范围的请求。
  • ALPHA
  • Counter
  • request_operationresourcesubresource
pod_swap_usage_bytes
Pod 的当前交换空间使用量(字节)。仅在非 Windows 系统上报告。
  • ALPHA
  • Custom
  • podnamespace
prober_probe_duration_seconds
探测响应的持续时间(秒)。
  • ALPHA
  • Histogram
  • containernamespacepodprobe_type
pv_collector_bound_pv_count
Gauge,测量当前已绑定(bound)的持久卷(Persistent Volume)数量。
  • ALPHA
  • Custom
  • storage_class
pv_collector_bound_pvc_count
Gauge,测量当前已绑定(bound)的持久卷声明(Persistent Volume Claim)数量。
  • ALPHA
  • Custom
  • namespacestorage_classvolume_attributes_class
pv_collector_total_pv_count
Gauge,测量持久卷的总数。
  • ALPHA
  • Custom
  • plugin_namevolume_mode
pv_collector_unbound_pv_count
Gauge,测量当前未绑定(unbound)的持久卷(Persistent Volume)数量。
  • ALPHA
  • Custom
  • storage_class
pv_collector_unbound_pvc_count
Gauge,测量当前未绑定(unbound)的持久卷声明(Persistent Volume Claim)数量。
  • ALPHA
  • Custom
  • namespacestorage_classvolume_attributes_class
reconstruct_volume_operations_errors_total
Kubelet 启动期间,从操作系统重建卷失败的总数。
  • ALPHA
  • Counter
reconstruct_volume_operations_total
Kubelet 启动期间,尝试从操作系统重建卷的总数。这包括成功和失败的重建。
  • ALPHA
  • Counter
replicaset_controller_sorting_deletion_age_ratio
选择的已删除 Pod 的年龄与当前最年轻 Pod 的年龄之比(当时)。应小于 2。此指标的目的是衡量 LogarithmicScaleDown 功能门在 Replicaset 缩减 Pod 时对 Pod 排序(和删除)的粗略效果。这仅在计算和报告时考虑就绪(Ready)的 Pod。
  • ALPHA
  • Histogram
resourceclaim_controller_allocated_resource_claims
已分配的 ResourceClaims 数量。
  • ALPHA
  • Gauge
resourceclaim_controller_create_attempts_total
ResourceClaims 创建请求的数量。
  • ALPHA
  • Counter
resourceclaim_controller_create_failures_total
ResourceClaims 创建请求失败的数量。
  • ALPHA
  • Counter
resourceclaim_controller_resource_claims
ResourceClaims 的数量。
  • ALPHA
  • Gauge
rest_client_dns_resolution_duration_seconds
DNS 解析器延迟(秒)。按主机细分。
  • ALPHA
  • Histogram
  • host
rest_client_exec_plugin_call_total
对 exec 插件的调用次数,按遇到的事件类型(no_error, plugin_execution_error, plugin_not_found_error, client_internal_error)和可选的退出代码进行分区。仅当插件调用成功时,退出代码才为 0。
  • ALPHA
  • Counter
  • call_statuscode
rest_client_exec_plugin_certificate_rotation_age
最后一个认证 exec 插件客户端证书在被轮换之前的寿命(秒)的直方图。如果认证 exec 插件客户端证书未使用,则直方图将不包含数据。
  • ALPHA
  • Histogram
rest_client_exec_plugin_ttl_seconds
由认证 exec 插件管理的客户端证书的最短 TTL(生存时间)的 Gauge(秒)。该值表示到证书到期的时间(如果已过期则为负数)。如果认证 exec 插件未使用或不管理 TLS 证书,则值为 +INF。
  • ALPHA
  • Gauge
rest_client_rate_limiter_duration_seconds
客户端速率限制器延迟(秒)。按 verb 和 host 细分。
  • ALPHA
  • Histogram
  • hostverb
rest_client_request_duration_seconds
请求延迟(秒)。按 verb 和 host 细分。
  • ALPHA
  • Histogram
  • hostverb
rest_client_request_retries_total
请求重试次数,按状态码、verb 和 host 分区。
  • ALPHA
  • Counter
  • codehostverb
rest_client_request_size_bytes
请求大小(字节)。按 verb 和 host 细分。
  • ALPHA
  • Histogram
  • hostverb
rest_client_requests_total
HTTP 请求数量,按状态码、method 和 host 分区。
  • ALPHA
  • Counter
  • codehostmethod
rest_client_response_size_bytes
响应大小(字节)。按 verb 和 host 细分。
  • ALPHA
  • Histogram
  • hostverb
rest_client_transport_cache_entries
内部缓存中的 transport 条目数量。
  • ALPHA
  • Gauge
rest_client_transport_create_calls_total
获取新 transport 的调用次数,按操作结果分区:hit:从缓存中获取,miss:创建并添加到缓存,uncacheable:创建但不缓存。
  • ALPHA
  • Counter
  • result
retroactive_storageclass_errors_total
向持久卷声明(persistent volume claim)进行追溯性 StorageClass 分配失败的总数。
  • ALPHA
  • Counter
retroactive_storageclass_total
向持久卷声明(persistent volume claim)进行追溯性 StorageClass 分配的总数。
  • ALPHA
  • Counter
root_ca_cert_publisher_sync_duration_seconds
根 CA 证书发布器(root ca cert publisher)中命名空间同步的数量。
  • ALPHA
  • Histogram
  • code
root_ca_cert_publisher_sync_total
根 CA 证书发布器(root ca cert publisher)中命名空间同步的数量。
  • ALPHA
  • Counter
  • code
running_managed_controllers
指示控制器实例当前正在运行的位置。
  • ALPHA
  • Gauge
  • managername
scheduler_cache_size
调度器缓存中节点、Pod 和已假定(bound)Pod 的数量。
  • ALPHA
  • Gauge
  • type
scheduler_event_handling_duration_seconds
事件处理延迟(秒)。
  • ALPHA
  • Histogram
  • event
scheduler_goroutines
运行的 goroutine 数量,按它们执行的工作(如绑定)进行分割。
  • ALPHA
  • Gauge
  • operation
scheduler_inflight_events
调度队列中当前正在跟踪的事件数量。
  • ALPHA
  • Gauge
  • event
scheduler_permit_wait_duration_seconds
等待 permit 的持续时间。
  • ALPHA
  • Histogram
  • result
scheduler_plugin_evaluation_total
每个插件和扩展点(仅在 PreFilter、Filter、PreScore 和 Score 中可用)尝试调度 Pod 的数量。
  • ALPHA
  • Counter
  • extension_pointpluginprofile
scheduler_plugin_execution_duration_seconds
在特定扩展点运行插件的持续时间。
  • ALPHA
  • Histogram
  • extension_pointpluginstatus
scheduler_preemption_goroutines_duration_seconds
运行抢占(preemption)goroutine 的持续时间(秒)。
  • ALPHA
  • Histogram
  • result
scheduler_preemption_goroutines_execution_total
已执行的抢占(preemption)goroutine 的数量。
  • ALPHA
  • Counter
  • result
scheduler_queueing_hint_execution_duration_seconds
运行插件的排队提示(queueing hint)函数的持续时间。
  • ALPHA
  • Histogram
  • eventhintplugin
scheduler_scheduling_algorithm_duration_seconds
调度算法延迟(秒)。
  • ALPHA
  • Histogram
scheduler_unschedulable_pods
不可调度 Pod 的数量,按插件名称细分。Pod 将为导致其无法调度的所有插件增加计数器,因此此指标仅在按插件细分时才有意义。
  • ALPHA
  • Gauge
  • pluginprofile
scheduler_volume_binder_cache_requests_total
卷绑定缓存请求的总数。
  • ALPHA
  • Counter
  • operation
scheduler_volume_scheduling_stage_error_total
卷调度阶段错误计数。
  • ALPHA
  • Counter
  • operation
scrape_error
获取容器指标时出错为 1,否则为 0。
  • ALPHA
  • Custom
  • 1.29.0
selinux_warning_controller_selinux_volume_conflict
两个 Pod 使用同一卷时发生的冲突。
  • ALPHA
  • Custom
  • propertypod1_namespacepod1_namepod1_valuepod2_namespacepod2_namepod2_value
service_controller_loadbalancer_sync_total
由于集群的服务/节点更改而配置任何负载均衡器的次数计数。
  • ALPHA
  • Counter
service_controller_nodesync_error_total
由于集群节点更改而配置任何负载均衡器并出错的次数计数。
  • ALPHA
  • Counter
service_controller_nodesync_latency_seconds
更新负载均衡器主机(host)以响应节点更新的 nodesync 延迟(秒)。
  • ALPHA
  • Histogram
service_controller_update_loadbalancer_host_latency_seconds
更新每个负载均衡器主机的延迟(秒)。
  • ALPHA
  • Histogram
serviceaccount_invalid_legacy_auto_token_uses_total
使用过的无效自动生成的旧版令牌(legacy token)的总数。
  • ALPHA
  • Counter
serviceaccount_legacy_auto_token_uses_total
使用过的自动生成的旧版令牌(legacy token)的总数。
  • ALPHA
  • Counter
serviceaccount_legacy_manual_token_uses_total
使用过的手动创建的旧版令牌(legacy token)的总数。
  • ALPHA
  • Counter
serviceaccount_legacy_tokens_total
使用过的旧版服务账户令牌(legacy service account tokens)的总数。
  • ALPHA
  • Counter
serviceaccount_stale_tokens_total
使用过的陈旧的投影式服务账户令牌(stale projected service account tokens)的总数。
  • ALPHA
  • Counter
serviceaccount_valid_tokens_total
使用过的有效投影式服务账户令牌(valid projected service account tokens)的总数。
  • ALPHA
  • Counter
storage_count_attachable_volumes_in_use
正在使用的卷数量的测量。
  • ALPHA
  • Custom
  • nodevolume_plugin
storage_operation_duration_seconds
存储操作持续时间。
  • ALPHA
  • Histogram
  • migratedoperation_namestatusvolume_plugin
taint_eviction_controller_pod_deletion_duration_seconds
从 taint 效果激活到 TaintEvictionController 删除 Pod 之间的时间(秒)。
  • ALPHA
  • Histogram
taint_eviction_controller_pod_deletions_total
TaintEvictionController 启动以来删除的 Pod 的总数。
  • ALPHA
  • Counter
ttl_after_finished_controller_job_deletion_duration_seconds
自 Job 符合删除条件以来删除 Job 所花费的时间。
  • ALPHA
  • Histogram
volume_manager_selinux_container_errors_total
Kubelet 无法为容器计算 SELinux 上下文时发生的错误数量。Kubelet 无法启动此类 Pod,然后会重试,因此此指标的值可能无法代表实际的容器数量。
  • ALPHA
  • Gauge
  • access_mode
volume_manager_selinux_container_warnings_total
Kubelet 无法为容器计算 SELinux 上下文时发生的被忽略的错误数量。当 SELinuxMountReadWriteOncePod 功能扩展到所有卷访问模式时,这些将成为实际错误。
  • ALPHA
  • Gauge
  • access_mode
volume_manager_selinux_pod_context_mismatch_errors_total
Pod 为使用相同卷的容器定义了不同的 SELinux 上下文时发生的错误数量。Kubelet 无法启动此类 Pod,然后会重试,因此此指标的值可能无法代表实际的 Pod 数量。
  • ALPHA
  • Gauge
  • access_mode
volume_manager_selinux_pod_context_mismatch_warnings_total
Pod 为使用相同卷的容器定义了不同的 SELinux 上下文时发生的错误数量。这些还不是错误,但当 SELinuxMountReadWriteOncePod 功能扩展到所有卷访问模式时,它们将成为实际错误。
  • ALPHA
  • Gauge
  • access_mode
volume_manager_selinux_volume_context_mismatch_errors_total
Pod 使用的卷已以与 Pod 所需不同的 SELinux 上下文挂载时发生的错误数量。Kubelet 无法启动此类 Pod,然后会重试,因此此指标的值可能无法代表实际的 Pod 数量。
  • ALPHA
  • Gauge
  • access_modevolume_plugin
volume_manager_selinux_volume_context_mismatch_warnings_total
Pod 使用的卷已以与 Pod 所需不同的 SELinux 上下文挂载时发生的错误数量。这些还不是错误,但当 SELinuxMountReadWriteOncePod 功能扩展到所有卷访问模式时,它们将成为实际错误。
  • ALPHA
  • Gauge
  • access_modevolume_plugin
volume_manager_selinux_volumes_admitted_total
SELinux 上下文正确的卷数量,将使用 mount -o context 选项进行挂载。
  • ALPHA
  • Gauge
  • access_modevolume_plugin
volume_manager_total_volumes
卷管理器中的卷数量。
  • ALPHA
  • Custom
  • plugin_namestate
volume_operation_total_errors
总卷操作错误。
  • ALPHA
  • Counter
  • operation_nameplugin_name
volume_operation_total_seconds
存储操作端到端持续时间(秒)。
  • ALPHA
  • Histogram
  • operation_nameplugin_name
watch_cache_capacity
watch 缓存的总容量,按资源类型细分。
  • ALPHA
  • Gauge
  • 资源
watch_cache_capacity_decrease_total
watch 缓存容量减少事件的总数,按资源类型细分。
  • ALPHA
  • Counter
  • 资源
watch_cache_capacity_increase_total
watch 缓存容量增加事件的总数,按资源类型细分。
  • ALPHA
  • Counter
  • 资源
workqueue_adds_total
workqueue 处理的添加总数。
  • ALPHA
  • Counter
  • name
workqueue_depth
workqueue 的当前深度。
  • ALPHA
  • Gauge
  • name
workqueue_longest_running_processor_seconds
workqueue 最长的处理器运行了多少秒。
  • ALPHA
  • Gauge
  • name
workqueue_queue_duration_seconds
项目在 workqueue 中停留多久(秒)才被请求。
  • ALPHA
  • Histogram
  • name
workqueue_retries_total
workqueue 处理的重试总数。
  • ALPHA
  • Counter
  • name
workqueue_unfinished_work_seconds
已完成但尚未被 work_duration 观测到的正在进行的工作有多少秒。大值表示线程卡死。可以通过观察此值增加的速率来推断卡死线程的数量。
  • ALPHA
  • Gauge
  • name
workqueue_work_duration_seconds
处理 workqueue 中的项目需要多少秒。
  • ALPHA
  • Histogram
  • name

本页面是自动生成的。

如果你打算报告此页面存在的问题,请在问题描述中提及此页面是自动生成的。修复可能需要在 Kubernetes 项目的其他地方进行。

最后修改时间 2025 年 5 月 1 日上午 9:21 PST:更新了探测(probe)更新后的指标文档 (b9e37a19e1)