# 节点池升级失败：资源耗尽：区域 us-central1-a 中 CPU 不足

- **ID:** `cloud/gcp-gke-node-pool-upgrade-failed`
- **领域:** cloud
- **类别:** resource_error
- **错误码:** `RESOURCE_EXHAUSTED`
- **验证级别:** ai_generated
- **修复率:** 82%

## 根因

GKE 在升级期间无法分配新节点，因为指定区域的 CPU 配额或容量不足，无法容纳滚动更新所需的额外临时节点。

## 版本兼容性

| 版本 | 状态 | 引入 | 弃用 |
|------|------|------|------|
| GKE: 1.28.5-gke.1500 | active | — | — |
| Kubernetes: 1.28 | active | — | — |
| Compute Engine: API v1 | active | — | — |

## 解决方案

1. ```
   在 GCP 控制台中为受影响区域的 Compute Engine CPU 请求增加配额：IAM 与管理 > 配额 > 'CPU' > 编辑配额。
   ```
2. ```
   使用不同区域的激增升级，在可用容量充足的区域添加节点池，然后迁移工作负载。
   ```
3. ```
   临时减少集群中的副本数以释放配额，然后执行升级。
   ```

## 无效尝试

- **** — More nodes consume more quota, worsening the exhaustion; the upgrade needs additional quota for temporary nodes, not larger pool. (85% 失败率)
- **** — Deletion frees quota but the new pool creation may still fail if zone capacity is insufficient at that time. (60% 失败率)
- **** — Smaller instances may not meet workload requirements; also, the zone may still lack capacity for any instance type. (70% 失败率)
