# 选举：领导者选举丢失

- **ID:** `kubernetes/leader-election-lost`
- **领域:** kubernetes
- **类别:** system_error
- **错误码:** `K8S-LEADER-001`
- **验证级别:** ai_generated
- **修复率:** 80%

## 根因

控制器或操作器 Pod 因网络分区、Pod 重启或 etcd 超时而丢失租约锁，导致临时领导权空缺。

## 版本兼容性

| 版本 | 状态 | 引入 | 弃用 |
|------|------|------|------|
| kubernetes 1.23 | active | — | — |
| kubernetes 1.24 | active | — | — |
| kubernetes 1.25 | active | — | — |
| kubernetes 1.28 | active | — | — |

## 解决方案

1. ```
   将控制器 Deployment 缩容至 0，等待 30 秒，再扩容至 1，以强制进行干净的领导者选举。
   ```
2. ```
   检查可能阻止控制器副本之间在端口 2380（etcd 对等端口）上通信的网络策略或防火墙规则。
   ```

## 无效尝试

- **Restart all replicas of the controller simultaneously.** — Restarting all replicas at once can cause a prolonged leader election storm, making the problem worse. (65% 失败率)
- **Delete the lease object in etcd manually.** — Manually deleting the lease may cause data inconsistency and is not recommended; the leader election mechanism should self-heal. (80% 失败率)