Kubernetes资源限制：LimitRange 配置，Pod 资源默认限制

1. 为什么每个Kubernetes工程师都需要LimitRange？

我见过太多因为资源超用引发的"血案"：某天凌晨3点，新来的开发同事部署了个不设限的Pod，直接把集群的CPU吃满，线上支付系统突然中断，整个运维团队被报警电话轰炸到天亮。这种惨痛经历告诉我们：默认配置的缺位就像没有安全带的过山车。

Kubernetes的LimitRange就像集群资源的交通警察，它能：

给所有没有自觉声明资源的Pod带上"金箍"
统一团队的资源使用规范
防止单个Pod成为"资源黑洞"

2. LimitRange工作机制全景图

当我们的Pod规格忘记填写资源限制时，LimitRange会在四个维度竖起护栏：

apiVersion: v1
kind: LimitRange
metadata:
  name: global-limits
spec:
  limits:
  - type: Container
    default:          # 默认分配上限
      cpu: "500m"
      memory: "512Mi"
    defaultRequest:   # 默认申请量
      cpu: "100m" 
      memory: "128Mi"
    max:              # 最大允许量
      cpu: "2"
      memory: "2Gi"
    min:              # 最小需求量
      cpu: "50m"
      memory: "64Mi"

（技术栈：Kubernetes 1.24+）

3. 从零开始配置LimitRange

3.1 基础防护配置

先创建这个"资源看门人"：

kubectl apply -f - <<EOF
apiVersion: v1
kind: LimitRange
metadata:
  name: basic-guard
spec:
  limits:
  - type: Container
    default:
      cpu: "800m"
      memory: "1Gi"
    defaultRequest:
      cpu: "200m"
      memory: "256Mi"
EOF

验证配置效果：

# 创建无资源声明的测试Pod
kubectl run test-pod --image=nginx --restart=Never

# 查看实际生效的配置
kubectl get pod test-pod -o jsonpath='{.spec.containers[0].resources}'

输出结果会显示自动填充的requests和limits值

3.2 存储空间限额实战

内存不是唯一的管控对象，临时存储同样需要限制：

apiVersion: v1
kind: LimitRange
metadata:
  name: storage-limiter
spec:
  limits:
  - type: Pod
    max:
      ephemeral-storage: "5Gi"
  - type: PersistentVolumeClaim
    min:
      storage: "1Gi"
    max:
      storage: "10Gi"

4. 关联技术：ResourceQuota的协同作战

当LimitRange遇上ResourceQuota，就形成了双保险机制：

apiVersion: v1
kind: ResourceQuota
metadata:
  name: namespace-quota
spec:
  hard:
    requests.cpu: "10"
    requests.memory: 20Gi
    limits.cpu: "20"
    limits.memory: 40Gi

二者的配合关系就像：

LimitRange：微观管理（每个容器的资源规范）
ResourceQuota：宏观调控（整个命名空间的资源配额）

5. 这些坑我帮你踩过了

5.1 优先级谜团

当遇到这些情况时，最终限制的计算顺序是：

Pod声明的具体数值
LimitRange的default配置
系统默认值

5.2 存储限制的特殊性

临时存储的监控需要节点安装正确版本的kubelet，否则可能监控失效

5.3 节点资源的关系

LimitRange的限制需要与节点实际资源配置相匹配，例如节点只有4核CPU，却设置limit为8核会导致调度失败

6. 三种典型场景的实际应用

场景A：多租户集群隔离

某金融系统需要确保每个业务部门的环境稳定：

limits:
  - type: Container
    max:
      cpu: "4"
      memory: "8Gi"
    min:
      cpu: "100m"
      memory: "128Mi"

场景B：开发测试环境防护

防止实习生手滑部署吃资源的应用：

default:
  cpu: "500m"
  memory: "512Mi"
max:
  cpu: "1"
  memory: "2Gi"

场景C：持续交付流水线

在CI/CD中自动注入资源限制：

pipeline {
    agent any
    stages {
        stage('Deploy') {
            steps {
                sh '''
                kubectl apply -f deployment.yaml
                if ! kubectl get limitrange -n ${NAMESPACE}; then
                    kubectl create -f limitrange.yaml
                fi
                '''
            }
        }
    }
}

7. 选择LimitRange的理由与顾虑

优势亮点：

实施成本低：仅需创建LimitRange对象
透明化管理：开发者无需感知限制的存在
兼容性好：与多数CNI/CSI插件完美配合

潜在问题：

无法防止恶意用户显式指定超大资源
历史已存在Pod需要重建才会生效
需要配合监控告警系统使用

8. 写在最后

在使用LimitRange的过程中，有几点重要经验分享：

渐进式配置：先设置较宽松的限制，观察监控数据后再调整
监控配变化：使用kube-state-metrics监控LimitRange变更
文档自动化：将LimitRange配置写入集群初始化脚本

正确使用LimitRange的效果如同为集群戴上了智能手环：既不会让应用"营养过剩"，也不会让它们"营养不良"。

敲码拾光专注于编程技术，涵盖编程语言、代码实战案例、软件开发技巧、IT前沿技术、编程开发工具，是您提升技术能力的优质网络平台。