POD(3)
-
Kubernetes OOMKilled 원인 분석과 메모리 설계
Deployment를 배포한 뒤 한동안 잘 동작하던 Pod가 갑자기 재시작됩니다. kubectl describe pod를 확인하면 Reason: OOMKilled, Exit Code: 137이 보입니다. 메모리 limit을 올리면 잠시 괜찮다가 며칠 뒤 또 같은 증상이 반복됩니다. OOMKilled는 단순히 limit을 올린다고 해결되는 문제가 아닙니다. 왜 메모리가 초과했는지, 어느 수준에서 kill이 발생했는지, 어떤 기준으로 requests와 limits를 설계해야 하는지를 이해해야 재발을 방지할 수 있습니다.핵심 요약구분Container OOMKilledNode 수준 Eviction트리거컨테이너가 memory limit 초과Node 가용 메모리가 eviction threshold 이하Exit Co..
2026.06.08 -
Kubernetes CrashLoopBackOff 원인과 해결 방법
Deployment를 배포했는데 Pod가 Running 상태를 유지하지 못합니다. kubectl get pods를 치면 RESTARTS가 계속 올라가고, STATUS가 CrashLoopBackOff입니다. 로그를 봐도 뭐가 문제인지 바로 안 보입니다. CrashLoopBackOff는 "컨테이너가 시작 직후 종료를 반복하고 있다"는 신호이고, Exit Code와 로그를 함께 봐야 원인을 좁힐 수 있습니다.핵심 요약원인Exit Code / 키워드확인 방법코드 버그 / 미처리 예외Exit 1, Exception 메시지kubectl logs --previous환경변수 / 설정 누락Exit 1, config 관련 에러ConfigMap, Secret 마운트 확인OOMKilledExit 137, OOMKilling ..
2026.06.05 -
Kubernetes ImagePullBackOff 원인과 해결 방법
배포를 했는데 Pod가 Running이 되지 않습니다. kubectl get pods를 치면 STATUS가 ImagePullBackOff입니다. 이미지 이름은 맞는 것 같은데 왜 Pull이 안 될까요? ImagePullBackOff는 원인이 다양하고, Events 메시지를 정확히 읽어야 원인을 좁힐 수 있습니다.핵심 요약원인Events 메시지 키워드확인 방법이미지 이름/태그 오류manifest unknown, not found이미지 이름, 태그, 레지스트리 URL 확인레지스트리 인증 실패unauthorized, denied, no basic auth credentialsimagePullSecrets 설정 확인Private 레지스트리 네트워크 차단i/o timeout, connection refusedNo..
2026.06.01