Kubernetes OOMKilled 원인 분석과 메모리 설계
Deployment를 배포한 뒤 한동안 잘 동작하던 Pod가 갑자기 재시작됩니다. kubectl describe pod를 확인하면 Reason: OOMKilled, Exit Code: 137이 보입니다. 메모리 limit을 올리면 잠시 괜찮다가 며칠 뒤 또 같은 증상이 반복됩니다. OOMKilled는 단순히 limit을 올린다고 해결되는 문제가 아닙니다. 왜 메모리가 초과했는지, 어느 수준에서 kill이 발생했는지, 어떤 기준으로 requests와 limits를 설계해야 하는지를 이해해야 재발을 방지할 수 있습니다.핵심 요약구분Container OOMKilledNode 수준 Eviction트리거컨테이너가 memory limit 초과Node 가용 메모리가 eviction threshold 이하Exit Co..
2026.06.08