Troubleshooting (6) 썸네일형 리스트형 EKS Pod가 외부 인터넷에 접근하지 못하는 경우 EKS 클러스터에 애플리케이션을 배포했는데, Pod에서 외부 API를 호출하면 타임아웃이 발생합니다. curl https://api.example.com이 응답 없이 멈추고, 컨테이너 이미지를 pull하는 것도 실패합니다. Node는 정상인데 Pod만 외부 통신이 안 됩니다. EKS에서 Pod의 외부 인터넷 접근은 VPC 네트워크 경로(Route Table → NAT Gateway → Internet Gateway)와 보안 규칙(Security Group, NACL)이 모두 정상이어야 동작합니다.Troubleshooting EKS / AWS Level 2 18분핵심 요약원인증상확인 방법NAT Gateway 미설정 / 장애모든 Pod에서 외부 타임아웃VPC 콘솔에서 NAT GW 상태, Route Table.. Terraform Error acquiring the state lock 해결 방법 terraform plan을 실행했는데 "Error acquiring the state lock"이 뜨면서 아무 작업도 진행되지 않습니다. 팀원이 작업 중인 것도 아닌데 lock이 걸려 있습니다. CI/CD 파이프라인이 중간에 실패하면서 lock이 해제되지 않은 경우, 이 상황이 자주 발생합니다.Troubleshooting DevOps/Terraform Level 2 10분핵심 요약구분내용에러 메시지Error acquiring the state lock원인이전 Terraform 실행이 비정상 종료되면서 DynamoDB Lock이 해제되지 않음즉시 해결terraform force-unlock 근본 원인CI/CD timeout, 수동 중단(Ctrl+C), 네트워크 단절, 프로세스 강제 종료재발 방지CI/CD.. Kubernetes CrashLoopBackOff 원인과 해결 방법 Deployment를 배포했는데 Pod가 Running 상태를 유지하지 못합니다. kubectl get pods를 치면 RESTARTS가 계속 올라가고, STATUS가 CrashLoopBackOff입니다. 로그를 봐도 뭐가 문제인지 바로 안 보입니다. CrashLoopBackOff는 "컨테이너가 시작 직후 종료를 반복하고 있다"는 신호이고, Exit Code와 로그를 함께 봐야 원인을 좁힐 수 있습니다.Troubleshooting Kubernetes Level 2 15분핵심 요약원인Exit Code / 키워드확인 방법코드 버그 / 미처리 예외Exit 1, Exception 메시지kubectl logs --previous환경변수 / 설정 누락Exit 1, config 관련 에러ConfigMap, Secre.. S3 AccessDenied 원인과 해결 방법: Bucket Policy, IAM, KMS, VPC Endpoint까지 Lambda에서 S3 객체를 읽으려는데 AccessDenied가 반환됩니다. IAM Role에 s3:GetObject를 붙였는데 왜 안 될까요? S3 AccessDenied는 권한 평가 계층이 여러 겹이라 원인을 특정하기 어렵습니다. 이 글에서는 원인별 진단 흐름과 해결 방법을 정리합니다.핵심 요약원인증상확인 방법IAM Policy에 Action/Resource 누락모든 S3 요청에서 403IAM Policy Simulator 또는 aws iam simulate-principal-policyBucket Policy에 명시적 Deny특정 조건에서만 403Bucket Policy의 Deny Statement 확인Block Public Access 활성화Public ACL/Policy 설정 시 403S3 콘솔.. Kubernetes ImagePullBackOff 원인과 해결 방법 배포를 했는데 Pod가 Running이 되지 않습니다. kubectl get pods를 치면 STATUS가 ImagePullBackOff입니다. 이미지 이름은 맞는 것 같은데 왜 Pull이 안 될까요? ImagePullBackOff는 원인이 다양하고, Events 메시지를 정확히 읽어야 원인을 좁힐 수 있습니다.핵심 요약원인Events 메시지 키워드확인 방법이미지 이름/태그 오류manifest unknown, not found이미지 이름, 태그, 레지스트리 URL 확인레지스트리 인증 실패unauthorized, denied, no basic auth credentialsimagePullSecrets 설정 확인Private 레지스트리 네트워크 차단i/o timeout, connection refusedNo.. ALB 502 Bad Gateway 원인 분석: Target Group, Health Check, 타임아웃까지 배포 직후 ALB에서 502가 터지기 시작했습니다. Target Group은 healthy인데 왜 502일까요? ALB 502는 원인이 다양하고, 증상만으로는 구분이 어렵습니다. 이 글에서는 원인별 진단 흐름과 해결 방법을 정리합니다.핵심 요약원인증상확인 방법Target이 모두 unhealthy모든 요청에서 502Target Group Health Check 상태 확인백엔드가 연결을 먼저 끊음간헐적 502ALB Access Log의 target_status_code 확인백엔드 응답 타임아웃특정 요청에서 502ALB idle timeout vs 백엔드 timeout 비교Target 등록/해제 중배포 직후 502Deregistration delay 설정 확인백엔드 Keep-Alive 간헐적 502 (부하 시.. 이전 1 다음