Kubernetes WorkerNode grpc 장애 해결

  갑작스런 장애가 발생(서버가 재부팅되면서 장애 발생)……재부팅 후에 NoReady 상태가 되면 대부분 swapoff 시키고 kubelet 재 시작하면 바로 해결되는데 요번엔 다른 이슈 구글링 분석  장애 원인 pod 종료 상태를 설정하지 않는 podSyncStatus 해당 동작으로 인해 GarbageCollect가 주기적으로 샌드박스,로그 디렉토리를 제거하지 못하게 되면 gRPC 호출을 정상적으로하지 못하여 원인 발생 해결 방법 서비스 중지 sudo systemctl stop … Read more