여러 GitHub 서비스 장애 사고
2 days ago
3
- Webhooks, Actions, Copilot을 포함한 여러 GitHub 서비스에서 가용성 저하와 이용 불가가 함께 발생함
- 초기에는 Copilot과 Webhooks의 가용성 저하를 조사했고, 이후 여러 서비스 장애로 조사 범위가 확대됨
- Actions는 별도로 성능 저하를 겪었고, 근본 문제가 확인된 뒤 완화 작업이 진행됨
- Actions와 Copilot의 저하가 완화된 뒤 안정성 모니터링과 남은 서비스들에 대한 검증 작업이 이어졌고, Webhooks도 정상 동작으로 복구됨
- 이번 장애는 최종적으로 해결 완료 상태로 종료됐고, 상세한 root cause analysis는 준비되는 대로 공유될 예정임
장애 경과
- GitHub의 여러 서비스 장애가 발생했고, 영향 범위에는 Webhooks, Actions, Copilot이 포함됨
- 초기에는 Copilot과 Webhooks의 가용성 저하를 조사하기 시작함
- 이후 여러 서비스가 이용 불가 상태를 보이며 조사 범위가 확대됨
- Actions는 별도로 성능 저하를 겪었고, 원인 파악이 계속 진행됨
- 근본 문제가 확인된 뒤 완화 작업이 진행됨
- Actions와 Copilot에 영향을 준 저하는 완화됐고, 안정성 유지를 위한 모니터링이 이어짐
- 많은 서비스에 대한 완화가 진행된 뒤 남은 서비스들에 대한 검증 작업도 이어짐
- Webhooks도 정상 동작으로 복구됨
- 최종적으로 이번 장애는 해결 완료 상태로 종료됐고, 상세한 root cause analysis는 준비되는 대로 공유될 예정임
참고 링크
-
Homepage
-
Tech blog
- 여러 GitHub 서비스 장애 사고