- 호주 대형 펀드, 구글 클라우드 실수로 전체 인프라 삭제 사고 발생
- 독립적인 백업 전략으로 데이터 복구 성공, 재해 복구 중요성 재조명
- 구글 CEO의 이례적 공개 사과 및 클라우드 리스크에 업계 경종
“최고의 기술도 인간의 실수는 완전히 막지 못합니다. 백업은 선택이 아닌 필수입니다.”
사고 개요와 배경
2024년 6월, 구글 클라우드 플랫폼(GCP)에서 호주 투자펀드의 전체 클라우드 인프라가 실수로 삭제되는 초유의 사고가 발생했다. 자산 규모만 1240억 달러에 이르는 대형 펀드의 서비스와 인프라가 통째로 사라지는 사태였다. 이 사건은 클라우드 시대의 의존성과 위험성을 여실히 드러내며 업계에 커다란 충격을 안겼다.
사고의 기술적 원인
사고는 구글 내부의 인프라 정리 및 유지보수 과정에서 발생했다. 관리자가 인프라 전체를 정리하던 중, 호주 펀드의 모든 클라우드 리소스가 의도치 않게 삭제됐다. 원래 클라우드 서비스 제공업체들은 지역 복제(Regional Replication) 기능을 통해 데이터를 여러 지역에 분산 저장해 장애 발생에 대비한다. 하지만, 이번 사고에서는 이 지역 복제조차도 작동하지 않았고, 복제된 데이터가 모두 함께 삭제됐다. 이로 인해 복제 시스템 자체에 대한 신뢰성 문제가 다시 불거졌다.
독립 백업 시스템의 중요성
펀드 측은 구글 클라우드의 서비스에만 의존하지 않고, 별도의 서드파티 백업 솔루션을 자체적으로 운용해왔다. 이 독립적인 백업이 결정적인 역할을 해냈다. 사고 즉시 별도 외부 백업을 활용해 대부분의 데이터를 무사히 복구할 수 있었으며, 피해를 최소한으로 막았다. 전문가들은 ‘클라우드 복제만 믿고 백업은 생략해도 된다’는 기존 통념이 이번 사례로 완전히 뒤집히게 됐다고 평가한다.
구글 클라우드의 공식 대응과 사과
사고 발생 이후, 구글 클라우드 CEO 토마스 쿠리안(Thomas Kurian)은 직접 공개 성명을 발표하고 전면적인 사과를 표했다. 클라우드 업계에서 이 같은 경영진의 직접적 책임 인정은 매우 드문 일이다. 대부분의 클라우드 기업들은 법적 책임을 회피하거나 기술적 한계를 내세워 사고의 심각성을 축소하는 경향이 있지만, 이번에는 예외적으로 공개 소통과 협상이 이뤄졌다.
금융기관과 클라우드 의존 리스크 재조명
이 사건은 금융기관, 특히 대형 펀드 등 거액 자산을 관리하는 기업들의 클라우드 의존에 따른 구조적 취약성을 극명하게 드러냈다. 아무리 신뢰할만한 대형 클라우드 서비스라도 인간의 실수나 시스템 결함에서는 자유로울 수 없다. 실제로 이번에 호주 펀드는 자체 백업 시스템이 없었다면 치명적인 데이터 손실을 입을 뻔했다.
클라우드 환경에서의 데이터 보호 전략
다시 한 번 확인된 사실은 클라우드도 완전 무결하지 않으며, 고객사는 독립된 데이터 보호 전략을 반드시 마련해야 한다는 점이다. 주요 클라우드 사업자들의 복제 시스템, 내장 백업도 불완전할 수 있으므로, 명확히 물리적으로 분리된 체계와 솔루션을 구축해야 한다. 또한, 실질적으로 복구가 가능한지를 주기적으로 점검하고 연습하는 복구 훈련 역시 필요하다.
결론 및 업계 시사점
이번 1240억 달러 호주 펀드 사고는 클라우드 기술의 혁신과 편의성 이면에 숨어 있는 위험성을 적나라하게 보여준다. 하지만, 클라우드를 원천적으로 거부하자는 의미는 아니다. AWS, 애저, 구글 클라우드 등 주요 사업자들은 높은 신뢰성을 제공해왔지만 예기치 못한 실수나 사고에 노출될 수밖에 없다. 이제는 클라우드 활용의 장점을 살리면서도 독립된 백업, 복구 시나리오 등 균형 잡힌 리스크 관리가 모든 기관에게 필수임을 업계 전체가 다시 한 번 자각해야 한다.
- 주요 인프라의 클라우드 의존도와 백업 전략의 균형 필요
- 운영 주체의 실수에 대비한 주기적인 재해 복구 훈련 권장
- 클라우드 사고 발생 시 투명하고 적극적인 커뮤니케이션의 중요성 부각