2022년 카카오 서비스 마비사건

Chirho (토론 | 기여)님의 2022년 10월 16일 (일) 02:42 판 (→‎문제점)

2022년 10월 15일에 발생한 화재사고로 이로 인해 카카오의 대표서비스 카카오톡이 당일 15시반부터 먹통이 된 사건이다.


사고 원인

사고 경과

10월 15일

  • 오후 3시 30분경부터 카카오톡, 다음 뉴스페이지 장애 발생 시작
  • 오후 3시 33분 화재신고 접수
  • 오후 3시 40분 무렵 서비스 장애 관련 뉴스 보도 시작
  • 오후 5시 46분 주 불길 초진 성공
  • 오후 6시 20분 무렵 판교 데이터센터 화재 뉴스 보도 확인
  • 오후 6시 50분 카카오측에서 전원 공급시 2시간이면 전체 서비스가 복구 가능할 것이라고 밝힘[1]
  • 오후 9시 40분 카카오 대표의 사과문 발표
  • 오후 11시 30분 다음 메인페이지와 뉴스 페이지 접속 가능[2]
  • 오후 10시 40뷴 SK C&C 대표이사 명의 사과문 발표

10월 16일

  • 오전 1시 20분 전체 화재 완진, 전력복구작업 시작

중단 서비스 목록

  • 카카오톡 : 채팅 기능만 마비된 것이 아니라 카카오톡 인증까지 먹통이 되면서 여기에 연동된 로그인이나 본인인증, 금융, 송금 등이 모조리 먹통이 되어버렸다.
  • 다음 : 16일 오전 1시 무렵에 되어서 메인페이지와 뉴스 페이지만 겨우 복구. 그러나 로그인 기능 제한과 뉴스사 기사 연결은 이 시점까지 복구되지 않았고 메인페이지가 돌아온 시점 기준 약 12시간 이전에 올라와 있던 기사가 마지막이다.
  • 업비트
  • 카카오뱅크
  • 카카오맵
  • 티스토리
  • 카카오T
  • 카카오페이
  • 카카오버스
  • 카카오게임즈

문제점

가장 큰 문제점은 거의 전 국민이 사용하는 IT 기업의 서비스임에도 불구하고 단 한곳의 IDC마비로 전체 서비스가 중단되었다는 점이다. 카카오측에서는 이원화 조치가 되어있어 데이터상의 문제는 없을 것이라고 하지만 정황상 이 이원화조치의 의미가 다른 IDC쪽에 서버를 둔 것이 아니라 동일 IDC내부에 다른 서버로 이원화를 시켜놓았을 가능성이 높다. 즉, 한 장소에 전체 서비스가 몰빵되어있었고, 물리적으로 떨어진 다른 장소에 서버를 둔 것은 없었기 때문에 복구 자체가 무기한으로 늘어지고 있는 것으로 추정된다.

즉, 카카오측에서 밝힌 내용대로 전국의 다른 IDC에 이원화된 서비스를 하고 있는 것이 아니라 백업 정도 수준만 하고 있다가 한 IDC내의 전체 서버가 한꺼번에 죽어버리는 이례적인 상황이 벌어지면서 평소라면 동일 IDC내부에서 서버 한두개가 죽는다 하더라도 바로 옆의 서버가 감당하는 방식의 대응이 가능하였으나 전체 서버가 동시에 사망하면서 이를 대체해 줄 수 있는 서버가 다른 곳에 하나도 존재하지 않았다는 정황으로 볼 수 있다. 실제로 카카오 대표의 사과문에서도 "이원화 조치는 취하고 있지만 이번 사건처럼 데이터센터 한 곳 전체가 영향을 받는 것은 이례적인 상황"이라고 밝혀 물리적으로 완전 분리된 다른 IDC에 이원화된 서비스가 없었음을 암시하는 내용이라고도 볼 소지가 있다.

기업은 아주 잘 쪼개면서[3] 서버는 한 곳에 아주 잘 합쳐놓았다.

이러한 모습은 같은 IDC에 입주해 있던 네이버는 전방위적인 장애를 겪지 않고 춘천의 자체 데이터센터가 따로 존재하고 있어서 빠른 복구가 가능하였으나 카카오의 경우 이번 사건으로 전국민이 이용하는 플랫폼 제공 기업임에도 불구하고 자체 데이터 센터조차 갖추지 않고 서버를 임대해 사용하고 있다는게 밝혀진데다 단 한 곳의 IDC 마비만으로 전체 서비스가 마비되는 매우 심각한 취약성이 드러났다는 점에서 대비된다.

이외에 이번 사건 이전인 10월 4일에도 카카오톡 메신저와 다음, 티스토리 사이트의 장애가 있었으며, 2020년 3월 17일에도 30분에도 카톡 서비스 장애가 발생한 사례가 있었음에도 전혀 대비나 개선이 되지 않고 있다가 불의의 사고에 제대로 된 헤드샷을 맞는 결과가 된 것이라 할 수 있다.

향후 영향

각주

  1. 카카오 "전원공급 재개 시 2시간 내 전체서비스 복구 전망"
  2. phttps://n.news.naver.com/mnews/article/214/0001228669 카카오 "다음 뉴스 서비스 일부 복구"‥장애 8시간 만]
  3. 수시로 자행한 분할상장을 의미