IT 인터넷/SNS

[카카오 먹통] "데이터 손실 우려 0%"…정부-카카오 일문일답

파이낸셜뉴스

입력 2022.10.16 14:36

수정 2022.10.16 15:24

과기정통부, 카카오 장애 관련 간담회 및 백브리핑

카카오 "데이터 분산저장, 시스템도 이원화 돼있다"
[파이낸셜뉴스] 과학기술정보통신부(과기정통부)와 SK 주식회사 C&C, 카카오는 서비스 복구와 재발 방지대책 마련에 총력을 기울이고 있다.

과기정통부는 16일 경기 분당구 SK 판교데이터센터에서 카카오, 네이버클라우드, SK C&C 등 기업 관계자들과 카카오톡 장애 관련 간담회를 진행했다.

홍진배 과기정통부 네트워크실장은 "윤석열 대통령 지시에 따라 오전 11시 15분부터 방송통신재난상황실을 방송통신재난대책본부로 격상, 사고 원인 조사와 서비스에 조속한 정상화를 위해 총력을 기울이고 있다"며 "정부는 이번 상황을 매우 엄중히 여기고 있고 주요 부가통신사업자 시설과 관련해 필요한 방안을 적극 검토해 개선 방향을 마련할 계획"이라고 말했다.

이종호 과학기술정보통신부 장관(가운데)이 16일 오전 경기도 성남시 분당구 SK C&C 판교 데이터센터를 방문해 화재 관련 상황을 점검하고 네이버, 카카오 등 서비스 장애의 신속한 복구를 독려하고 있다. 과기정통부 제공
이종호 과학기술정보통신부 장관(가운데)이 16일 오전 경기도 성남시 분당구 SK C&C 판교 데이터센터를 방문해 화재 관련 상황을 점검하고 네이버, 카카오 등 서비스 장애의 신속한 복구를 독려하고 있다. 과기정통부 제공

다음은 과기정통부 홍진배 네트워크정책실장, 김완종 SK C&C 클라우드 부문장, 양현서 카카오 부사장 일문일답.

―SK C&C가 운영하는 데이터 센터에 화재 메뉴얼이 정립된 게 있나. 그대로 작동이 된 게 맞는지.
김완종 SK C&C 클라우드 부문장
저희 판교 데이터센터는 관련된 안전 규정을 준수하고 있다. 올해 5월에도 소방시설 종합점검을 통해서 소방 작동 기능 점검을 시행한 바 있다.
이번에 화재가 발생하자마자 화재 경보가 울리고, 경보 단계에 따라서 자체 통합 소화 설비가 작동됐다. 그리고 바로 신속하게 소방 당국으로 메뉴얼에 따라 신고가 됐다. 소방차가 도착한 이후에는 전문 소방 인력들과 협력했다. 관련 절차는 지속적으로 점검하고 있고, 초기 대응도 소방시설들이 정확하게 작동했기 때문에 인적, 물적 추가 피해가 없었다.

―화재 원인 밝혀진 부분 있는지.
홍진배 과기정통부 네트워크실장
소방 당국과 국립과학수사원에서 조사할 예정이다. 3일간 정밀 조사와 포렌식 통해서 화재 원인 식별해낼 거고, 식별 원인에 따라서 재발 방지 대책을 철저하게 수립할 계획이다.

―카카오 등 부가통신사업자에 대한 후속 법제화에 대한 의지는.
▲홍진배 과기정통부 네트워크실장
부가통신사업자와 기간통신사업자는 법적 지위도 그렇고 보호하고 있는 여러 기술이나 제도가 범주가 달리돼 있다. 이번에 원인 분석을 정밀하게 하고 제도 개선 필요성을 고민을 할 것이다. 부가통신사업자들의 경우에도 서비스 안정성 확보를 위한 제도 보완 사안이 있는지 조치를 취할 계획이다.

―이용자 피해보상에 관련해 정부가 어디까지 개입할 계획이고, 의견 조율 어디까지 진행됐나.

▲홍진배 과기정통부 네트워크실장
본격적으로 논의한 상태는 아니지만, 관련 사업자분들이 고민하고 있을 것이라고 생각한다. 관계사업자들과 협의해서 진행할 계획이다.

―서비스 일부만 복구된 상태인데, 완전 복구까진 어느 정도 기다려야 하나. 지금 대통령 지시에 따라서 방송통신재난대책본부로 격상됐는데, 그 경우 어떤 활동을 하는지.
양현서 카카오 부사장
우선 이용자분들의 카카오 서비스 이용에 불편을 끼쳐 진심으로 죄송하다. 아시다시피 이번 데이터 센터의 큰 화재로 인해서 저희 서버가 대량으로 유출된 상황이다. 판교 데이터센터를 가장 메인 데이터센터로 쓰기 때문에 여기에 3만2000대 정도 서버가 구축돼 있다. 그 전체 전원 공급이 차단된 상태여서 이중화 조치가 돼 있음에도 불구하고, 서버를 증설해 트래픽을 전환하는데 꽤 많은 시간 걸리고 있다. 현재까진 1만2000대가 복구된 상황이고, 오후에 전원 공급이 되면 좀 더 추가적으로 서버 재개가 가능할 것으로 예상된다. 화재 현장이라 진입이 어려운 점이 있었고, 좀 더 시간 지연되고 있어서 현재 최선 다하고 있지만 전원공급에 따라 복구 시간이 언제가 될 지 확실히 말할 수 없는 점 양해 부탁드린다.

▲홍진배 과기정통부 네트워크실장
4단계 재난 대응 체계가 있는데, 방송통신재난대책본부는 가장 상위 단계의 대응 레벨이라고 볼 수 있다. 제도적 보안 사항 도출 및 사고 조사를 넘어서 디지털 보안조치 등 국내 모든 역량 다 동원해서 진행할 계획이다.

―역대 가장 긴 시간으로 카카오 서비스가 안 됐고, 복구가 굉장히 늦어지고 있다. 전국 여러 곳에서 서버를 분산해서 운영하고 있다는데, 왜 이렇게 늦어지나. 재발방지 대책 중요할 것 같다.
양현서 카카오 부사장
현재 카카오는 4개로 데이터 센터 서버를 분산해두고 있다. 그중 SK C&C를 메인으로 사용하는데 3만2000개 전원이 다 다운된 것이다. 화재 현장이라서 진입해서 작동하는 게 어려운 부분이 커 지연이 됐다. 보통 카카오톡은 장애가 발생하면 20분 내로 대응하자는 원칙을 최우선으로 하고 있는데 현재 서버 송출량이 커서 장애가 지연되고 있는 점 굉장히 죄송하게 생각하고 있다. (3만2000대 서버가 다운된다는 게) 역사상 유래가 없는 상황이어서 그런 점에서 대처에 어려운 점이 있었다고 생각하고, 앞으로 이런 상황 대비해서 서버 증설 등 재발방지 대책을 마련해서 최대한 노력하겠다.

―불이 나서 (서버가) 차단된 건데 이런 경우를 충분히 예상할 수 있지 않았나. 2차, 3차로 전력을 공급하는 부분 등 대책이 없었나.
▲김완종 SK C&C 클라우드 부문장
이렇게 극단적 상황은 처음 일어나는 일이었다. 자체 데이터 센터 내에는 비상 전원을 공급할 수 있는 장치 등이 존재한다. 다만 최악(워스트)의 케이스까지 저희가 이번 계기를 계기로 고민할 것이다. 향후 기술적 방안에 대해서 검토를 하도록 하겠다. 또한 전원이 차단된 이유는 화재를 진입하려면 물을 사용해야 하는데 이때 안전 위험이 있을 수 있어서 전원을 차단하고 화재 진압했다. 추후 워스트 케이스에 대응하는 방안을 세밀하게 마련하겠다.

―SK C&C에서 기업 서비스 운영도 많이 하고 있는 걸로 알고 있는데, 피해나 대책은.
▲김완종 SK C&C 클라우드 부문장
IBM 쪽과 긴밀히 협력해서 전원 공급을 재개하고, 복구 작업을 진행하고 있다. IBM 클라우드는 SK그룹사도 많이 이용 중인데 복구가 거의 이뤄진 상태다.

―데이터 손실 가능성은 없나.
▲양현서 카카오 부사장
저희 데이터는 분산 저장돼있고, 시스템도 이원화 돼 있다. 데이터 손실 우려는 0%라고 보면 된다.

―현행법 위반 소지는 없는지? 넷플릭스법(개정 전기통신사업법)이라고 해서 일부 서비스 사업자들에 망 서비스 안정성 의무가 있다고 알고 있다.
▲홍진배 과기정통부 네트워크실장
전기통신사업법 22조7항에 관련 규정이 있다. 어제부터 자료 제출 요구를 상황이고, 조사분석을 통해 어느 정도 위반 있는지 조사해보고 추후에 말하겠다.

―SK C&C 데이터센터를 메인으로 사용했다고 했는데, 이유는. 보통 하나의 IDC를 메인으로 사용하는 경우 전체 전원이 내려갔을 때 대비는 안 했는지.
▲양현서 카카오 부사장
이곳을 메인으로 사용하고 있었던 것은 사업적 선택인데, 지리적 부분 등 여러가지를 고려한 것이다.
어제는 화재 현장이라 직접 진입해서 시스템을 수리하거나 장애를 개선할 수 있는 부분에 물리적 한계가 있었다. 카카오는 데이터센터를 안양, 송도 등으로 나눠서 운영하는데 할 수 있는 최대한으로 리스크 시나리오 세웠다고 생각했지만 화재는 예상할 수 없는 사고였다.
내부적으로 검토하고 철저하게 조사해서 대비책을 마련하겠다.

soup@fnnews.com 임수빈 김미희 김준혁 기자

fnSurvey