• 아시아투데이 로고
“SK㈜ C&C·카카오, ‘먹통 사태’ 개선 계획 한달 내 보고하라”

“SK㈜ C&C·카카오, ‘먹통 사태’ 개선 계획 한달 내 보고하라”

기사승인 2022. 12. 06. 15:52
  • 페이스북 공유하기
  • 트위터 공유하기
  • 카카오톡 링크
  • 주소복사
  • 기사듣기실행 기사듣기중지
  • 글자사이즈
  • 기사프린트
basic_2021
정부가 지난 10월 15일 발생한 SK C&C 판교 데이터 센터 화재에 대해 공식적인 조사 결과를 발표하며 사고 당사 관계사인 SK C&C, 카카오, 네이버에 개선 조치와 향후 계획 등 시정 조치를 1개월 이내에 제출할 것을 요구했다.

과학기술정보통신부는 방송통신위원회, 소방청과 6일 SK C&C 판교 데이터센터 화재 및 카카오·네이버 등 부가통신서비스 장애에 대한 조사 결과를 발표했다. 정부는 SK C&C, 카카오, 네이버 3사에게 1개월 이내 주요 사고원인에 대한 개선 조치와 향후 계획을 수립해 방송통신재난 대책본부에 보고하도록 행정지도 추진한다. 또한 각 사가 제출한 조치 결과, 향후 계획 및 재난예방·복구에 대한 의견 등은 추후 정책방안 마련에 반영할 계획이다.

방통위는 카카오 등에 대해 피해접수 전담 창구 개설과 피해보상 협의체를 마련해 실질적인 피해 구제방안을 수립·이행토록 했다. 향후 통신장애 발생 시 이용자 고지와 실효성 있는 피해 구제를 위한 법령 및 이용약관 등 개선방안을 마련할 계획이다.

과기정통부는 1개월 후 3사가 제출한 조치결과 및 향후 조치계획과 재난 예방-대비-대응-복구 전 단계별 재난관리체계 강화를 위한 전문가·사업자 의견과 법·제도 개선사항을 반영해 종합적 개선방안을 내년 1분기 중으로 수립할 계획이다.

이종호 과기정통부 장관은 "정부는 이번 사고를 계기로 주요 디지털서비스에 대한 재난대응체계를 원점에서 재검토하고 각 사업자별 개선방안, 점검결과, 제도개선 등을 종합하여 디지털 시대에 맞는 안정성 강화방안을 마련함으로써 끊김없는 디지털서비스를 제공할 수 있는 확고한 디지털 위기관리 체계를 구축해나가겠다"고 말했다.

◇ SK C&C IDC 배터리실 내 전력선·천장공간 미분리된 격벽 공간…설계 구조적 문제

SK C&C 판교 데이터센터 화재 전개는 배터리 모니터링 시스템(BMS)에서 화재 징후가 없었던 상황에서 지하3층 내의 배터리실에서 발화 시작했다. 이후 배터리실 내 상부에 위치한 전력선과 천장공간이 미분리된 격벽 공간에 있었던 일부 무정전 전원 장치(UPS)가 화재로 인한 열 등(추정)으로 손상 및 작동 중지됐다. 살수 시 누전 등 2차 피해 방지를 위해 전력 차단 조치를 결정했다.

이 장관은 "살수가 필요한 상황에서 살수로 인한 2차 피해가 우려되는 특정 구역과 차단 스위치를 단시간 내 식별할 수 없어 선별적 차단 조치가 이뤄지지 못했다"며 "화재 대비 매뉴얼은 있었으나 살수 상황, 발화 구역 등 실제 화재상황 수준까지 반영한 세부 대응계획 및 모의훈련 또한 없었다"고 설명했다.

이에 정부는 SK C&C가 데이터센터 내 구조적 안전성을 위해 배터리와 전기설비 간 물리적 공간을 분리하고, 전력선 재배치 등을 대안 조치 강구를 요구했다. 홍진배 과기정통부 네트워크정책실장 "리튬 배터리의 경우에 (규모가 크면) 살수를 통해서 진압할 수 밖에 없는데, 이를 위해서는 베터리가 자체가 겹겹이 구분돼야 하고, 살수를 위한 배수로가 있어야 한다"며 "이번 조사에서 확인해보니 그런 구조적 부분은 안돼 있었다"고 설명했다.

또 데이터센터 화재 예방·탐지를 위해 배터리모니터링시스템 계측정보와 화재감지 시스템 구축 방안을 수립하고, 리튬이온 배터리 화재 시 필요한 소화설비 등의 구축 조치를 요구했다.

◇ "카카오, 각 단계별 체계화·자동화 미흡…서비스 다중화 요구"

카카오는 장애 탐지·전파·복구 전반에 걸쳐 기본 프로세스를 정의하고 있으나, 각 단계별 체계화 및 자동화가 미흡했다고 판단해, 서비스 다중화를 요구했다.

이 장관은 "카카오 서비스 장애 복구 지연의 핵심 원인인 '운영 및 관리도구'를 데이터센터 간 높은 수준의 다중화 적용과 핵심 기능에 대해서는 우선순위, 중요도 등을 고려해 현재보다 높은 수준의 분산 및 다중화를 적용할 수 있는 방안 수립이 필요하다"고 강조했다. 상호의존도가 높은 기능은 인증, 메신저의 메시지 수발신 등이 해당한다.

또한 이용자 고지 및 피해 구제를 위해 서비스 장애 발생 시 다양한 방식으로 신속하게 이용자에게 고지할 수 있는 체계 구축하고, 번번 장애와 관련된 국민 피해를 구제하기 위한 원칙과 기준을 설정하고, 보상 계획을 수립하도록 했다.

네이버는 보다 철저한 장애 예방과 신속 복구를 위해 서비스별 복구 목표, 장애 시나리오별 복구 방안 등을 재점검해 개선방안을 마련하도록했다.
후원하기 기사제보

ⓒ아시아투데이, 무단전재 및 재배포 금지


댓글