국가정보자원관리원 화재사고, 무엇을 점검해야 할까
국가정보자원관리원 화재사고, 무엇을 점검해야 할까
왜, 국가 데이터센터의 화재 리스크가 중요한가
국가정보자원관리원은 중앙부처의 전산을 통합 운영하는 핵심 인프라를 맡고 있습니다. 대전·광주·대구 등 권역 센터로 분산되어 있으며, 2024년 대구센터 개청 등으로 공공 클라우드 전용 인프라를 확충해 왔습니다. 이런 구조는 자연재해나 설비 사고에 대한 회복력을 높이기 위한 것입니다. 관리원의 보도자료 목록을 보면 2024년 상반기에는 대구센터 개청과 범정부 통합구축 사업 공고 등이 확인되며, 같은 기간 화재 관련 공지는 보이지 않습니다. 즉 현재 시점 기준으로는 실제 화재 발생 사실이 공식 확인된 바 없다는 점을 먼저 분명히 합니다. 다만 데이터센터 화재는 국내외에서 반복적으로 발생해 왔고, 공공 서비스 특성상 대비와 시뮬레이션이 평시의 과제입니다. 이를 전제로 핵심 점검 항목을 정리합니다.
1. 민간 대형 사고가 남긴 교훈
2022년 10월 SK C&C 판교 데이터센터 화재는 리튬이온 배터리 계통에서 시작되어 장시간 서비스 장애로 이어졌습니다. 카카오톡을 포함한 주요 서비스가 광범위하게 중단되며 데이터센터의 전력·배터리·화재확산 방지 체계가 사회 인프라라는 사실을 각인시켰습니다. 이후 정부는 대형 데이터센터를 포함해 안전점검과 관리기준을 강화했고, 배터리관리시스템과 화재탐지 설비, 방화 구획 등 세부 항목 점검을 예고했습니다. 이런 흐름은 공공센터에도 동일하게 적용되는 기준선입니다.
2|공공 인프라의 분산과 이중화
행정안전부는 2025년까지 행정·공공기관 정보시스템의 클라우드 전환과 통합 운영을 추진해 왔습니다. 공공기관의 디지털 서비스가 변화에 유연하게 대응하고, 동시에 장애·재난에 강한 구조로 만들기 위함입니다. 국가정보자원관리원의 권역 분산 구조와 민관 협력형 클라우드 존 구축 같은 시도는 이러한 정책 방향과 궤를 같이합니다. 분산·이중화 전략은 화재처럼 국지적 재난이 발생해도 대국민 서비스를 유지하기 위한 핵심 설계 원칙입니다.
데이터센터 화재가 커지는 이유
데이터센터 화재는 세 가지 특징을 가집니다.
- 첫째, 배터리와 전력 계통의 열폭주 가능성입니다. 비상 전원장치용 리튬이온 배터리에서 시작된 열폭주는 초기 진화를 어렵게 만들 수 있습니다.
- 둘째, 연기와 부유 입자의 확산입니다. 건물 관통부 실링이 취약하면 민감 구역으로 연기가 침투해 테이프·디스크 매체 오염과 장비 오류를 유발할 수 있습니다.
- 셋째, 온도 스트레스입니다. 저장 매체는 주위 온도 상승에 취약하며 일정 임계 이상에서는 데이터 손상이 발생할 수 있습니다. 이 세 요소는 화재 자체의 크기와 별개로 서비스 가용성에 직접적인 영향을 미칩니다.
사실 점검|지금 우리가 아는 것과 모르는 것
- 첫째, 국가정보자원관리원의 공식 채널에는 2024~2025년 사이 화재 관련 공지가 없습니다. 이는 ‘사고가 없었다’는 확정이 아니라, 최소한 공식 발표는 없다는 의미입니다.
- 둘째, 정부는 대형 데이터센터를 대상으로 화재·전원·감시 체계를 강화해 점검해 왔습니다.
- 셋째, 민간 사고의 조사 결과는 공공 영역의 예방 기준으로 재활용되고 있습니다.
- 넷째, 2024년 대구센터 개청 등 분산 아키텍처 확대가 진행되어 왔습니다. 이 네 가지 사실은 ‘가정된 화재사고’에 대비해 우리가 점검할 우선순위를 제시합니다.
핵심 체크 : 국가 데이터센터 관점의 10가지
- 배터리관리시스템의 10초 단위 이상 실시간 계측과 이상 징후 경보 수준입니다.
- UPS 룸과 배터리 룸의 방화 구획과 방화문 성능, 방화포 설치 여부입니다.
- 연기·가스 감지기와 영상 기반 모니터링의 다중화입니다.
- 공조·덕트 관통부 실링 상태와 연기 확산 시나리오입니다.
- 케이블 트레이 온도·누전 IoT 센서 적용 범위입니다.
- 전력 이중화와 자동 절체, 비상 발전기 가동 테스트 주기입니다.
- 화재 시 조기 전원 격리 및 서비스 측면의 즉시 페일오버 절차입니다.
- 정기 모의훈련과 교대조 단위의 역할 매뉴얼입니다.
- 다중 리전 DR 리허설 주기와 RTO/RPO 합의입니다.
- 재난 커뮤니케이션 프로토콜과 대국민 공지 템플릿입니다. 민관 모두에서 권장되는 항목이며, 최근 점검 지침과 민간 사례의 교훈을 반영한 기본선입니다
'먹통' 을 줄이는 설계의 원칙
데이터센터는 물리·전기·통신 설비의 복합체입니다. 서비스 중단을 최소화하려면 액티브-액티브 이중화, 리전 간 트래픽 자동 우회, 데이터 동기화 정책이 현실적으로 작동해야 합니다. 특히 공공서비스는 ‘중단 없는 민원’이 기본이므로, 백오피스와 프런트 서비스의 분리, 정적 콘텐츠 캐시, 콜센터 안내문 자동 갱신 등 시민 접점 설계가 중요합니다. 민간 대형 사고 후 SK C&C가 전력 이중화·탐지 추가장비를 보강한 것처럼, 공공도 물리·논리 양면의 보강을 병행해야 합니다.
분산은 기본, 로컬-에지와 재난훈련이 답입니다
- 첫째, 권역 센터 간 상호 백업에 더해 지자체 공동 ‘경량 에지 노드’를 활용해 민원·고지 등 기본 기능을 유지하는 구조를 권합니다.
- 둘째, 연 1회 이상 범정부 합동 재난훈련에서 데이터센터 시나리오 비중을 확대해야 합니다.
- 셋째, 배터리 룸은 건축·전기·소방 3개 법령을 한 번에 만족하는 통합 가이드를 빠르게 제정·보급할 필요가 있습니다.
- 넷째, 민관 협력형 클라우드 존을 활용해 공공-민간 간 상호 DR 계약을 실험적으로 확대할 시점입니다.
공공 데이터센터의 특성상 준비는 결과보다 앞서야 합니다. 민간 대형 사고의 교훈, 정부의 점검 강화, 공공 클라우드 전환 정책, 권역 분산 구조가 이미 토대를 만들었습니다. 남은 과제는 훈련과 실행입니다. 서비스는 끊김 없이, 복구는 자동으로, 공지는 투명하게 이루어지는 체계를 꾸준히 점검하는 것이 가장 현실적인 안전책입니다.