매일신문

'exit' 한 단어에 KT 전국망 마비…정부 "안전장치 없었다"

KT 장애, '명령어 누락' 원인…장비 교체하며 협력업체 직원만 투입

KT 인터넷망이 25일 오전 11시 20분께부터 전국곳곳에서 장애를 겪고 있다. 사진은 이날 인터넷 연결이 끊어진 모바일과 PC화면. 연합뉴스
KT 인터넷망이 25일 오전 11시 20분께부터 전국곳곳에서 장애를 겪고 있다. 사진은 이날 인터넷 연결이 끊어진 모바일과 PC화면. 연합뉴스

지난 25일 전국적으로 발생한 KT 네트워크 장애는 부산 지역에서 장비를 교체하며 작업자가 명령어 한 단어를 누락하면서 시작된 것으로 드러났다.

내부 안전장치가 없던 탓에 명령어 입력 실수 30초만에 부산, 서울을 거쳐 전국적으로 문제가 확산됐다.

당시 관리자 없이 협력업체 직원끼리만 낮에 네트워크도 분리하지 않은 채 장비를 교체한 점도 파악돼 관리상 문제도 드러났다.

과학기술정보통신부는 28일 KT 장애와 관련해 정보보호·네트워크 전문가로 구성된 사고조사반과 함께 원인을 조사·분석한 결과를 발표하고 이같이 밝혔다.

조사 결과 네트워크 장애는 지난 25일 오전 11시 16분쯤부터 낮 12시 45분쯤까지 약 89분간 발생했다.

최초 KT DNS(도메인 네임 시스템·Domain Name System) 서버에서 평소보다 트래픽이 급증한 것이 네트워크 장애로 이어졌다.

관련 로그 기록을 분석한 결과 부산국사에서 기업 망 라우터(네트워크 경로 설정 장비) 교체 작업 중, 작업자가 잘못된 설정 명령을 입력했고 이후 라우팅(경로 설정) 오류로 이어졌다.

작업자는 사고 발생 라우터에 라우팅 설정 명령어 입력을 마무리하면서 'exit' 명령어를 누락한 것으로 파악됐다.

이에 따라 보더 게이트웨이 프로토콜(BGP·Border Gateway Protocol)로 교환돼야 할 경로 정보가 내부 게이트웨이에 쓰이는 IS-IS 프로토콜로 전송됐다.

통상 1만 건 내외 정보를 교환하는 IS-IS 프로토콜에 그 수십만배 규모인 BGP 정보가 몰리면서 라우팅 경로에 오류가 발생한 것이다.

부산 지역 라우터에 잘못된 라우팅 경로가 설정된 것이 다른 지역 IS-IS 라우터에도 전달됐고, 전국 모든 지역 라우터와 연결된 서울 혜화 센터와 구로 센터가 오류 확산의 허브 역할을 하며 30초만에 전체 라우터에 오류가 전파됐다.

과기정통부는 "특히 KT의 IS-IS 프로토콜은 잘못된 데이터 전달에 대한 안전장치 없이 전국을 하나로 연결하고 있었기 때문에 하나의 잘못된 경로 업데이트가 전국 라우터에 연쇄적으로 일어나면서 장애가 전국으로 확산했다"고 설명했다.

당초 새벽 1∼6시에 하는 야간작업으로 승인된 작업을 대낮에 수행하고, 작업 관리자 없이 협력업체 직원들끼리만 라우팅 작업을 수행하는 등 관리상 문제점도 존재했다.

사측이 최초 원인으로 지목했던 디도스(분산서비스거부·DDoS) 공격은 없었음이 확인됐다.

과기정통부는 이번 사고를 계기로 주요 통신사업자와 네트워크 안정성 확보방안을 마련할 계획이다.

방송통신위원회는 KT의 이용자 피해구제 방안 이행 여부를 점검하는 한편 통신장애 발생 시 실효성 있는 피해구제를 위한 법령 및 이용약관 등 개선방안 마련을 검토중이다.

많이 본 뉴스

일간
주간
월간