본문 바로가기

ICT이야기

네트워크 장애 예방이 최선이다

네트워크의 장애 식별과 모니터링은 지속적인 교육을 통해 이루어졌다. 하지만 최근들어 새로운 예측 분석 툴이 등장을 하였고, 네트워크를 더욱 정밀하게 분석 하여 장애를 사전에 예측 함으로써 네트워크에 크리티컬한 장애가 발생하기 전에 문제를 해결하여 안정적인 망을 운용할 수 있게 되었다.


네트워크가 점차 동적 애플리케이션 수요에 적응할 뿐만 아니라 특수 이벤트 등에 대해 능동적으로 대처해야한다. 네트워크 운영과 관리를 위한 자동화 시스템이 많지만 급변하는 환경에 대응하고 장애 전 대응하기에는 여전히 역부족이다.


새로운 시작

머신러닝과 인공지능을 통한 네트워크 운영은 최근들어 생겨난 개념이며 방식이다. 시장에서 새로운 기술을 테스트하고 안정성을 확인하기 위해서는 상당기간 소요되며 아직은 초기 단계라고 할 수 있다. 아직은 분석 기능을 탑재한 보안 플랫폼과 사용자단의 사이에서 이루어지고 있다.


예측 분석 관련 기술은 수년 동안 AI 와 관련 분야의 덕에 크게 향상되었다. 네트워크 로그와 데이터에 기반을 둔 예측은 점차 정확해지면서 장애를 사전에 예측하게 되었다. 다시 말해 지난 수개월 동안 쌓인 로그의 분석을 통해 향후 1개월 이내 발생될 장애가 예측이 된다는 것이다. 


하지만 대부분의 네트워크 관리자를 포함 운영업체는 발전된 기술을 제대로 활용하지 못하고 있다. 분산형 스토리지를 통해 패킷 수준으로 데이터를 거의 무제한으로 활용이 가능하지만 아직 까지는 활용 가능한 기술 일 뿐 전통적 사고방식과 운용 방식에 머물러 있는 것이 현실이다. 물론 기업에서 투자를 통해 여러 시도가 이루어지고 있지만 데이터 중심 운영 모델의 혁신적인 효과를 고려한 접근방식의 부재로 교육 만으로 끝나는 경우가 많다. 

기술혁신에 의한 새로운 시작을 대하는 우리의 자세를 다시 재정비 해야 하는 시기가 도래했다고 하겠다.


네트워크 용량 예측

네트워크 용량을 업그레이드 하는 시점을 물리적인 사용량의 75%로 보고 있다. 기존 방식은 네트워크 관리자에 의해 수동으로 현재 사용률을 파악하고 현 시점에서 사용률을 반영하여 장비 업그레이드를 고려했으나 이제는 인공지능과 머신러닝 알고리즘을 통해 사용 가능한 범위를 넘어 성능 향상을 위한 지속적인 학습을 통해 용량 계획 접근 방식을 개선할 수 있다고 한다.


특히 딥 러닝은 네트워크 성능과 품질을 최적화 하는데 아주 유용한 툭이다. 로그 및 이벤트 기록이 포함된 DB가 축적된 경우 더욱 진화된 형태로 훈련될 수 있다고 한다. 따라서 용량부족 등의 문제를 사전에 예측하여 사전에 네트워크 부하가 예측됨을 관리자에게 통보하여 사전에 업그레이드가 가능하도록 할 수 가 있다. 물론 장애도 예측이 가능하다. 망의 장애를 예측하고 각 모듈의 장애를 사전에 예측하여 관리자에게 통보하여 장애를 사전에 대처할 수 있는 것이다.

앞서가는 보안

내부에 위치한 서버 및 네트워크는 방화벽이라는 장비를 통해 패킷을 차단, 드랍, 허용 함으로써 보호를 하고 있다. 보호를 하고는 있지만 100% 신뢰할 수 있는 방이란 있을 수 없다. 어떠한 경로를 통해서든 보안 위협을 당하는 것은 사실이다. 예전에도 그랬고 지금도 그렇고, 미래에도 그러 할 것은 외부에서 내부로의 공격자들의 방식은 더욱 똑똑해지고 교활하게 변하게 될 것이다. 이러한 조직적인 범죄자들로부터 내부 네트워크를 미리 보호하기 위해서는 지금과는 전혀 다른 보안 방식이 필요하다. 바로 예측하여 분석하는 것이다. 

이런 요구사항을 적극 반영한 보안 솔루션은 이미 고가에 팔리고는 있지만 왠만한 기업에서 운영하기에는 비용이 만만치 않기 때문에 크게 활성화 되지는 않고 있다. 

통계에 의하면 외부에서의 침입 보다는 내부에서의 유출이 더 심각하고 많은 비중을 차지 한다고 한다. 내부자 보안 사고를 신속히 탐지하는 것이 매우 중요하다.

비용 관리

장애를 예측하고 성능 개선에 대한 방안을 예측하고 분석하는 플랫폼은 많은 양의 네트워크 데이터를 처리 할 수 있는 능력이 있기 때문에 비용을 분석하고 개선하는데 충분히 도움을 줄 수 있다. 한편 기업이 네트워크 고도화 및 운영에 도움이 되도록 자동 분석 및 예측 솔루션은 미래의 비용을 파악하기 위한 것이므로 반드시 도입해야할 것이다.

포스팅을 마치며

네트워크 최적화를 위해 과거의 로그 및 이벤트를 명확히 정의하고 그 정의된 증거들을 수집, 정리하는 것이다. 이런 예측하고 분석하는 과정의 시작은 무턱대로 예측 분석하는 것을 하는 것이 아리라 시스템 전반의 패턴을 분석하고 이해하는 것이다. 예측하고 분석하는 과정을 단순히 솔루션이라고 생각하지 말고 실제 업무에 적용을 하기 위해서는 지금 보다 더 많은 기술 습득 과정이 필요하며 기업도 기업 차원에서 솔루션을 도입하고 교육을 실시하여 더욱 체계적인 네트워크 관리자를 육성해야 할 것이며 실제 담당자도 현재의 프레임을 깨고 바깥 세상으로 나와 또다른 기술을 습득해 더욱 진보된 네트워크 관리자가 되길 바란다.