Product

MateNOC


네트워크 장애 알림 서비스


Overview


과거의 NOC(Network Operations Center)는 네트워크 이용 기업을 위해 이슈 및 장애 발생시, 음성 알림 등의 역활을 수행하는 개념이였습니다. 현재는 더 확장되어 AWS, Azure, Google Cloud 등의 클라우드 서비스 및 Datadog, Zendesk, Grafana등 서비스에서 발생되는 다양한 알림을 관리하는 개념으로 사용되고 있습니다. 또한 클라우드 시스템의 장애는 기존의 on-prem 상황과는 또 다른 성향을 보입니다. 24시간 다양한 이벤트가 발생할 수 있기 때문에 야간이나 주말에는 문자 혹은 이메일로 알림 내용을 받는 경우 중요한 대응을 놓칠 수 있습니다. 이에 클라우드메이트는 MateNOC를 개발하여 시급성과 심각도가 높은 알림은 전화로 담당자에게 알려줍니다. 만약 담당자가 작업을 수행할 수 없는 경우에는 다음 담당자에게 전화가 넘어가 이슈가 신속하게 처리 될 수 있도록 합니다. 긴급 장애 발생시, 초기 장애 대응 시간을 단축하는 한편 인력 및 이벤트 관리를 더 효과적으로 수행할 수 있도록 합니다. 

MateNOC 주요기능

기본 기능

이벤트 발생(Cloud 장애,Datadog, Bash CLI, Event 등)시 MateNOC로 알림 전달, MateNOC에서 WebHook을 통해 알림 내용을 관리자에게 음성으로 전달

세부 기능

전화 미수신 또는 이벤트 발생을 담당자가 인지하지 못할 경우 재알림 발송, 전화 수신자가 처리 불가능한 경우 다음 사람에게 자동으로 전달, 다수의 이벤트 발생 시 이벤트 건수를 숫자로 알려줌

관리자 기능
모든 이벤트와 담당자의 알림 대응 관련 기록 저장, 엑셀 문서를 통해 당직 스케줄 등록 및 관리, 중앙집중적으로 여러 팀, 부서, 조직의 알림을 통합 관리  

누구에게 필요할까요?


MateNOC는 다양한 규모의 조직에서 클라우드 서비스의 장애나 이벤트 발생 시 신속하고 효과적으로 대응할 수 있도록 돕습니다.


  • 인력이 제한적인 스타트업이나 중소기업으로 서비스의 안정성을 위해 장애, 이벤트 발생 알림을 받길 원하시는 분
  • 여러 팀과 계열사가 있는 큰 조직의 담당자로 다양한 서비스와 시스템이 있어 알림 관리가 복잡함을 느끼시는 분 

MateNOC를 도입하면 다음과 같은 이점을 얻을 수 있습니다. 


  • 강력한 알림 : 야간이나 주말에도 다양한 클라우드 환경에서 모니터링 된 알림을 전화로 받을 수 있게 연계함, 타 솔루션 대비 명확하고 강력한 알림 관리 방안 제시
  • 히스토리 관리 : MateNOC의 중앙집중적인 알림 통합 관리 기능을 활용하여, 조직 전체의 알림을 한 곳에서 효율적으로 관리할 수 있으며 에스컬레이션 상황을 감독 할 수 있음
  • 자원 최적화 : 모니터링 및 알림 전달을 시스템화 하여 담당 인력을 별도로 두지 않아도 이슈 대응을 가능하도록 함