BLOG

[IT인프라: 클라우드] 클라우드 매니지드 서비스에 대한 생각
작성일: 2021-05-24

클라우드 시장이 급속도로 성장함에 따라, 클라우드 매니지드 서비스(Managed Service)에 대한 관심도 동반되는 상황입니다.

 

불과 10여년 전까지만 해도, IDC혹은 서버 호스팅서비스가 주를 이루던 시절, 매니지드란 개념은, 고객사의 인프라 운용은 주로 원격터미널 방식으로 진행이 되었고, 실제 인프라에 이슈가 생겼을 때, 서비스 제공자(코로케이션 혹은 서버 호스팅 사업자 등)가 IDC 데이터센터를 직접 방문하여 해결하기도 하였습니다.

 

현재는 클라우드MSP(Managed Service Provider)에서, 자체 보안 관제실을 하루 24시간 365일 관제를 함으로써, 고객사의 인프라 혹은 애플리케이션의 문제가 되는 부분이 확인이 되면, 고객사들과 협의된 커뮤니케이션 채널(SNS, 스마트폰, 이메일 등)을 통해 소통을 하여 문제를 해결하는 방식이 통용 되고 있습니다.

<메가존클라우드 24×7 관제센터 사진>

 

 

앞서 서버호스팅 사업자가 고객사의 인프라를 모니터링하고 이슈를 해결하는 방식(잦은 현장 출동)과 비교해볼때, 클라우드 보안관제 방식은 이전과 달리 매우 효율적으로 변모했다고 볼 수 있습니다. (여기서 고려해볼 수 있는 클라우드의 특성은, 인터넷만 연결되어 있다면 콘솔에 접근하여 해당 인프라를 구성(Provisioning)하고 모니터링 할 수 있다는 부분이, 매우 큰 이점입니다.)

 

실제 AWS를 기준으로 설명하자면, CloudWatch서비스를 통해 운용중인 인프라 현황(CPU, Memory 등의 사용량 등)을 실시간으로 모니터링이 가능합니다. 그러나, 고객이 주말 및 업무 외 시간까지 이런 Detail한 모니터링이 어려운 부분이 많기 때문에, 이런 부분을 클라우드 MSP에 위임할 수 있다고 볼 수 있습니다.

 

<Amazon CloudWatch Logic>

 

그렇다면, 클라우드 시장이 확장됨에 따라 클라우드 매니지드 서비스에 대한 관심이 높아지고 있는데, 과연 클라우드 MSP가 제안하는 매니지드 서비스란 무엇이며, 해당 서비스를 받기 위해 필요한 요건 등이 무엇인지, 핵심 포인트를 위주로 살펴보겠습니다.

 

1. 운영서비스(MSP)의 정의와 장점, 그리고 도입 목적

 

1) 클라우드 매니지드 서비스의 정의

기업의 클라우드 인프라와 클라우드 기반의 시스템을 운영 및 관리하는 IT 운영 서비스입니다. 클라우드에 최적화된 기술 지원을 통해 반복되는 IT서비스를 자동화하고, 이슈/장애 발생 시 신속하게 처리합니다. 클라우드 환경으로 처음 이전하거나 클라우드 운영 경험이 없는 대부분의 기업들이 온프레미스 환경과 다른 클라우드 운영 환경으로 인해 어려움을 겪는 경우가 많습니다. 클라우드 MSP(Managed Service Provider)의 경우, 24x7x365지원 체계와 폭 넓은 지원 범위를 기반으로 고객의 클라우드 내 컴퓨팅, 스토리지, 데이터베이스, 네트워크, 보안, 백업, 애플리케이션 등 고객이 운용하고 있는 IT인프라 및 애플리케이션의 다양한 영역을 안정적으로 운영하도록 돕습니다.

 

 

2) 클라우드 Managed Service, 왜 사용해야 하나?

앞서 서술한 내용 처럼, 클라우드MSP가 제공하는 클라우드 매니지드 서비스의 장점은, 하루 24시간동안 문제없이 클라우드를 운용하고자 하는데 여력이 필요한 업체 혹은 엔지니어들이 클라우드MSP사업자를 통해 모니터링 보안 관리, 리소스 관리, 장애 관리, 보고 관리, 비용 관리와 같은 다섯 가지의 요소를 표준으로 삼아 클라이언트의 클라우드 인프라를 안정적으로 관리해 주는 형태라 할 수 있습니다.

 

클라우드 매니지드 서비스를 계약하게 되면 수 많은 이점들이 있습니다.

 

우선 운영적인 측면에서는 고객사의 클라우드 리소스를 효율적으로 사용할 수 있도록 도와줍니다. 또한, 전반적인 운영을 클라우드MSP 측에서 하게 되면서, 기존 담당자는 모니터링, 리소스 관리 등 운영 업무에 시간을 할애하지 않고 보다 비즈니스적인 업무에 집중할 수 있게 됩니다. 또한, 클라우드MSP의 모니터링 전담 팀을 통해 하루 24시간 일년 365일 내내 항상 모니터링을 받음으로써, 장애 대응에 취약한 새벽이나 주말에도 상관없이 안정적인 운용이 가능하기도 합니다.

 

또한, 기술적인 측면으로는 클라우드MSP의 자체개발된 기술 서포트 포탈을 통해 클라우드 관련 기술 지원을 빠른 시간 안에 받으실 수 있는 점이 있고, 새로운 클라우드 신기술에 대해서도 빠르게 이용해볼 수 있도록 교육을 지원하기도 합니다.

 

마지막으로, 비용적인 측면에서는 클라우드MSP에서 제공하는 정기적인 최적화 작업을 통해 불필요한 비용을 제거하고 최적화된 구성 제안을 통해 저비용 고효율의 인프라를 운영할 수 있습니다.

 

 

3) 어떤 기업들이 클라우드 Managed Service를 도입해야 하나?

다양한 유형의 기업에서 필요로 할 수 있습니다.

 

예를 들면, 클라우드 관련 인력이 부족하거나, 운영 관련 고도화가 필요할 경우 활용해보길 추천합니다. 실제로 기업의 규모와 상관없이 스타트업부터 대기업까지, 또 게임사, 금융권, 제조사 등 다양한 분야의 기업들이 클라우드 매니지드 서비스를 사용하고 있습니다.

 

 

4) 어떻게 클라우드 Managed Service를 도입할 수 있나요?

Managed Service 운영을 시작하기 전에 몇 가지 고려해야 할 사항들이 있습니다. 새로운 인프라를 구축하려는 경우라면, 구성하려는 인프라 특색에 맞게 구축을 진행한 후에 운영하게 됩니다. 별도로, 온프레미스에서 운영 중인 인프라를 마이그레이션하는 경우라면 우선 현재 인프라 구성 정보와 리소스 정보를 고객사와 커뮤니케이션하여 산정하게 되고 산정이 완료되고 나면 운영을 위한 클라우드 계정 생성 및 모니터링 세팅을 진행합니다. 이렇게 모든 세팅이 완료된 시점부터 본격적인 운영이 시작되는 것입니다.

 

클라우드 매니지드 서비스 도입 이전에 고객이 미리 자신들의 워크로드를 클라우드에 구축을 했는지 안했는지 여부는 클라우드 매니지드 서비스 도입에 크게 문제는 되지 않습니다. 다만, 클라우드 리소스 구성 이후에는, 클라우드MSP측과 매니지드 서비스 구성 논의시, 이미 구성된 아키텍처에 대한 의도나 히스토리 파악 시간이 좀 더 필요하기 때문에, 해당 부분은 고려하고 진행하는게 좋을 것이라 생각합니다.

 

 

5) 모니터링이 이루어지는 범위와 모니터링에 따른 알람 소통 등은 어떻게 이루어지는지?

기본적으로 클라우드MSP가 제공하는 모니터링은 인프라 레벨에서 애플리케이션 레벨까지 다양한 형식으로 제공됩니다. 해당 부분은 당연히 클라우드MSP와 잠재 고객간에 논의가 된 사항에 대해 적용되며, 모니터링 범위가 넓어질 수록 당연히 클라우드MSP가 고객에게 청구하는 비용을 높아지는 구조입니다. 단, 클라우드를 이용하는 기업(혹은 유저)들이 급격히 늘고 있어, 가격 체계에 대한 부분도 합리적으로 운용하려는 트렌드가 있습니다.

 

클라우드MSP의 고객사가 되고 난 뒤, 모니터링 관련 부분은 특별히 정해진 형식은 없지만, AWS의 경우 CloudWatch를 활용하거나 3rd Party Tool(Zabbix, New Relic)등을 용도에 맞게 활용하고 있고, 비상시 알람 발송은 클라우드 매니지드 서비스 도입 시 모니터링 세팅을 위한 협의 과정에서 알람 채널과 알람 방법을 함께 정하게 됩니다. 알람은 일반적으로 SNS, 메신저, E-mail 등을 통해 받아볼 수 있습니다.

 

크리티컬한 알람의 경우에는 협의된 채널을 통해 알람을 받게 되며, 이 채널에는 클라우드MSP 담당자도 포함이 되어 있어 알람을 받는 즉시 담당자가 그에 맞는 대응을 하는 로직이 일반적입니다.

 

 

6) 클라우드 매니지드 서비스의 가격은 어떻게 되나요?

아무래도 클라우드 매니지드 서비스 도입검토에 가장 궁금한 사항은 가격일 것입니다. 보통 가격은 클라우드MSP사와 협의에 따라 결정되는데, 직관적으로 보면, 서버(VM)댓 수별로 가격을 매기거나, 클라우드 사용량 기반 퍼센티지(%) 요율로 결정하는 것이 일반적입니다.

 

Tier는 Basic/Standard/Advanced/Premier 등의 단계로 보통 3~4단계로 나눌 수 있습니다. 실제 Tier가 상승할수록, 기본 인프라레벨의 서비스 모니터링 부터, 원할 경우 리소스 프로비저닝(Provisioning)을 지원받을 수 있고, 관리하는 세그먼트자체가 OS, Database, Application까지 협의에 따라 달라집니다. 만약 Application레벨까지 모니터링&알람 등을 원할 경우, New Relic과 같은 App모니터링이 가능한 3rd Party솔루션의 라이센스 비용이 추가될 수 있다는 것을 인지하면 도움이 됩니다.

 

모니터링과 인프라 세팅 외에도, 월/분기/반기/연간 인프라 구성 및 비용 최적화 및 리포트 까지 Customizing을 원하는 필터를 넣으면, 구성이 가능한 부분들이 있으니, 클라우드MSP업체와 논의시 가급적이면 상세하게 자사의 서비스 운용사항에 맞게 논의를 해나가면 도움이 될 것입니다.

 

 

2. M사의 클라우드 매니지드 서비스 실제 사례

1) 사용자의 클라우드 서비스(기술) 이해도 부족에 따른 오용을 Correction 해준 사례

사실 클라우드MSP가 고객사의 인프라를 대상으로 매니지드 서비스를 진행하게 되면, 매우 다양한 사례가 생깁니다. 그 중에, 고객이 AWS서비스에 대한 이해가 어려워서 발생했던 사례를 하나 설명해보겠습니다.

 

AWS의 데이터베이스 서비스 중에 Amazon RDS(Relation Database Service: 관계형 데이터베이스 서버)에는 Multi-AZ(Availability Zone)라는 이중화의 개념이 존재하는데, 이는 RDS를 여러 가용 영역에 구성함으로써 가용성을 증가시키는 서비스입니다. 한 고객사에서 이 Multi-AZ와 Read Replica(읽기 복제본: 워크로드의 읽기 성능을 향상시키는데 사용됨) 개념을 헷갈려 가용성을 높이려는 목적으로 Multi-AZ 구성이 아닌 Read Replica를 구성했던 적이 있습니다.

 

실은 이 두 가지의 개념은 매우 큰 차이가 있습니다.

 

Multi-AZ의 경우에는 Active-Standby 개념으로 한 쪽에서 장애가 발생하는 경우 다른 한 쪽으로 자동으로 Fail-over됨으로써 장애조치 및 복구 시간을 최소한으로 줄일 수 있는 반면, Replica의 경우에는 확장성과 관련된 개념으로 Active 한 Database 한 대와 그를 그대로 복제한 Read Replica를 생성하는 것입니다. Multi-AZ와는 다르게 두 Database 모두 Active한 상태이며, Replica는 Read-Only만 가능한 Database입니다.

 

고객이 처음 클라우드를 사용하는 경우가 많다보니, 이런 세부적인 내용에 대해 정확한 용도를 이해하고 구성하는 부분이 부족할 수 있는데, 이런 부분들을 클라우드MSP업체 측에서 교정해줄 수 있습니다.

 

 

2) 고객의 클라우드 서비스 사용 관련 불필요한 비용이 발생하지 않도록 조치해 준 사례

모 클라우드MSP의 한 고객사는 AWS를 굉장히 열심히 사용하는 고객사가 있었는데, 해당 고객사의 월간 보고서를 분석하던 중 비용이 서서히 증가하는 부분을 확인하였고, 이를 분석하는 과정에서 EBS(Elastic Block Storage)라는 스토리지 백업을 지속적으로 하는 것을 알게 되었습니다. 이러한 경우 백업데이터를 보관 해야 하는 주기를 정하여 보통은 정한 주기보다 오래된 백업 볼륨을 삭제함으로써 비용을 절감할 수 있습니다. 해당 내용을 권고 드려 자동으로 삭제가 되도록 조치를 취했으며, 이로 인해 비용을 크게 절감할 수 있었습니다.

 

 

3) 모 아이돌 그룹의 대규모 런칭 이벤트

클라우드 매니지드 서비스를 도입한 모 고객사(업체)에서, 모 아이돌 그룹을 주제로 이벤트를 한 적이 있습니다. 해당 아이돌 그룹은 어떤 업체에서 어떤 이벤트를 하든 서비스에 대한 다운타임(Downtime) 등의 이슈를 발생시키지 않을까 긴장케 할 정도로 인기가 많은 그룹입니다. 얼마 전에는 그 그룹의 컴백 무대를 진행하는 클라우드 매니지드 서비스 사용 고객이 있었는데, 해당 고객은 클라우드 인프라를 도입한 지 얼마 안되었을 때였기 때문에, 무엇을 준비해야 하는지 모르고 계셨다고 합니다.

 

여기서 클라우드MSP사업자의 매니지드 서비스가 순기능을 하게 되는 포인트를 확인할 수 있는데, 아래와 같습니다.

 

관련 이벤트시, 트래픽이 폭증할 것에 대비해서 클라우드MSP측이 미리 AWS와의 커뮤니케이션을 통해 로드밸런서와 서버를 증설시킨 후 고객사와 함께 카운트 다운을 했습니다. 이벤트가 시작 되자마자 트래픽이 치솟았고, 웹페이지 지연 이슈가 발생했습니다. 이벤트를 원활하게 진행하려고 기존 대비 2배 수준의 서버를 증설해두었는데 이슈가 발생해서 바로 원인분석을 했고, 당시에 모니터링 지표 상으로는 문제가 없어 보여 OS 내부 이슈로 의심이 되는 상황이었다고 합니다. 해당 사항에 대해 클라우드MSP측이 고객사에 전파해서 빠른 조치 후 성공적으로 이벤트를 마무리를 했습니다.

 

클라우드 MSP가 특정 이벤트를 위해 미리 인프라를 Provisioning하고, 이벤트 시, 각 layer별 이슈에 대해 모니터링을 하였기 때문에, 이슈를 바로 발견할 수 있었던 케이스입니다. 만약 클라우드 활용 업체가 이런 이벤트를 단독으로 진행하고자 한다면, 신경쓰지 못하는 부분이 많을 수 밖에 없고, 이런 부분이 자사 고객들의 신뢰를 잃어버릴 수 있기 때문에, 클라우드MSP사업자를 통해 그들의 다년간의 경험을 활용한, 클라우드 매니지드 서비스를 도입하는 부분도 운영하는 워크로드에 따라 중요한 부분일 것으로 생각합니다.

 

 

결론

본문 내용에 서술했지만, 클라우드 매니지드 서비스의 정의, 특징, 장점, 활용 사례를 살펴보면서, 실제로 어떤 워크로드를 클라우드상에서 운영하게 될 때 도움을 받을 수 있다는 견해는 각자의 판단에 맡기고 싶습니다. 회사 예산에 여유가 된다면, 당연히 도입해서 활용하는 것이, 클라우드 인프라를 보다 안정적으로 활용하는 데 도움이 될것이라 생각하지만, 모든게 가성비(ROI: Return on Investment)를 따지듯, “처음 클라우드를 활용하여 서비스를 진행하는 고객이, 수년 간의 경험이 농축된 클라우드 사업자를 통해 자사의 크리티컬한 서비스를 지원을 받는 다는 상황”을 가정할 때, 클라우드 매니지드 서비스 도입에 대한 Go/No-Go 여부가 결정될 것으로 보입니다.

Written by 메가존클라우드 Global Growth Group 임성은 매니저