NEWS LETTER

메클레터 6월호|2025년, 181ZB 데이터의 등장이라…🤔|AI 시대의 데이터 분석을 위한 백서📑 다운받기
작성일: 2024-07-02

안녕하세요, 메클레터 독자님들!
이 온도, 이 습도…💦어느새 성큼 다가온 여름의 초입에서 인사드립니다.🙇‍♂️

 

데이터의 중요성이 그 어느 때보다 강조되고 있는 요즘이지만, ‘그래서 뭘 어떻게 해야 하는 건지’ 데이터 관리가 고민이신 분들도 많이 계실 것 같은데요.
그런 분들을 위해 이번 메클레터에서는 최근의 데이터 폭증 경향부터 데이터 아키텍처 도입 방법까지 데이터 고민을 해결할 수 있는 콘텐츠를 준비해 보았습니다.

 

📑본문에 메클레터 독자님들께만 공개하는 효율적인 데이터 분석을 위한, Data Lake 백서까지 알차게 담았으니 놓치지 마세요!

2025년, 181ZB 데이터의 등장이라…😮

 

넷플릭스, 유튜브, SNS, 인터넷 쇼핑… 여러분은 하루에 얼마나 많은 양의 데이터를 소비하시나요? 글로벌 데이터 분석 기업 Statita의 조사에 따르면 하루에 생성되는 데이터만 3억TB(Terabyte)이고, 2025년까지 생성되는 데이터의 총량은 무려 181ZB(Zettabyte)에 달할 것이라고 합니다.

 

데이터 저장의 시작을 기원전 2600년 파피루스의 발견으로 본다면, 인류가 처음 기록을 남기기 시작한 때부터 2000년대 초까지 만들어진 데이터가 약 20EX(Exabyte)라고 하는데요. 흥미로운 건 이 유구한 역사 가운데 2000년대 초부터 2021년까지 불과 20년 사이에 만들어진 데이터만 50ZB라는 사실입니다.
(1ZB=1024EX)

 

AI 시대의 데이터 분석🤖

 

이러한 데이터 폭증 현상이 기업의 비즈니스에는 어떤 영향을 미칠까요? 생성형 AI가 보편화되면서 많은 기업들이 그 흐름에 뒤처지지 않기 위해서 다양한 성공 사례를 만들어 내려는 노력을 하고 있습니다. 이와 함께 그 기반이 되는 데이터의 중요성도 더욱 강조되고 있고요. AI, 머신러닝, 딥러닝 모델을 훈련하는데 반드시 필요한 것이 대규모의 데이터를 처리하고 저장하는 능력이기 때문입니다.

 

데이터를 효율적으로 활용하기 위해서는 조직 내에서 많은 준비가 필요합니다. 특히 데이터 생성부터 분석 및 AI 시스템까지 원활한 데이터 흐름을 구축하는 것이 중요합니다. 이때 ETL(Extract·Transform·Load), 데이터 표준화, 비식별화 등의 절차를 거쳐야 하는데요, 만약 각 데이터 유형별로 다른 데이터베이스와 저장소를 운영한다면 밑 작업의 양이 기하급수적으로 증가할 수 있습니다.

 

또한, 대부분 많은 기업에서 데이터 관리 조직이 없거나 소수의 인원으로만 운영되어 어려움을 겪는 경우도 많습니다. 이때 각 기업의 특성과 상황에 맞는 데이터 아키텍처를 적절하게 사용하면 이러한 어려움을 보완할 수 있습니다. 지금부터 데이터 아키텍처(Data Architecture)의 종류와 이를 효율적으로 도입하는 방법에 대해 자세하게 알아보겠습니다.

데이터 웨어하우스? 데이터 레이크?🤔

 

 

데이터의 저장·수집·처리·분석 등 데이터 관리 방식 전반을 결정하는 일련의 체계를 데이터 아키텍처라고 합니다. 데이터를 어디에 어떻게 저장하고 수집하고 분석할지에 대한 방식인데요, 이 데이터 아키텍처도 기술의 변화에 맞춰 진화하고 있습니다. 가장 대표적인 것이 많이들 들어보셨을 데이터 웨어하우스(Data Warehouse), 데이터 레이크(Data Lake)입니다.

 

데이터 웨어하우스는 구조화된 형태로 변환된 데이터를 저장하는 저장소입니다. 이때 데이터는 일반적으로 테이블 형식으로 구성되며 스키마를 기반으로 정보를 저장합니다. 필요한 데이터만 추려서 저장하기 때문에 효율적으로 데이터에 접근하고 검색할 수 있으며, 기업의 데이터 분석과 비즈니스 인텔리전스(BI) 활동에 적합합니다.

 

그러나 데이터 웨어하우스의 경우 각 부서별로 데이터를 따로 관리하다보니 데이터 사일로(Silo) 문제가 발생하고, 반정형·비정형 데이터를 모두 처리해야 하는 머신러닝에 활용하기가 어렵다는 단점이 있었습니다. 이러한 문제를 해결하기 위해 등장한 것이 바로 데이터 레이크입니다.

 

데이터 레이크는 2010년대에 처음 등장한 개념으로 정형 데이터뿐만 아니라 반정형, 비정형 데이터까지 모든 종류의 원시 데이터(Raw data)를 저장하는 거대한 저장소입니다. 조직의 모든 데이터를 한 곳으로 모으기 때문에 데이터 분석, 머신러닝, 인공지능 개발 등 다양한 목적으로 활용하여 새로운 가치를 창출하기 용이하다는 장점이 있습니다. 그러나 많은 양의 데이터를 쌓아 놓다 보니 정작 데이터를 활용하기 어려운 상태가 되고마는 데이터 늪(Data Swamp)에 빠지는 경우도 있습니다.

 

두둥, 데이터 레이크하우스의 등장✨

 

이후 데이터 레이크처럼 확장이 가능한 객체 스토리지 기반이면서 동시에 데이터의 관리와 분석이 가능한 데이터 레이크하우스(Data Lakehouse)가 등장했습니다. 그야말로 데이터 웨어하우스와 데이터 레이크의 장점만을 결합했다는 평가를 받았죠.

 

데이터 레이크하우스는 원시 데이터를 그대로 저장하면서도 데이터 웨어하우스처럼 구조화된 데이터에 대한 고급 분석과 데이터의 일관성을 유지하는 ACID(Atomic·Isolated·Consistent·Durable) 트랜잭션이 가능한 것이 특징입니다.

 

 

우리 기업의 데이터 관리, 어떻게 쉽게 할 수 있을까?💾

 

많은 전문가들이 데이터 정책을 수립할 때 가장 중요한 것은 데이터를 통해 얻고자 하는 인사이트와 BI 목표를 구체화하는 것이라고 강조합니다. 이때 데이터 컨설팅부터 거버넌스 수립, 파이프라인 구축과 시각화까지 모든 단계에 걸쳐 도움을 줄 수 있는 검증된 파트너와 함께하면 비용과 시간을 효과적으로 단축할 수 있습니다.

메가존클라우드에서는 단기간 내 빠르게 프로젝트를 이행하고 고객의 데이터 활용 역량을 강화할 수 있는 Data Lab 프로그램을 운영하고 있습니다. 메가존클라우드의 Data Solutions Architect와 함께 각 기업의 환경에서 기업의 데이터를 가지고 솔루션을 디자인하고 구축할 수 있습니다. 프로젝트를 수행하며 고객사 내부의 데이터 관리 역량을 내재화할 수 있다는 것도 큰 장점입니다.

 

Data Lab 및 Data Solution Architecting에서 쌓은 경험을 바탕으로 클라우드 프로젝트에 소요되는 기간을 몇 개월이 아닌 며칠 단위로 가속화할 수 있으며, 가장 까다로운 기술적 애로사항을 해결해 줄 수 있는 최적의 솔루션 구축이 가능합니다. 우리 기업의 데이터 관리, 어떻게 잘 할 수 있을지 고민이 많다면 Data Lab과 함께 방법을 찾아보세요!

 

👉메가존클라우드 Data Lab에 문의하기

Snowflake Data Cloud Summit에서 확인한 데이터의 미래❄️

 

지난 6월 3일부터 6일, 샌프란스시코 Moscone Center에서는 Snowflake Data Cloud Summit이 개최되었습니다. AI, Apps, Data를 주제로 한 이번 Summit에는 500개 이상의 세션이 진행되었고 2만 명 이상의 참관객이 방문했다고 하는데요, Snowflake의 국내 최초 프리미어 파트너인 메가존클라우드가 이번 Summit에 빠질 수 없겠죠!😉

 

특히 올해 초 AI 전문가 Sridhar Ramaswamy가 신임 CEO로 취임한 것의 영향으로 데이터 클라우드를 강조했던 지난 Summit과는 달리 AI/ML이 매우 강조되었다고 합니다. Cortex AI, 반정형 데이터 추출을 돕는 Document AI, LLM 모델인 Arctic 등 새로운 AI 기능 업데이트와 신규 서비스 GA 소식을 확인할 수 있었고요.

 

자세한 키노트 내용과 신기술 업데이트 소식을 메클특파원들의 생생한 후기글로 확인해 보세요!

🌎Go Global🌎

해외 진출에 관심있으신가요?
글로벌 IT 시장의 트렌드도 함께 읽어요!

지난 달 Go Korea의 일환으로 진행된 일본 스타트업의 NextRise 참여에 이어 다가오는 7월에는 Go Japan의 일환으로 한국 기업이 IVS2024에 참여합니다!
IVS2024가 어떤 행사이고, 어떤 기업들이 참가하는 지 궁금하신가요?
또는, 유료 이벤트라서 참석이 고민이 되시나요?

걱정하지 마세요!
Go Japan 독자를 위해 특별히 🎫할인 코드🎫를 안내하고 있답니다. 자세한 내용은 본문에서 확인 후 gojapan@megazone.com으로 문의 주세요.

 

 

이제 베트남에서 인터넷 뱅킹을 하려면, 지문과 안면 인식을 해야한다!?
올해부터 신분증에 전자칩도 설치된다!?
베트남 전체 인구 2명 중 1명 꼴로 간편결제를 사용한다!?

 

베트남 금융권의 디지털전환(DX) 실태가 궁금하시다면 본문에서 자세한 내용을 확인해 주세요.

 

다가오는 7월 8일😉 베트남 현지에서 AWS와 MegazoneCloud가 주최하는 이벤트에 참여하여 제조 산업에 맞춰진 최신 클라우드 기술을 살펴보세요. 클라우드 기술을 사용하여 제조 프로세스를 개선하고 효율성을 높이는 방법을 배우고 업계 전문가와 소통할 수 있습니다.

-일시 : 2024년 7월 8일 09:30 – 14:00
-장소 : AWS Vietnam Office, Floor 36, Bitexco Financial Tower (베트남, 호치민)
온라인 참가 신청 바로 가기

 

 

👉글로벌 진출 문의는 여기로!