Back
Key Takeaway
Cloud 기반 데이터 분석 플랫폼으로 확장성과 비용 효율을 동시에 확보
Cloud 기반 분석 플랫폼을 구축해 분산 데이터 통합, 대규모 분석·AI 활용을 가능하게 하고, Databricks와 비용 최적화 구조를 통해 확장성과 운영 효율을 동시에 확보했습니다.
Logistics (C Company)
Client :Logistics (C Company)
Industry :Logistics
Service Area :Data & AI
Applied Solution :AIR
1. Overview (Tổng quan dự án)
Dự án này được thực hiện nhằm xây dựng môi trường phân tích dữ liệu dựa trên đám mây,
cung cấp nền tảng phân tích có khả năng xử lý dữ liệu quy mô lớn và sử dụng machine learning·AI.
Chúng tôi chuyển dữ liệu Data Lake được phân tán trong môi trường on-premises sang đám mây phù hợp với mục đích phân tích,
nâng cao hiệu quả trong toàn bộ quá trình thu thập·xử lý·quản lý dữ liệu để cung cấp môi trường phân tích linh hoạt hơn.
Ngoài ra, chúng tôi tập trung vào việc xây dựng một hệ thống cho phép các chuyên gia phân tích dữ liệu tự do khám phá·phân tích·áp dụng dữ liệu,
đồng thời đảm bảo kiểm soát và tính khả dụng của dữ liệu trong môi trường phân tích do người dùng dẫn dắt.
2. Solution (Giải pháp)
Chúng tôi tiến hành từng bước tích hợp dữ liệu và nội tại hóa khả năng phân tích xung quanh nền tảng phân tích dựa trên đám mây.
Cấu hình và vận hành nền tảng phân tích dựa trên Cloud
Xây dựng môi trường tích hợp·quản lý dữ liệu được chuẩn hóa
Nội tại hóa khả năng đám mây để sử dụng và phân tích dữ liệu
3. Result (Kết quả)
Đảm bảo cơ sở hạ tầng phân tích với khả năng mở rộng và ổn định
Cấu hình cơ sở hạ tầng đám mây với độ bền cao và tính khả dụng cao
Tối ưu hóa chi phí lưu trữ thông qua ứng dụng Intelligent Tiering
Hỗ trợ nhiều phương thức thu thập dữ liệu và có thể sử dụng nhiều công cụ phân tích
Môi trường sử dụng dữ liệu được tối ưu hóa cho mục đích phân tích
Cấu hình DW dựa trên Databricks
Kiểm soát truy cập dữ liệu và quản lý quyền thông qua cổng web DP360
Cung cấp môi trường phân tích ở cấp độ nhà phân tích và quản lý hệ thống dễ dàng
Cải thiện tiện lợi trong việc thêm dữ liệu cần thiết và quản lý
Tăng cường khả năng công việc dựa trên dữ liệu thông qua nội tại hóa công nghệ
Nâng cao khả năng phân tích thông qua đào tạo Databricks và AWS
Cải thiện hiệu quả công việc bằng cách nắm bắt công nghệ phân tích mới nhất
Thiết lập nền tảng để liên tục nâng cao khả năng phân tích dữ liệu
Đạt được sự cân bằng giữa hiệu suất và chi phí
Đảm bảo hiệu quả chi phí thông qua cấu trúc tách biệt lưu trữ và tính toán
Giảm thiểu chi phí không cần thiết thông qua tính phí dựa trên mức sử dụng
Cung cấp báo cáo tối ưu hóa chi phí liên tục thông qua giải pháp thanh toán
Chặn sử dụng tài nguyên không cần thiết bằng cách sử dụng giải pháp DP360
Hiệu quả dự kiến
Đảm bảo nền tảng dữ liệu đáp ứng đồng thời tích hợp·mở rộng·tối ưu hóa chi phí
Giảm thiểu chi phí đầu tư ban đầu và tối ưu hóa chi phí vận hành
Xây dựng môi trường phân tích DW dựa trên Data Lake
Thiết lập hệ thống quản lý dữ liệu chất lượng cao dựa trên Databricks Delta Lake
Tăng cường hệ thống quản trị dữ liệu
Tự động hóa ML Ops và nội tại hóa công nghệ
Cấu hình môi trường tự động hóa ML Ops dựa trên AWS SageMaker
Cung cấp mẫu quy trình ML Ops
Tiến hành đào tạo nội tại hóa công nghệ cho nhân viên nội bộ






