Back
Key Takeaway
Nền tảng golf đã chuyển đổi sang cloud với thời gian ngừng hoạt động tối thiểu trong 3 tháng và tiết kiệm chi phí 45%
Chúng tôi đã chuyển toàn bộ hệ thống sang OCI trong vòng 3 tháng với phương pháp ngừng hoạt động tối thiểu, giảm chi phí cloud so với AWS từ 30~45%, đồng thời cải thiện hiệu suất API thời gian cao điểm đặt chỗ và tính ổn định xử lý tin nhắn.
Smartscore
Client :Smartscore
Industry :Software
Service Area :Cloud Migration & Modernization / Managed Services / Cost Optimization
Applied Solution :OCI Compute / OCI MySQL / OCI Streaming with Apache Kafka / OKE / Logging & Monitoring
1. Tổng quan (Nền tảng dự án)
SmartScore là nền tảng golf lớn nhất trong nước được sử dụng bởi hơn 2 triệu người, và do đặc thù của dịch vụ với lưu lượng truy cập tập trung theo thời gian thực trong các hoạt động như đặt chỗ, vòng chơi, thanh toán và thông báo, tính ổn định và cấu trúc chi phí có thể dự đoán được là rất quan trọng.
Trong môi trường AWS hiện tại, chi phí cho Compute, RDS, NAT Gateway, Confluent SaaS và các dịch vụ khác liên tục tăng, dẫn đến gánh nặng vận hành gia tăng.
Do đó, SmartScore đã quyết định chuyển toàn bộ hệ thống sang Oracle Cloud Infrastructure (OCI) để tối ưu hóa hiệu suất và giảm chi phí, và đã hoàn thành dự án chuyển đổi trong 3 tháng bằng phương pháp ngừng hoạt động tối thiểu (minimal downtime) để giảm thiểu tác động đến dịch vụ.
2. Thách thức (Định nghĩa vấn đề)
Chi phí AWS tăng vọt: Chi phí RDS IO, lưu trữ, sao lưu, NAT Gateway và chuyển dữ liệu tăng
Giới hạn trong việc xử lý lưu lượng đặt chỗ vào giờ cao điểm dẫn đến độ trễ xử lý API
Cấu trúc chi phí không hiệu quả của Confluent SaaS: Chi phí hàng năm tăng vọt khi lượng tin nhắn tăng
Thiếu khả năng hiển thị FinOps khiến khó khăn trong dự báo và quản lý chi phí
Cấu trúc chi phí cơ sở hạ tầng cao để chuẩn bị mở rộng dịch vụ mới
3. Giải pháp (Phương pháp giải quyết)
Thực hiện chuyển đổi toàn bộ hệ thống trong 3 tháng bằng phương pháp ngừng hoạt động tối thiểu (Full Lift-and-Optimize).
Chuyển đổi Compute & API Server: Ổn định hóa dựa trên Compute E4/E5 và giới thiệu cấu trúc tự động mở rộng OKE.
Tối ưu hóa cơ sở dữ liệu: Giảm chi phí IOPS và lưu trữ thông qua OCI MySQL và phân tầng Block Volume.
Xây dựng OCI Streaming với Apache Kafka lần đầu tiên ở APAC: Thay thế hoàn toàn Confluent SaaS hiện tại.
Tích hợp Logging & Monitoring: Giảm chi phí so với CloudWatch và tăng cường tốc độ phát hiện và ứng phó sự cố.
Xây dựng hệ thống FinOps dựa trên Universal Credit: Cố định chi phí và đảm bảo khả năng hiển thị chi phí thông qua gắn thẻ theo dịch vụ.
4. Kết quả (Thành tựu)
Chuyển đổi toàn bộ hệ thống một cách ổn định trong 3 tháng bằng phương pháp ngừng hoạt động tối thiểu.
Giảm 30-45% tổng chi phí đám mây so với AWS.
Giảm tối đa 50% chi phí trong lĩnh vực cơ sở dữ liệu.
Loại bỏ Confluent SaaS để đạt được cấu trúc tiết kiệm hàng trăm triệu đồng hàng năm.
Xây dựng OCI Streaming (Kafka) lần đầu tiên ở APAC và giảm tỷ lệ độ trễ xử lý tin nhắn 25%.
Cải thiện 30% tỷ lệ độ trễ phản hồi API vào giờ cao điểm đặt chỗ.
Giảm 35% gánh nặng nhân lực vận hành.
Đạt được khả năng dự báo chi phí để hỗ trợ mở rộng dịch vụ ổn định.






