Back
Key Takeaway
Cắt giảm độ trễ phản hồi 15 giây xuống còn 0,02 giây - Cách mạng tốc độ dịch vụ
Với môi trường container giảm 83% so với trước đây, chúng tôi đã thực hiện tốc độ phản hồi dịch vụ trung bình dưới 20ms, tối đa hóa hiệu suất xử lý lưu lượng truy cập quy mô lớn và hiệu quả vận hành.
Airlines (B Company)
Client :Airlines (B Company)
Industry :Airlines / Transportation
Service Area :Migration & Modernization / Applications & DevOps
1. Overview (Bối cảnh dự án)
B Company đã thực hiện dự án «All-in Migration & Modernization» các hệ thống khách hàng và hệ thống nội bộ từ môi trường IDC truyền thống sang cloud theo chiến lược áp dụng cloud. Vượt ra ngoài việc chỉ chuyển cơ sở hạ tầng, thông qua hiện đại hóa ứng dụng (Modernization), công ty muốn đảm bảo tính ổn định và khả năng mở rộng của hệ thống, đồng thời xây dựng một môi trường có thể phản ứng linh hoạt ngay cả trong các giai đoạn khuyến mãi có lưu lượng truy cập quy mô lớn.
2. Challenge (Định nghĩa vấn đề)
B Company đã gặp phải các thách thức kỹ thuật và vấn đề sau đây trước và trong quá trình chuyển đổi cloud.
Vấn đề độ trễ phản hồi dịch vụ
Trong dịch vụ kết nối với các công ty du lịch (OTA, Online Travel Agency), hiện tượng độ trễ phản hồi 15 giây xảy ra thỉnh thoảng, dẫn đến giảm trải nghiệm khách hàng và các vấn đề chất lượng dịch vụ liên tục.
Thiếu khả năng mở rộng linh hoạt
Khi lưu lượng truy cập tăng đột ngột do các sự kiện khuyến mãi, việc tăng máy chủ ngay lập tức gặp khó khăn, tồn tại những hạn chế cấu trúc trong xử lý truy cập quy mô lớn.
Hiệu quả vận hành kém và thiếu khả năng hiển thị
Việc rollback sau triển khai gặp khó khăn, quản lý phiên bản phức tạp, và cần phải truy cập từng máy chủ riêng lẻ để kiểm tra nhật ký, dẫn đến giảm năng suất vận hành.
3. Solution (Giải pháp)
MegazoneCloud đã thực hiện chuyển đổi kỹ thuật số toàn diện về cơ sở hạ tầng, ứng dụng và cơ sở dữ liệu thông qua chiến lược «Cloud Native Modernization» vượt ra ngoài việc chỉ chuyển đổi đơn giản (Lift & Shift).
Hiện đại hóa ứng dụng và tối ưu hóa tài nguyên
Chuyển đổi ứng dụng sang môi trường framework hiện đại dựa trên container để giảm nhẹ hiệu suất, và tối ưu hóa đáng kể số lượng container dịch vụ chính từ 24 xuống 4, tối đa hóa hiệu quả tài nguyên.
Cải thiện kiến trúc DB và chuyển đổi không ngừng
Tách riêng cơ sở dữ liệu dịch vụ khách hàng và OTA (Online Travel Agency) để đảm bảo tính ổn định, và đạt được chuyển đổi không ngừng bằng cách sử dụng chức năng CDC của AWS DMS để đồng bộ hóa dữ liệu theo thời gian thực, giảm thiểu thời gian ngừng hoạt động.
Nâng cao DevOps và môi trường giám sát
Xây dựng quy trình GitOps dựa trên ArgoCD để tự động hóa triển khai và thực hiện hệ thống rollback nhanh chóng, và đảm bảo khả năng hiển thị vận hành thông qua giám sát nhật ký tích hợp qua Grafana Loki.
Hệ thống phản ứng linh hoạt với lưu lượng truy cập quy mô lớn
Để chuẩn bị cho lưu lượng truy cập tăng đột ngột trong các sự kiện khuyến mãi lớn, chúng tôi đã thiết lập chiến lược ALB Pre-warming và NodeGroup Scale-out, đảm bảo tính liên tục dịch vụ có thể mở rộng linh hoạt trong vòng vài phút.
4. Result (Kết quả)
Thông qua chuyển đổi cloud thành công và nâng cao kiến trúc, chúng tôi đã đạt được các kết quả kinh doanh và kỹ thuật sau đây.
Cắt giảm tốc độ phản hồi dịch vụ 99,8%
Hoàn toàn giải quyết vấn đề độ trễ phản hồi khoảng 15 giây xảy ra thỉnh thoảng trong dịch vụ kết nối công ty du lịch (OTA) hiện có, và duy trì tốc độ phản hồi trung bình dưới 0,02 giây trong thời gian bình thường, triển khai dịch vụ hiệu suất cao.
Tối ưu hóa tài nguyên ứng dụng 83%
Thông qua container hóa và tối ưu hóa ứng dụng, chúng tôi đã giảm đáng kể số lượng container của các dịch vụ chính như trang chủ và di động từ 24 xuống 4, tối đa hóa hiệu quả tài nguyên khoảng 83%.
Tăng cường khả năng ứng phó với khuyến mãi
Trong các sự kiện khuyến mãi quy mô lớn, chúng tôi đã chuẩn bị một môi trường Scale-Up có thể mở rộng máy chủ trong vòng vài phút và mở rộng dung lượng kết nối cơ sở dữ liệu lên tới 6.000 kết nối, đảm bảo tính liên tục kinh doanh.
Cải thiện năng suất vận hành và đảm bảo tính ổn định triển khai
Chúng tôi đã tự động hóa phương pháp triển khai thủ công truyền thống dựa trên mã nguồn mở để tăng độ chính xác và tốc độ triển khai, đồng thời rút ngắn thời gian truy vấn nhật ký và phân tích nguyên nhân sự cố thông qua môi trường giám sát tích hợp, cải thiện hiệu quả vận hành.






