Hàng loạt trang web, trò chơi và ứng dụng trực tuyến đang bị ảnh hưởng bởi một sự cố mạng nghiêm trọng. Sự cố bắt đầu từ khoảng 13h30 ngày 20/10 (giờ Việt Nam), dường như liên quan đến trục trặc tại Amazon Web Services (AWS) – nền tảng điện toán đám mây lớn nhất thế giới.
Theo trang giám sát Downdetector, riêng tại Mỹ đã có hơn 2.000 báo cáo về việc AWS gặp lỗi.
Sự cố diễn ra đột ngột và lan rộng, làm gián đoạn hoạt động của các ứng dụng và dịch vụ như Snapchat, nền tảng game Roblox, sàn giao dịch tiền số Coinbase, ứng dụng giao dịch Robinhood, ứng dụng họp video Zoom và ứng dụng học ngoại ngữ Duolingo.
Bản thân các dịch vụ của Amazon như Amazon.com, PrimeVideo và Alexa cũng gặp trục trặc.
Nhiều dịch vụ lớn nhỏ bị gián đoạn hoạt động do sự cố tại Amazon Web Services chiều 20/10. Ảnh: MUO
Trên trang tình trạng dịch vụ của mình, AWS cho biết đang ghi nhận “tỷ lệ lỗi tăng cao” và “độ trễ lớn” ở nhiều dịch vụ. Công ty cho hay: “Chúng tôi đang tích cực khắc phục sự cố và tìm hiểu nguyên nhân gốc rễ”, đồng thời hứa sẽ cập nhật thông tin trong vòng 45 phút tới.
AWS thừa nhận có “tỷ lệ lỗi nghiêm trọng” đối với các yêu cầu gửi tới dịch vụ lưu trữ dữ liệu DynamoDB tại khu vực US-EAST-1 (miền Bắc bang Virginia, Mỹ). Công ty nói thêm nhiều dịch vụ khác tại khu vực này cũng đang bị ảnh hưởng, khiến người dùng “không thể tạo hoặc cập nhật các yêu cầu hỗ trợ”.
Theo MakeUseOf, US-EAST-1 là khu vực điện toán đám mây lớn nhất và có tầm quan trọng chiến lược nhất thế giới. Điều này có nghĩa sự cố không chỉ giới hạn ở khu vực miền Đông nước Mỹ mà còn gây hiệu ứng lan tỏa toàn cầu.
Đây là trung tâm dữ liệu lâu đời và lớn nhất của AWS, đóng vai trò then chốt trong hệ thống hạ tầng đám mây của Amazon. Đặc biệt, các bảng điều khiển cho nhiều dịch vụ toàn cầu của AWS - như Amazon Identity and Access Management (IAM) và Amazon CloudFront - đều được đặt tại đây.
Do đó, khi khu vực này gặp sự cố, các dịch vụ trên toàn thế giới cũng có thể bị ảnh hưởng, bởi nhiều ứng dụng cần xác thực hoặc truy cập bảng điều khiển toàn cầu, ngay cả khi dữ liệu chính của chúng được lưu ở nơi khác.
Theo AWS, các kỹ sư “đã ngay lập tức vào cuộc” khi phát hiện sự cố và “đang tích cực làm việc để khắc phục và điều tra nguyên nhân”.
Vì sao AWS bị lỗi gây ảnh hưởng diện rộng?
AWS được mô tả là “dịch vụ đám mây toàn diện nhất thế giới”, cung cấp hạ tầng máy chủ, cơ sở dữ liệu và lưu trữ cho hàng triệu doanh nghiệp, tổ chức và chính phủ trên toàn cầu. Chính vì vậy, chỉ một sự cố nhỏ ở AWS cũng có thể gây tác động dây chuyền đến hàng loạt nền tảng trực tuyến.
Giám đốc điều hành của công ty AI Perplexity, ông Aravind Srinivas, thông báo trên X: “Perplexity hiện không hoạt động được. Nguyên nhân gốc rễ là do AWS. Chúng tôi đang khắc phục”.
Sự cố ngày 20/10 của AWS khiến nhiều người nhớ lại vụ sập mạng toàn cầu tháng 7/2024, khi một bản cập nhật lỗi của hãng an ninh mạng CrowdStrike khiến 8,5 triệu thiết bị Windows trên toàn thế giới gặp trục trặc. Vụ việc làm hàng nghìn chuyến bay bị hủy, bệnh viện, ngân hàng và hãng truyền thông tê liệt. Đến nay, CrowdStrike vẫn đang bị Delta Airlines và cổ đông kiện.
MakeUseOf nhận định, những sự cố như trên cho thấy mức độ phụ thuộc sâu sắc của Internet hiện đại vào hạ tầng dùng chung. Khi một “trụ cột” trung tâm gặp trục trặc, hiệu ứng dây chuyền lan ra toàn cầu, khiến hàng loạt dịch vụ – từ công cụ làm việc cho đến nền tảng giải trí – đồng loạt tê liệt.
Hiện tại, người dùng chỉ còn biết chờ các kỹ sư AWS khắc phục sự cố và khôi phục các nền tảng phụ thuộc trên toàn mạng. Đây là một lời cảnh tỉnh hiếm hoi nhưng đáng suy ngẫm: ngay cả “đám mây” – biểu tượng của độ tin cậy và linh hoạt – cũng có thể có điểm yếu chí tử.
(Theo MOU, Skynews)
Du Lam