Dịch vụ điện toán đám mây AWS đã bắt đầu phục hồi sau một sự cố nghiêm trọng vào chiều nay
Dịch vụ điện toán đám mây AWS, một đơn vị thuộc Amazon đã bắt đầu phục hồi sau một sự cố nghiêm trọng khiến hàng nghìn trang web và nhiều ứng dụng phổ biến trên toàn cầu như Snapchat, Reddit… bị gián đoạn, ảnh hưởng đến hoạt động kinh doanh tại nhiều quốc gia.
Đây được xem là sự gián đoạn Internet lớn nhất kể từ sự cố của CrowdStrike vào năm ngoái, khi đó hệ thống công nghệ tại các bệnh viện, ngân hàng và sân bay bị tê liệt. Vụ việc lần này tiếp tục cho thấy mức độ dễ tổn thương của các công nghệ đang ngày càng phụ thuộc vào sự kết nối toàn cầu.
Sau khoảng ba giờ gián đoạn, đến 6 giờ sáng theo giờ ET (tức 17 giờ Việt Nam), các hệ thống của AWS bắt đầu được khôi phục dần dần. AWS cho biết, họ đã ghi nhận những dấu hiệu phục hồi đáng kể ở một số dịch vụ bị ảnh hưởng. Đồng thời thông tin rằng phần lớn các yêu cầu đã có thể thực hiện thành công và họ đang tiếp tục xử lý lượng yêu cầu bị tồn đọng.
Là nền tảng cung cấp sức mạnh tính toán theo yêu cầu, lưu trữ dữ liệu và các dịch vụ số cho doanh nghiệp, chính phủ và người tiêu dùng cá nhân, AWS đóng vai trò trụ cột cho nhiều nền tảng kỹ thuật số. Vì vậy, bất kỳ sự cố nào xảy ra với hệ thống của AWS đều có thể kéo theo việc gián đoạn hàng loạt trang web và ứng dụng dựa vào hạ tầng đám mây của họ.
Khi được yêu cầu bình luận về sự cố, AWS chỉ dẫn Reuters đến trang trạng thái chính thức của họ. Phía Amazon không đưa ra phản hồi nào thêm.
Junade Ali, một kỹ sư phần mềm, chuyên gia an ninh mạng và là thành viên của Viện Kỹ thuật và Công nghệ (IET) nhận định, sự cố dường như bắt nguồn từ một hệ thống mạng nội bộ mà AWS sử dụng để kiểm soát một sản phẩm cơ sở dữ liệu. Vì sự cố dạng này thường có thể được xử lý từ trung tâm nên nếu không phát sinh thêm vấn đề nào khác, thì nhiều khả năng sự cố sẽ được khắc phục trong vài giờ tới.
Theo công ty Ookla, chủ sở hữu của trang theo dõi sự cố Downdetector, đã có hơn 4 triệu người dùng báo cáo gặp sự cố do vụ việc lần này gây ra. Trên Downdetector, nhiều nền tảng như Snapchat, Roblox, dịch vụ phát trực tuyến Max và ứng dụng thanh toán Venmo của PayPal đều cho thấy dấu hiệu dần ổn định trở lại.
Cụ thể, số lượng báo cáo sự cố của Snapchat đã giảm từ mức đỉnh hơn 22.000 xuống còn hơn 4.000. Tương tự, số báo cáo với Roblox cũng giảm mạnh, từ hơn 12.600 xuống còn dưới 500.
Tuy vậy, vẫn còn nhiều dịch vụ tiếp tục bị ảnh hưởng, trong đó có mạng xã hội Reddit và nền tảng tài chính Chime với hàng nghìn báo cáo sự cố vẫn đang được ghi nhận.
Một số công ty công nghệ khác như startup AI Perplexity, sàn giao dịch tiền mã hóa Coinbase hay ứng dụng giao dịch chứng khoán Robinhood cũng xác nhận rằng nền tảng của họ gặp gián đoạn và nguyên nhân đến từ sự cố tại AWS.
Ngay cả các dịch vụ nội bộ của Amazon như trang mua sắm trực tuyến, Prime Video và trợ lý ảo Alexa cũng không nằm ngoài ảnh hưởng. Theo Downdetector, mức độ nghiêm trọng đã giảm xuống đáng kể vào thời điểm ghi nhận gần nhất.
Nhiều nền tảng trò chơi điện tử lớn như Fortnite (thuộc Epic Games), Clash Royale và Clash of Clans cũng chịu tác động từ sự cố. Ở Mỹ, ứng dụng gọi xe Lyft, đối thủ cạnh tranh với Uber, cũng ghi nhận bị ảnh hưởng.
Meredith Whittaker, Chủ tịch của ứng dụng nhắn tin bảo mật Signal, xác nhận trên nền tảng X rằng ứng dụng của bà cũng gặp sự cố liên quan đến AWS. Trong khi đó, tỷ phú Elon Musk, chủ sở hữu nền tảng X, cho biết dịch vụ của ông vẫn hoạt động bình thường trong suốt thời gian xảy ra sự cố.
Theo dữ liệu từ trang Downdetector tại Anh, các ngân hàng như Lloyds, Bank of Scotland cùng các nhà cung cấp viễn thông Vodafone và BT cũng bị ảnh hưởng. Thậm chí, website của cơ quan thuế, thanh toán và hải quan Anh (HMRC) cũng ghi nhận lỗi truy cập.
Các chuyên gia và giới học thuật nhận định sự cố lần này là minh chứng rõ ràng cho thấy mức độ phụ thuộc ngày càng cao của các dịch vụ số đối với một số ít nhà cung cấp hạ tầng đám mây toàn cầu. Chỉ một trục trặc nhỏ tại một nhà cung cấp cũng có thể gây ra ảnh hưởng nghiêm trọng đến hoạt động của hàng triệu người và doanh nghiệp.
Giáo sư Nishanth Sastry, Giám đốc Nghiên cứu tại Khoa Khoa học Máy tính (Đại học Surrey) nhận xét nguyên nhân sâu xa của vấn đề là do phần lớn các công ty lớn đều lựa chọn chỉ một nhà cung cấp dịch vụ, dẫn đến thiếu tính dự phòng khi xảy ra sự cố.
Mặc dù chưa có dấu hiệu nào cho thấy đây là một cuộc tấn công mạng, quy mô rộng lớn của sự cố đã khiến dư luận đặt ra nhiều nghi vấn. Rafe Pilling, Giám đốc Tình báo tại công ty an ninh mạng Sophos, cho rằng mỗi khi xảy ra sự việc như vậy, lo ngại về khả năng bị tấn công mạng là điều hoàn toàn dễ hiểu. Ông nhấn mạnh việc AWS có một mạng lưới hạ tầng rộng lớn và phức tạp, vì vậy bất kỳ vấn đề nào xảy ra tại đây đều có thể gây ra những ảnh hưởng nghiêm trọng.
Đức Anh