Tại sao các sự cố mạng toàn cầu vẫn tiếp diễn?

Tại sao các sự cố mạng toàn cầu vẫn tiếp diễn?
11 giờ trướcBài gốc
Trụ sở Amazon tại Seattle, Mỹ. Ảnh: Kyodo/TTXVN
Theo kênh CNN, Amazon Web Services (AWS), nền tảng điện toán đám mây của Amazon, đã ngừng hoạt động trong vài giờ vào ngày 20/10, khiến nhiều trang web và ứng dụng lớn không thể hoạt động.
Từ dịch vụ ngân hàng đến mạng xã hội, từ các trang đặt vé máy bay đến mua sắm trực tuyến, hàng nghìn dịch vụ bị gián đoạn khi hàng triệu người trên toàn cầu không thể đặt cà phê bằng di động hoặc truy cập các ứng dụng quan trọng.
Sự cố mới nhất này là lời nhắc nhở về mức độ dễ bị tổn thương của hệ thống mang tính xương sống của internet, ngay cả khi gián đoạn chỉ diễn ra trong thời gian ngắn, đồng thời cho thấy thế giới phụ thuộc đến mức nào vào các dịch vụ trực tuyến này.
Mặc dù AWS và các đối thủ cạnh tranh nói chung khá mạnh mẽ, nhưng internet là một mạng lưới phức tạp, có nhiều dịch vụ chồng chéo. Vẫn chưa rõ nguyên nhân gốc rễ của sự cố ngày 20/10, nhưng một dịch vụ chuyển đổi tên web thân thiện thành địa chỉ IP không thể giao tiếp với hàng nghìn cơ sở dữ liệu khổng lồ của các công ty được lưu trữ trên Amazon.
Các sự cố trước đây ở quy mô này thường do nhiều loại lỗi khác nhau gây ra, như cập nhật bị lỗi, vô tình đưa mã xấu vào hệ thống, hoặc thay đổi phần mềm bên thứ ba không tương thích với dịch vụ. Hiếm khi các sự cố như cắt cáp internet, tấn công mạng hoặc tấn công từ chối dịch vụ trực tiếp có thể làm sập hoặc quá tải các máy chủ lưu trữ ứng dụng quan trọng.
Tuy nhiên, tần suất tương đối của các sự cố này cho thấy thiếu các hệ thống dự phòng cần thiết và dịch vụ cạnh tranh. Theo một số chuyên gia internet, các công ty thường xuyên “đặt tất cả trứng vào một rổ dịch vụ đám mây duy nhất”.
Theo ông Rob Jardin, Giám đốc kỹ thuật số tại công ty an ninh mạng NymVPN, không có dấu hiệu cho thấy đây là một cuộc tấn công mạng, đồng thời ông cho rằng sự cố có vẻ là lỗi kỹ thuật ảnh hưởng đến một trong những trung tâm dữ liệu chính của Amazon.
Ông nói: “Internet ban đầu được thiết kế để phi tập trung và có khả năng chống chịu, nhưng hiện nay rất nhiều hệ sinh thái trực tuyến của chúng ta tập trung vào một số khu vực đám mây nhỏ. Khi một trong những khu vực đó gặp sự cố, tác động là ngay lập tức và rộng khắp”.
Ông Jardin cho biết: “Những sự cố này có thể xảy ra khi hệ thống quá tải hoặc một phần quan trọng của mạng ngừng hoạt động và vì rất nhiều trang web cũng như ứng dụng phụ thuộc vào AWS, tác động lan nhanh”.
AWS không thường xuyên gặp các gián đoạn lớn như thế này. Sự cố gần đây nhất xảy ra vào năm 2021.
Ông Mike Chapple, chuyên gia an ninh mạng và giáo sư công nghệ thông tin tại Trường Kinh doanh Mendoza, Đại học Notre Dame, bình luận: “Điều này tương đương với các nhà cung cấp đám mây lớn khác và thật đáng kinh ngạc khi họ có thể vận hành ở quy mô như vậy mà không bị gián đoạn thường xuyên hơn”.
Ông nói thêm: “Lý do những sự cố này thu hút nhiều chú ý hơn là vì tác động. Nếu một công ty gặp sự cố tại trung tâm dữ liệu, sự cố sẽ gây ra vấn đề cho các sản phẩm và dịch vụ của công ty đó”.
Năm 2024, sự cố công nghệ thông tin lớn nhất từ trước đến nay đã làm sập một phần lớn internet khi một lỗi phần mềm CrowdStrike nghiêm trọng khiến máy tính bị treo, dẫn đến hủy chuyến bay và gián đoạn hoạt động tại bệnh viện trên toàn cầu, gây thiệt hại trực tiếp 5 tỷ USD. Một lỗi trong hệ thống thử nghiệm dựa trên đám mây của CrowdStrike đã đẩy một bản cập nhật lỗi ra máy tính trên toàn thế giới.
Cũng trong năm 2024, mạng lưới AT&T nhiều lần gặp sự cố, bao gồm một lần sập kéo dài 11 giờ khiến nhiều người không thể làm việc.
Sự cố mới nhất của AWS
AWS là nhà cung cấp điện toán đám mây lưu trữ nhiều dịch vụ trực tuyến được sử dụng phổ biến nhất thế giới. Khi Amazon mới bắt đầu, công ty cần dung lượng máy chủ dư thừa để đảm bảo có đủ năng lực tính toán xử lý lượng truy cập khổng lồ vào trang web trong mùa cao điểm. Amazon nhận ra rằng trong phần còn lại của năm, họ có thể dùng các máy chủ này để hỗ trợ nhu cầu trực tuyến của các công ty khác, từ đó AWS ra đời.
Trong số nhiều dịch vụ của AWS có DynamoDB, một cơ sở dữ liệu lưu trữ thông tin cho các công ty, bao gồm dữ liệu khách hàng. Amazon cho biết vào ngày 20/10, khách hàng không thể truy cập dữ liệu lưu trữ trong DynamoDB vì Hệ thống Tên Miền (DNS) gặp sự cố.
DNS giống như bộ định vị internet, chuyển đổi địa chỉ web thân thiện với người dùng như amazon.com thành địa chỉ IP – một chuỗi số mà các trang web và ứng dụng khác có thể hiểu.
Ông Chapple nói: “Amazon đã lưu trữ dữ liệu một cách an toàn, nhưng không ai có thể tìm thấy dữ liệu trong vài giờ, khiến các ứng dụng tạm thời bị tách khỏi dữ liệu. Giống như một phần lớn internet bị mất trí nhớ tạm thời”.
Nguyên nhân gây ra sự cố DNS chưa rõ, nhưng chỉ kéo dài vài giờ. Đến 6 giờ 35 phút sáng theo giờ địa phương, Amazon đã khắc phục vấn đề DNS và khuyến nghị các công ty xóa bộ nhớ đệm để giúp khôi phục dịch vụ nhanh hơn.
Amazon cho biết sự cố vẫn tiếp tục ảnh hưởng đến các dịch vụ AWS khác, bao gồm EC2 – một loại máy chủ ảo mà nhiều công ty dùng để xây dựng ứng dụng trực tuyến.
Sáng 21/10 (theo giờ Việt Nam), tập đoàn Amazon thông báo đã khôi phục hoàn toàn các dịch vụ AWS sau sự cố kỹ thuật nghiêm trọng trên. Nguyên nhân được xác định là trục trặc trong hệ thống giám sát tình trạng của bộ cân bằng tải mạng tại một trung tâm dữ liệu ở Mỹ.
Thùy Dương/Báo Tin tức và Dân tộc
Nguồn Tin Tức TTXVN : https://baotintuc.vn/the-gioi/tai-sao-cac-su-co-mang-toan-cau-van-tiep-dien-20251021094225893.htm