Tại diễn đàn Security Summit 2026 tổ chức ngày 22/5, ông Mai Xuân Cường - Giám đốc Trung tâm Dịch vụ ATTT, Viettel Cyber Security cho biết, điểm khác biệt nguy hiểm nhất giữa AI Agent và LLM truyền thống nằm ở khả năng tương tác trực tiếp với hệ thống.
Nếu LLM thông thường chỉ nhận câu lệnh và trả về văn bản, thì AI Agent lại có khả năng chạy lệnh shell (tương tác với hệ điều hành thông qua dòng lệnh), thao tác đọc/ghi hệ thống file, tự động gửi email, gọi API và điều khiển trình duyệt. Sự nâng cấp này khiến AI Agent vô tình mở ra nhiều hình thức tấn công, vượt xa phạm vi của các rủi ro tạo nội dung sai lệch thông thường.
Ông Mai Xuân Cường - Giám đốc Trung tâm Dịch vụ ATTT, Viettel Cyber Security.
AI Agent trở thành mục tiêu mới của tội phạm mạng
Theo các chuyên gia an ninh mạng, chính khả năng “hành động” này khiến AI Agent trở thành mục tiêu tấn công mới của tội phạm mạng.
Một trong những nguy cơ lớn nhất là rò rỉ dữ liệu doanh nghiệp. Để vận hành hiệu quả, AI Agent thường phải xử lý lượng lớn thông tin nội bộ như mã nguồn, tài liệu hay email. Nếu dữ liệu được gửi lên các nền tảng AI đám mây bên thứ 3, nguy cơ lộ thông tin mật sẽ gia tăng.
Thực tế đã ghi nhận trường hợp nhân viên Samsung làm lộ mã nguồn mới qua ChatGPT, hay nhân viên Meta vô tình gây lộ dữ liệu do làm theo chỉ dẫn của AI nội bộ.
Ngoài nguy cơ rò rỉ dữ liệu, giới chuyên gia cũng cảnh báo về hình thức “tiêm lệnh gián tiếp” (Indirect Prompt Injection). Tin tặc có thể cài cắm chỉ dẫn độc hại vào email, website hoặc tài liệu để đánh lừa AI Agent thực hiện hành vi ngoài ý muốn, như truy xuất dữ liệu nội bộ hoặc gửi thông tin cho hacker.
Từng có vụ việc kẻ tấn công giấu mã Morse vào một tin nhắn để qua mặt hệ thống, khiến Agent tiền số Grok-Bankrbot thực hiện lệnh chuyển tiền trái phép, gây thiệt hại 150.000 USD.
Rủi ro khác đến từ hệ sinh thái tiện ích mở rộng dành cho AI Agent. Nhiều nhân viên trong doanh nghiệp cài thêm tiện ích mở rộng từ cộng đồng để mở rộng chức năng cho AI, nhưng hacker có thể lợi dụng kênh này để phát tán mã độc. Khi được cấp quyền truy cập hệ thống, các plugin giả mạo có thể đánh cắp dữ liệu, token hoặc tạo cửa hậu trên thiết bị.
Theo ông Cường, xu hướng “Shadow AI” cũng đang nổi lên khi nhân viên tự ý cài AI Agent trên máy tính làm việc mà không thông qua bộ phận công nghệ thông tin. Điều này khiến doanh nghiệp khó kiểm soát quyền truy cập và làm tăng nguy cơ mất an toàn hệ thống.
Ngoài ra, AI có thể hiểu sai ý định của người dùng, dẫn tới thực thi các mệnh lệnh có thể gây thiệt hại lớn cho doanh nghiệp. Chẳng hạn, AI Agent có thể thực hiện sai thao tác hoặc vô tình xóa dữ liệu quan trọng nếu được cấp quyền quá lớn.
Để hạn chế rủi ro, các tổ chức được khuyến nghị xây dựng mô hình bảo mật nhiều lớp thay vì chỉ dựa vào phần mềm diệt virus truyền thống và xây dựng lộ trình thực hiện phù hợp.
Doanh nghiệp cần xây dựng mô hình bảo mật nhiều lớp
Bước đầu tiên doanh nghiệp cần thực hiện là phát hiện các mối đe dọa. Doanh nghiệp có thể sử dụng thiết bị đầu cuối, traffic web proxy (máy chủ trung gian kết nối giữa thiết bị và Internet) để tổng hợp và nhận diện mối đe dọa.
Tiếp theo là thiết lập trạm kiểm soát AI (AI Gateway), biến đây thành điểm kiểm soát duy nhất cho mọi truy cập AI. Trạm này sẽ kiểm soát việc truyền dữ liệu ra đám mây công cộng.
Sau đó, doanh nghiệp cần triển khai thêm lớp kiểm soát chuyên biệt (Guardrail) trên AI gateway và các ứng dụng AI khác nhằm nhận diện lệnh độc hại, ngăn rò rỉ dữ liệu và phát hiện hành vi vượt quyền hoặc khai thác trái phép hệ thống.
Bước tiếp theo là thiết lập các bước gia cố cho AI Agent. Hệ thống giám sát tại thiết bị đầu cuối phải được cấu hình để theo dõi "hành vi tự trị" bất thường. AI Agent nên được vận hành trong môi trường cô lập với quyền truy cập tối thiểu nhằm hạn chế nguy cơ lan rộng nếu xảy ra sự cố. Và cuối cùng là thường xuyên giám sát hệ thống.
“Quản trị bảo mật AI không phải là việc triển khai một lần, mà là quy trình kiểm soát liên tục”, ông Cường nhận định.
Quản trị bảo mật AI sẽ trở thành yêu cầu bắt buộc trong giai đoạn AI Agent phát triển mạnh. Nếu doanh nghiệp không sẵn sàng thiết lập các mô hình bảo mật Zero Trust và giám sát gắt gao, việc trao quyền hành động cho AI Agent chẳng khác nào giao chìa khóa hệ thống cho một nhân viên tuy siêu việt nhưng lại rất dễ bị thao túng.
Bình An