Google Gemini là chatbot thu thập dữ liệu người dùng nhiều nhất.
Nhằm đánh giá mức độ ảnh hưởng đến quyền riêng tư, các nhà nghiên cứu tại Surfshark đã phân tích chính sách bảo mật của 10 chatbot AI phổ biến nhất trên Apple App Store.
Ba tiêu chí quan trọng được xem xét gồm: số lượng loại dữ liệu thu thập, mức độ liên kết dữ liệu với danh tính người dùng, và việc các ứng dụng này có chia sẻ thông tin với bên thứ ba hay không.
Kết quả cho thấy, trung bình mỗi chatbot thu thập 11 loại dữ liệu trong tổng số 35 loại có thể có. Trong khi đó, Google Gemini thu thập tới 22 loại dữ liệu, bao gồm nhiều thông tin nhạy cảm như vị trí, danh bạ và lịch sử web,... của người dùng.
Đáng chú ý, báo cáo chỉ ra hoạt động thu thập dữ liệu của Gemini không chỉ dừng lại ở các cuộc trò chuyện. Chatbot này còn tận dụng hệ sinh thái rộng lớn của Google, liên kết với hàng loạt ứng dụng trên thiết bị người dùng như Gmail, Google Maps, Google Docs và YouTube để mở rộng khả năng thu thập dữ liệu người dùng một cách toàn diện.
Cũng cần lưu ý rằng một số chatbot khác bên cạnh thu thập dữ liệu từ lịch sử trò chuyện còn có thể có thêm thông tin người dùng bằng cách theo dõi địa chỉ IP thiết bị và tín hiệu Wi-Fi để xác định vị trí của người dùng. Theo đó, báo cáo của Surfshark cũng phát hiện ba ứng dụng Google Gemini, Copilot và Perplexity quả thực đã thu thập dữ liệu vị trí người dùng.
Một số phương pháp khác để các chatbot thu thập dữ liệu của người dùng bao gồm theo dõi tương tác của người dùng với các truy vấn mà chatbot đề xuất.
DeepSeek ghi nhận thu thập 11 loại dữ liệu, thấp hơn nhiều so với chatbot của Google, song điều gây tranh cãi là chính sách bảo mật của DeepSeek cho phép lưu trữ dữ liệu “khi cần thiết” trên máy chủ đặt tại Trung Quốc.
Xếp thứ 6 trong bảng xếp hạng, chatbot phổ biến nhất, ChatGPT thu thập 10 loại dữ liệu. Mặc dù vậy, OpenAI cho phép người dùng tùy chọn bật chế độ trò chuyện tạm thời, giúp đảm bảo lịch sử hội thoại sẽ bị xóa sau 30 ngày. Ngoài ra, người dùng cũng có thể yêu cầu loại bỏ dữ liệu cá nhân khỏi tập huấn luyện AI của ChatGPT.
Báo cáo tiết lộ bên cạnh việc thu thập dữ liệu, một số chatbot còn chia sẻ dữ liệu người dùng với bên thứ ba để phục vụ mục đích quảng cáo hoặc đo lường hiệu quả tiếp thị. Copilot, Poe và Jasper là ba ứng dụng điển hình có hành vi này.
Tomas Stamulis, Giám đốc bảo mật tại Surfshark, cảnh báo: “Dữ liệu mà các chatbot thu thập không chỉ dừng lại ở việc cải thiện hiệu suất AI. Nó có thể được lưu trữ, xử lý và chia sẻ với hàng trăm đối tác bên thứ ba, để phục vụ mục đích quảng cáo tiếp thị hoặc cung cấp dữ liệu để tiếp thị trực tiếp qua điện thoại”.
Nhìn chung, theo phân tích của Surfshark, 30% chatbot trong danh sách nghiên cứu có hành vi chia sẻ dữ liệu người dùng với bên thứ ba, bao gồm danh bạ liên hệ, lịch sử tìm kiếm, vị trí người dùng và dữ liệu tìm kiếm của người dùng.
Ngoài ra, nếu các chatbot đã liên kết với bên thứ ba, không loại trừ khả năng dữ liệu cá nhân của người dùng có thể rơi vào tay kẻ xấu, trở thành công cụ để thực hiện các cuộc tấn công lừa đảo tinh vi.
Giám đốc Bảo mật Surfshark nhấn mạnh: “Càng nhiều dữ liệu được chia sẻ, nguy cơ rò rỉ càng lớn. Tội phạm mạng có thể khai thác những thông tin này để tạo ra các cuộc tấn công lừa đảo được cá nhân hóa, gây tổn thất tài chính nghiêm trọng cho người dùng”.
Bạch Dương