Các 'mắt thần' của Google phủ khắp nơi, hàng tỉ người dùng internet khó tránh bị thu thập dữ liệu

Các 'mắt thần' của Google phủ khắp nơi, hàng tỉ người dùng internet khó tránh bị thu thập dữ liệu
11 giờ trướcBài gốc
Cùng tìm hiểu cách Google Analytics, AdSense và các video YouTube dạng nhúng (cho phép phát trên các trang web khác) thu thập dữ liệu của người dùng, ngay cả khi sử dụng công cụ tìm kiếm hay trình duyệt DuckDuckGo.
SafetyDetectives là nhóm nghiên cứu và đánh giá bảo mật mạng độc lập, chuyên cung cấp thông tin, phân tích và công cụ giúp người dùng bảo vệ quyền riêng tư và dữ liệu cá nhân trực tuyến.
Cụ thể hơn, SafetyDetectives nổi bật với các hoạt động sau:
- Thực hiện các nghiên cứu an ninh mạng quy mô lớn, ví dụ kiểm tra mức độ rò rỉ dữ liệu, theo dõi của các hãng công nghệ (gồm cả Google), lỗ hổng hệ thống và bảo mật trang web.
- Đánh giá và so sánh phần mềm bảo mật như antivirus, trình quản lý mật khẩu và cả VPN (mạng riêng ảo)…
- Cung cấp thông tin công khai về vi phạm dữ liệu, rò rỉ máy chủ và cảnh báo sớm về các vấn đề an ninh mạng.
SafetyDetectives hoạt động như một bên trung lập, không liên kết với bất kỳ hãng phần mềm nào, để giữ sự khách quan trong các đánh giá và phát hiện của mình.
Tính đến đầu năm 2025, có khoảng 5,56 tỉ người trên thế giới đang sử dụng internet, tương đương 67,9% dân số toàn cầu.
Việc Google theo dõi hoạt động người dùng không còn là điều quá lạ, nhưng nghiên cứu mới nhất của SafetyDetectives (được tiến hành tại Mỹ, Anh, Thụy Sĩ và Thụy Điển) cho thấy mức độ lan rộng của các cơ chế theo dõi từ gã khổng lồ công nghệ Mỹ trên internet.
Được chia sẻ với trang HR, nghiên cứu của SafetyDetectives cho thấy dù các công cụ tìm kiếm chú trọng quyền riêng tư như DuckDuckGo có thể giảm mức độ tiếp xúc với Google, nhưng việc hoàn toàn thoát khỏi tầm theo dõi của hãng công nghệ lớn này vẫn là một thách thức lớn. Nghiên cứu đã mô phỏng vị trí người dùng bằng máy ảo và VPN để đảm bảo thu thập dữ liệu khu vực chính xác.
Google theo dõi và thu nhập dữ liệu của hàng tỉ người dùng internet bằng nhiều dịch vụ nhúng khác nhau - Ảnh: Internet
DuckDuckGo là công cụ tìm kiếm internet được Gabriel Weinberg ra mắt vào năm 2008 bởi. Điểm khác biệt lớn nhất và cũng là yếu tố cốt lõi làm nên tên tuổi cho DuckDuckGo so với các công cụ tìm kiếm khác như Google hay Bing chính là việc đặt trọng tâm vào bảo vệ quyền riêng tư của người dùng.
DuckDuckGo hoạt động dựa trên triết lý "Công cụ tìm kiếm không theo dõi bạn”. Điều này có nghĩa là:
- Không lưu trữ thông tin cá nhân: DuckDuckGo không thu thập hay lưu trữ các dữ liệu cá nhân của người dùng như địa chỉ IP, lịch sử tìm kiếm hay các thông tin định danh khác.
- Không tạo hồ sơ người dùng: Trong khi Google thường tạo hồ sơ chi tiết về thói quen tìm kiếm và hành vi trực tuyến của bạn để cá nhân hóa kết quả lẫn quảng cáo, DuckDuckGo không làm điều đó. Mọi tìm kiếm trên DuckDuckGo đều được coi là của một người dùng mới, đảm bảo tính trung lập.
- Chặn các trình theo dõi quảng cáo: DuckDuckGo tích hợp các tính năng chặn các trình theo dõi (tracker) của bên thứ ba mà nhiều trang web sử dụng để thu thập dữ liệu về bạn.
- Thực thi HTTPS: DuckDuckGo cố gắng buộc các trang web chuyển sang kết nối HTTPS an toàn bất cứ khi nào có thể, giúp bảo vệ dữ liệu của người dùng khỏi bị can thiệp.
- Không có "bong bóng lọc": Vì không cá nhân hóa kết quả tìm kiếm, DuckDuckGo mang đến cho bạn kết quả trung lập hơn, không bị ảnh hưởng bởi những gì bạn đã tìm kiếm hoặc xem trước đó.
Giao diện trình duyệt DuckDuckGo khi truy cập trang web của Tạp chí Một Thế Giới - Ảnh chup màn hình
DuckDuckGo kiếm tiền bằng cách nào?
Dù không theo dõi người dùng để hiển thị quảng cáo cá nhân hóa, DuckDuckGo vẫn có mô hình kinh doanh bền vững. Họ chủ yếu kiếm tiền thông qua:
- Quảng cáo theo ngữ cảnh: Quảng cáo trên DuckDuckGo dựa trên từ khóa tìm kiếm của người dùng tại thời điểm đó, chứ không phải dựa trên lịch sử duyệt web hay hồ sơ cá nhân. Ví dụ, nếu tìm kiếm "vé máy bay đi TP.HCM", bạn có thể thấy quảng cáo về các hãng hàng không hoặc khách sạn ở TP.HCM. Các quảng cáo này được cung cấp bởi các đối tác như Microsoft Advertising (trước đây là Yahoo-Microsoft).
- Chương trình liên kết: DuckDuckGo cũng có thể nhận một phần nhỏ doanh thu nếu người dùng nhấp vào liên kết sản phẩm trên kết quả tìm kiếm của họ (ví dụ liên kết Amazon, eBay) và thực hiện mua hàng. Tuy nhiên, DuckDuckGo cam kết không chia sẻ thông tin cá nhân của người dùng với các đối tác này.
DuckDuckGo có thực sự "không theo dõi" hoàn toàn?
Dù nổi tiếng về quyền riêng tư, DuckDuckGo từng gây tranh cãi liên quan đến việc cho phép một số trình theo dõi từ Microsoft trong các ứng dụng và tiện ích mở rộng trình duyệt của mình ở quá khứ. DuckDuckGo đã thừa nhận và giải thích rằng đây là một phần của thỏa thuận phân phối tìm kiếm với Microsoft. Tuy nhiên, họ vẫn khẳng định rằng các trình theo dõi này không được sử dụng để tạo hồ sơ người dùng cá nhân.
Nhìn chung, so với các công cụ tìm kiếm lớn khác, DuckDuckGo vẫn là lựa chọn vượt trội về quyền riêng tư cho những ai lo ngại việc dữ liệu cá nhân bị thu thập và sử dụng.
Google theo dõi người dùng ngoài phạm vi sản phẩm của mình
Nghiên cứu cho thấy Google không chỉ theo dõi người dùng thông qua các sản phẩm của mình, mà còn nhúng sâu vào vô số trang web thông qua các công cụ như Google Analytics (phân tích lưu lượng truy cập trang web), AdSense (cho phép các chủ sở hữu website, blog hoặc kênh YouTube kiếm tiền bằng cách hiển thị quảng cáo từ Google trên nội dung của họ) và các đoạn video YouTube dạng nhúng.
Theo SafetyDetectives, dữ liệu này giúp Google xây dựng hồ sơ người dùng chi tiết phục vụ cho quảng cáo hướng đối tượng và cá nhân hóa nội dung.
Google theo dõi sâu rộng và theo từng loại nội dung
Nghiên cứu cho thấy sử dụng DuckDuckGo có thể giảm tới 50% việc theo dõi từ Google, đặc biệt ở các quốc gia có quy định bảo mật quyền riêng tư chặt chẽ hơn như Thụy Sĩ và Thụy Điển. Ví dụ, Google Analytics chỉ xuất hiện trong 14 - 17% các lượt truy cập từ DuckDuckGo tại hai quốc gia này, giảm rõ rệt so với 45 - 53% khi dùng Google Search.
Song tại Mỹ, hơn 40% trang web vẫn gửi dữ liệu về Google ngay cả khi người dùng sử dụng DuckDuckGo. Tại Anh, sự cải thiện nhẹ được ghi nhận, với tỷ lệ theo dõi giảm từ 47% (khi dùng Google) xuống còn 29% (nếu sử dụng DuckDuckGo).
Được mô tả là “có mặt khắp nơi”, Google Analytics bị phát hiện trong khoảng 1/5 các phiên duyệt web bằng DuckDuckGo ở cả bốn quốc gia là Mỹ, Anh, Thụy Sĩ và Thụy Điển.
Mức độ các công cụ theo dõi của Google được sử dụng tại Thụy Sĩ , Anh, Mỹ và Thụy Điển (theo thứ tự từ trên xuống) - Ảnh: SafetyDetectives
Nghiên cứu cũng chỉ ra các danh mục nội dung cụ thể mà Google theo dõi phổ biến hơn. Chẳng hạn, các tìm kiếm liên quan đến YouTube và sản phẩm luôn có khả năng kích hoạt việc Google theo dõi cao hơn, bất kể dùng công cụ tìm kiếm nào.
Ngược lại, các lượt truy cập vào nền tảng như Wikipedia và TikTok cho thấy việc Google theo dõi rất ít hoặc không có. Điều này cho thấy loại nội dung được truy cập đóng một vai trò quan trọng trong mức độ thu thập dữ liệu của Google.
Sự khác biệt theo khu vực và loại trình theo dõi
Nghiên cứu nhấn mạnh rằng vị trí địa lý có ảnh hưởng lớn đến mức độ theo dõi của Google. Tại Mỹ, gần như không thể tránh khỏi các trình theo dõi của Google và thường xuất hiện trên 100% các trang web đã truy cập trong một số thử nghiệm, ngay cả khi dùng lựa chọn thay thế tập trung vào quyền riêng tư như DuckDuckGo.
Nguyên nhân chính đến từ việc các trang tin tức cũng như thương mại thường tích hợp các đoạn mã phân tích và quảng cáo của Google. Trong khi đó, Thụy Điển và Thụy Sĩ ghi nhận ít trường hợp theo dõi hơn, với DuckDuckGo tỏ ra hiệu quả hơn trong việc chặn các trình theo dõi, đặc biệt trên các bài viết tin tức và trang Wikipedia.
Google Analytics là trình theo dõi phổ biến nhất ở cả bốn nước nêu trên, xuất hiện trên gần 50% các trang web được truy cập, cho thấy mức độ tích hợp sâu vào cơ sở hạ tầng web.
Các trình theo dõi đáng chú ý khác của Google gồm APIs (các cổng kết nối phần mềm cho phép các website hoặc ứng dụng bên ngoài giao tiếp với hệ thống của Google), Fonts (thư viện font chữ miễn phí của Google, được rất nhiều website sử dụng để hiển thị đẹp và chuẩn trên mọi thiết bị), Maps (cho phép website nhúng bản đồ, đánh dấu địa điểm, chỉ đường) và Gtag. Đó là những dịch vụ tích hợp vào hạ tầng của Google. Mức tích hợp này đặc biệt cao tại Thụy Điển và Mỹ.
Gtag là đoạn mã JavaScript được Google cung cấp để tích hợp các công cụ như Analytics, Ads, Tag Manager... Khi được thêm vào website, gtag sẽ thu thập và gửi dữ liệu hành vi người dùng về Google, phục vụ mục đích phân tích, cá nhân hóa quảng cáo.
Google DoubleClick xuất hiện phổ biến hơn tại Thụy Sĩ, trong khi các đoạn video YouTube dạng nhúng lại được sử dụng nhiều hơn tại Mỹ và Anh so với Thụy Điển hay Thụy Sĩ.
DoubleClick là nền tảng được Google dùng để quản lý, phân phối và theo dõi quảng cáo trên web, đặc biệt là quảng cáo hiển thị.
Nghiên cứu nêu trên chỉ ra rằng, dù có các quy định như GDPR, nhiều dịch vụ nhúng của Google vẫn tiếp tục thu thập dữ liệu người dùng. Điều này đồng nghĩa rằng việc hoàn toàn thoát khỏi các "mắt thần" của Google là rất khó với hàng tỉ người dùng internet thông thường.
GDPR (Quy định chung về Bảo vệ Dữ liệu) là luật bảo mật dữ liệu mạnh mẽ nhất thế giới, được Liên minh châu Âu (EU) ban hành và có hiệu lực từ ngày 25.5.2018.
Mục tiêu chính của GDPR
- Bảo vệ quyền riêng tư và dữ liệu cá nhân của công dân EU.
- Kiểm soát cách các tổ chức thu thập, lưu trữ, xử lý và sử dụng dữ liệu người dùng.
- Tăng tính minh bạch và trách nhiệm của các công ty xử lý dữ liệu cá nhân.
Theo GDPR, dữ liệu cá nhân gồm bất kỳ thông tin nào có thể nhận dạng một người, ví dụ họ tên, địa chỉ, email, số điện thoại, IP, cookies, vị trí GPS, thông tin sức khỏe, tài chính, sinh trắc học (vân tay, khuôn mặt…).
Sơn Vân
Nguồn Một Thế Giới : https://1thegioi.vn/cac-mat-than-cua-google-phu-khap-noi-hang-ti-nguoi-dung-internet-kho-tranh-bi-thu-thap-du-lieu-234878.html