Wikipedia là nơi nhân loại đóng góp tri thức phi lợi nhuận và thực hiện 'thủ công' trong 1/4 thế kỷ
Hai mươi năm làm báo, tôi đã chứng kiến Internet thay đổi gần như mọi ngóc ngách trong công việc tra cứu thông tin. Từ những ngày đầu chập chững gõ Google để tìm tư liệu, cho đến thời bùng nổ mạng xã hội, tôi luôn có một nơi để quay về – Wikipedia. Với tôi, đó không chỉ là một bách khoa toàn thư mở, mà là một mỏ tri thức nhân loại được xây bằng mồ hôi, tâm huyết và tinh thần cộng đồng của hàng triệu con người làm việc phi lợi nhuận.
Hôm nay, giữa cơn sóng thần mang tên trí tuệ nhân tạo, pháo đài tri thức mang tên Wikipedia đang bị đe dọa. Không phải Wikipedia thiếu chính xác hay thông tin có vấn đề, mà nó đang bị các công ty AI vừa khai thác, vừa chèn ép trong lĩnh vực tra cứu thông tin.
Các công ty lớn như Google, Apple, Amazon, OpenAI hay Meta đều sử dụng dữ liệu của Wikipedia để huấn luyện AI hoặc tạo kết quả tìm kiếm có chú giải. Tuy nhiên, điều này cũng dẫn đến nghịch lý: ngày càng nhiều người tiếp nhận thông tin từ Wikipedia mà không truy cập vào trang web.
Gần đây, ông Marshall Miller, đại diện Quỹ Wikimedia Foundation cho biết lượng truy cập từ con người vào Wikipedia đã giảm 8% chỉ trong một năm. Tổ chức này có hệ thống phân biệt giữa lượt truy cập từ con người và bot. Miller cho biết, sự sụt giảm “trong vài tháng qua” được phát hiện sau khi Wikipedia cập nhật hệ thống phát hiện bot và kết quả cho thấy “phần lớn lưu lượng truy cập bất thường trong tháng 5 và tháng 6 đến từ các bot được thiết kế để né tránh bị phát hiện”.
Vì sao lượng truy cập lại giảm? Miller cho rằng nguyên nhân nằm ở “tác động của AI tạo sinh và mạng xã hội đối với cách con người tìm kiếm thông tin”. Ông chỉ ra rằng “các công cụ tìm kiếm ngày càng sử dụng AI tạo sinh để trả lời trực tiếp câu hỏi của người dùng thay vì dẫn liên kết đến các trang như Wikipedia”, đồng thời “các thế hệ trẻ lại có xu hướng tìm kiếm thông tin qua các nền tảng video ngắn, thay vì trên web mở”.
Hiện tượng đó được gọi là click zero. Không cần truy cập vào trang web - nghe có vẻ thuận tiện. Nhưng đằng sau sự tiện lợi là một mối nguy tiềm ẩn.
AI không tạo ra tri thức mới, nó chỉ tổng hợp, trộn lẫn và diễn giải lại tri thức con người. Dù phần lớn trong đó đến từ chính Wikipedia nhưng cũng không ít là thông tin do AI bị ảo giác hay “ngộ độc” thông tin do chính các mô hình khác tạo ra.
Ngày nay, những bài viết do AI tạo ra tràn ngập internet. Là một người làm báo, tôi đã thấy không ít lần AI “bịa chuyện” – từ việc chế ra trích dẫn không tồn tại, thêm bớt chi tiết “như thật”, cho đến sáng tạo ra những thứ chưa từng tồn tại. Dưới vẻ thông minh của nó, AI vẫn là một cỗ máy dễ sai và dễ chiều lòng người dùng mà đánh mất tính khách quan.
Điều nguy hiểm là những thông tin rác đó được chia sẻ, sao chép, rồi học lại bởi chính AI khác rồi “ngộ độc”, tạo thành một vòng lặp rác thông tin khổng lồ. Khi rác quá nhiều trên môi trường mạng - tỷ lệ theo số bài AI tạo ra, khi vàng thau ngày càng lẫn lộn, người ta sẽ không còn biết đâu là sự thật.
Wikipedia thì khác. Nó có thể không hoàn hảo, có thể bị chỉnh sửa, nhưng luôn có một cộng đồng giám sát và nguyên tắc kiểm chứng rõ ràng. Mọi đoạn thông tin đều phải dẫn nguồn, mọi lập luận đều được thảo luận công khai và mọi sai sót đều có thể được sửa chữa bởi con người thực. Đó là thứ mà AI, dù thông minh đến đâu, cũng chưa thể thay thế.
Wikipedia, dù chỉ là một trang web, lại là điểm neo duy nhất còn lại cho lý trí. Nó nhắc chúng ta rằng kiến thức cần được kiểm chứng, rằng tri thức không thể sinh ra từ khoảng không.
Nhưng nói đi cũng phải nói lại, Wikipedia bị tụt hậu trong trào lưu công nghệ, sóng thần AI bởi vì nó quá tự tin vào "công thức" và cả "công sức" dùng tình nguyện viên phát triển. Trong gần 1/4 thế kỷ, Wiki hầu như không có nhiều thay đổi gì về cách làm và hình thức thể hiện. App Wikipedia trên Google Store đã phát triển từ đầu 2012 nhưng đến nay chỉ có hơn 600 nghìn lượt người tải. Còn App ChatGPT trình làng giữa 2023 trên Google Store nhưng đã có số lượt tải gấp cả ngàn lần. Phương châm phi lợi nhuận của Wikipedia cũng là điểm yếu cốt tử, khiến nó thiếu năng động, sáng tạo và động lực kinh tế để phát triển.
Nếu Wikipedia sụp đổ vì thiếu người đóng góp, hay thiếu tài chính, người chịu thiệt không phải là một tổ chức, mà là toàn bộ nền văn minh thông tin của nhân loại, bao gồm cả AI. Con người sẽ đánh mất nơi để kiểm chứng lại sự thật giữa rừng thông tin giả, nhiễu và đầy ảo giác do chính AI tạo ra.
Các tập đoàn công nghệ – những “ông lớn” đang thu lợi hàng tỉ USD nhờ vào dữ liệu mà Wikipedia góp phần tạo ra – cần chia sẻ lại giá trị đó. Không chỉ bằng lời cảm ơn hay trích dẫn, mà bằng hỗ trợ tài chính, hạ tầng và cam kết minh bạch.
Còn với người dùng, trách nhiệm cũng không nhỏ. Mỗi khi sử dụng ChatGPT, Gemini hay Copilot để tra cứu, trong hoàn cảnh phù hợp, hãy nhớ thêm một dòng lệnh: “Dựa trên thông tin từ Wikipedia”. Không chỉ để kết quả chính xác hơn, mà còn như một lời nhắc: “trí tuệ nhân tạo” vẫn đang sống nhờ vào “trí tuệ nhân loại”.
Bùi Tú