Trong kỷ nguyên trí tuệ nhân tạo, đặc biệt là trí tuệ nhân tạo tạo sinh (generative AI), câu hỏi lớn không còn là máy trả lời nhanh đến đâu, hay “trơn tru” đến mức nào. Câu hỏi lớn hơn là: ai nắm quyền định nghĩa thế giới, ai đặt ra hệ quy chiếu để giải thích quá khứ, mô tả hiện tại và dự báo tương lai?
Chủ quyền nhận thức, quyền tự hiểu của một quốc gia
Ở tầng sâu, đây là vấn đề chủ quyền nhận thức (cognitive sovereignty), năng lực của một cộng đồng, một quốc gia, trong việc tự quản quá trình hiểu biết, tự diễn giải, tự ra quyết định, không bị lệ thuộc vào các hệ thống tự động hóa và các trung gian tri thức do người khác kiểm soát.
Nói dễ hiểu, nếu trước đây ta nói nhiều về chủ quyền lãnh thổ, chủ quyền dữ liệu, chủ quyền hạ tầng, thì nay xuất hiện một lớp “chủ quyền” mới, chủ quyền của cách hiểu. Khi các quyết định tự động (automated decisions) ngày càng chen vào đời sống, từ tuyển dụng, chấm điểm tín dụng, phát hiện gian lận, đến gợi ý nội dung, thì rủi ro không chỉ nằm ở “dữ liệu đúng hay sai”, mà nằm ở “hệ thống hiểu dữ liệu đó theo khung nào, rồi suy ra kết luận gì”.
Lũy tre xanh như đường biên của chủ quyền nhận thức trong không gian số.
Khi hỏi trợ lý ảo về một vấn đề, nếu câu trả lời được tạo ra từ nguồn không rõ ràng, hoặc từ cách diễn giải lẫn lộn, thì sai lệch sẽ không gây sốc ngay lập tức. Nó thấm dần, thành thói quen hiểu sai, hoặc hiểu lơ mơ nhưng lại tưởng là đã nắm chắc.
Ở Việt Nam, bạn có thể thấy điều này rất gần. Một học sinh hỏi trợ lý ảo về một sự kiện lịch sử, một người dân hỏi về một quy định pháp luật, một doanh nghiệp hỏi về một chính sách mới. Nếu câu trả lời được tạo ra từ nguồn không rõ ràng, hoặc từ cách diễn giải lẫn lộn, thì sai lệch sẽ không gây sốc ngay lập tức. Nó thấm dần, thành thói quen hiểu sai, hoặc hiểu lơ mơ nhưng lại tưởng là đã nắm chắc.
Khi chủ quyền nhận thức suy yếu, xã hội dễ rơi vào một kiểu phân tầng tri thức, một nhóm nhỏ đủ năng lực và công cụ để kiểm chứng, phản biện, đối chiếu nguồn, còn số đông tiêu thụ câu trả lời như một “thẩm quyền tiện lợi”. Lâu ngày, nền tảng tranh luận xã hội có thể mỏng đi, sức đề kháng trước thao túng và xuyên tạc cũng yếu đi.
Chủ quyền vector, quyền quản trị tọa độ ý nghĩa
Từ câu chuyện chủ quyền nhận thức, ta cần gọi đúng tên một “mặt trận” mới. Nó xuất phát từ kỹ thuật, nhưng tác động lại rất chính trị, đó là chủ quyền vector (vector sovereignty).
Trong các hệ thống AI hiện nay, máy không “hiểu” chữ theo kiểu con người đọc chữ. Nó biến từ ngữ, câu văn, hình ảnh thành những con số, rồi đặt các con số ấy lên một “bản đồ ý nghĩa” nhiều chiều. Trên bản đồ này, những thứ có nội dung gần nhau sẽ được đặt gần nhau, những thứ trái ngược thì bị đặt xa nhau.
Trong các hệ thống AI hiện nay, máy không “hiểu” chữ theo kiểu con người đọc chữ. Nó biến từ ngữ, câu văn, hình ảnh thành những con số, rồi đặt các con số ấy lên một “bản đồ ý nghĩa” nhiều chiều.
Bạn có thể hình dung đơn giản thế này: từ “Biển Đông” sẽ được máy đặt gần những cụm như “chủ quyền”, “luật biển”, “đường cơ sở”, và cũng có thể bị kéo gần những cụm từ khác tùy theo dữ liệu mà nó học. Khi người dùng hỏi, AI sẽ đi tìm trong “bản đồ ý nghĩa” đó những thông tin nó cho là liên quan nhất, rồi sắp xếp, ghép nối, và tạo thành câu trả lời.
Vì vậy, vấn đề không chỉ là dữ liệu có đúng hay không. Mà là bản đồ ý nghĩa ấy được vẽ theo cách nào? bởi ai? và theo hệ quy chiếu nào? Ai kiểm soát “bản đồ”, người đó có lợi thế rất lớn trong việc định hình cách máy trả lời, và gián tiếp định hình cách xã hội hiểu về một vấn đề.
Vì vậy, nếu chủ quyền dữ liệu (data sovereignty) là quyền quản trị dữ liệu thô, ai thu thập, ai lưu trữ, ai sử dụng, thì chủ quyền vector là quyền quản trị “tọa độ ý nghĩa”, cách mà các giá trị văn hóa, chính trị, lịch sử của một dân tộc được mã hóa, liên kết, và tái diễn giải trong không gian số.
Điều này nghe trừu tượng, nhưng tác động rất thật. Trong môi trường tìm kiếm và trợ lý ảo, thứ được ưu tiên không chỉ là thông tin, mà là “mối liên hệ” giữa các thông tin. Một khái niệm bị đặt sai “hàng xóm” trong không gian ý nghĩa, thì người dùng sẽ dần hiểu sai quan hệ nhân quả, hiểu sai vai trò của chủ thể, hiểu sai bối cảnh. Sai lệch này khó phát hiện, vì câu trả lời vẫn trôi chảy, vẫn có vẻ hợp lý.
Khi câu chữ trở thành đường biên
Ở Việt Nam, các thí dụ dễ thấy nhất thường nằm ở ba vùng nhạy cảm của ký ức và căn tính.
Thứ nhấtlà vấn đề chủ quyền và lợi ích quốc gia trên không gian mạng. Khi người dùng hỏi trợ lý ảo về các chủ đề liên quan đến chủ quyền biển đảo, biên giới, tranh chấp, nếu mô hình quen dùng giọng “cân bằng giả tạo”, lặp lại những cụm từ kiểu “có nhiều quan điểm”, “khó xác định”, “tranh chấp phức tạp”, thì sự khẳng định chính đáng rất dễ bị làm nhạt. Nguy cơ không nằm ở một câu trả lời sai cụ thể, mà nằm ở việc tạo ra thói quen diễn giải mơ hồ, lặp đi lặp lại hàng triệu lần.
Nguy cơ không nằm ở một câu trả lời sai cụ thể, mà nằm ở việc tạo ra thói quen diễn giải mơ hồ, lặp đi lặp lại hàng triệu lần.
Thứ hai là lịch sử và giáo dục. Hãy hình dung một học sinh nhờ công cụ tạo sinh viết bài về một giai đoạn lịch sử, hoặc tóm tắt một văn kiện quan trọng. Nếu công cụ dựa chủ yếu vào nguồn thứ cấp, dịch lại từ nguồn nước ngoài, hoặc trộn lẫn các diễn giải không phù hợp với chương trình giáo dục và tài liệu chính thống, thì ký ức tập thể bị “làm phẳng” rất nhanh. Mất mát ở đây là mất mạch kể, mất bối cảnh, mất trọng tâm chủ thể.
Thứ ba là pháp lý và quản trị công. Khi cán bộ, doanh nghiệp, người dân hỏi về quy định, thủ tục, nghĩa vụ, nếu hệ thống trả lời dựa trên văn bản lỗi thời, hoặc diễn giải theo “thói quen ngôn ngữ” của dữ liệu huấn luyện thay vì theo câu chữ và tinh thần văn bản pháp luật Việt Nam, thì hậu quả có thể là quyết định sai, hành vi sai, rủi ro pháp lý tăng lên. Một xã hội càng số hóa, càng cần câu trả lời đúng, có nguồn, có khả năng đối chiếu.
Ba ví dụ đó cho thấy, chủ quyền hôm nay không chỉ nằm ở máy chủ đặt ở đâu, mà nằm ở việc ta có kiểm soát được “hệ tọa độ ý nghĩa” hay không.
Bẫy trung lập, khi né tránh trở thành một lập trường
Nhiều người tin AI trung lập vì nó “chỉ tổng hợp từ dữ liệu”. Nhưng trung lập trong kỹ thuật không đồng nghĩa trung lập trong chính trị. Một hệ thống được huấn luyện để tránh xung đột thường có xu hướng dùng ngôn ngữ lửng lơ, cân bằng giả tạo, né gọi đúng tên.
Đây là bẫy trung lập (neutrality trap). Trong các vấn đề liên quan đến chủ quyền, nếu câu trả lời luôn “cẩn trọng quá mức”, không dám xác quyết ngay cả khi có nguồn chính thống, thì người dùng dần quen với trạng thái nửa tin nửa ngờ. Và khi niềm tin vào điều đúng bị làm mỏng, không gian cho thao túng sẽ rộng hơn.
Điều đáng ngại là sự xói mòn này diễn ra như nước chảy đá mòn. Không có cú sốc. Không có tiếng nổ. Chỉ có sự thay đổi lặng lẽ trong cách ta gọi tên.
Ký ức số quốc gia, không thể gửi nhờ người khác giữ hộ
Mỗi quốc gia có ký ức tập thể, được lưu trong sách, di tích, lời kể, âm thanh và hình ảnh. Trong thế kỷ số, ký ức ấy ngày càng nằm trong các kho tư liệu, đặc biệt là tư liệu báo chí, phát thanh, truyền hình, phim tài liệu, ảnh, băng ghi âm.
Ký ức số quốc gia cần được bảo vệ và truy hồi đúng trong kỷ nguyên AI.
Nếu coi ký ức số quốc gia (national digital memory) là “bộ gen văn hóa”, thì các thiết chế lưu trữ và truyền thông quốc gia là nơi bảo tồn chuỗi gen ấy. Nhưng trong kỷ nguyên AI, bảo tồn không còn là cất giữ. Bảo tồn là làm cho ký ức có thể được truy hồi đúng, hiểu đúng, và dùng đúng, trong hệ thống tìm kiếm, trợ lý ảo, và công cụ giáo dục.
Ở Việt Nam, tư liệu báo chí, phát thanh, truyền hình, phim tài liệu, ảnh tư liệu, nếu được số hóa tốt, gắn siêu dữ liệu (metadata) chuẩn, có phân quyền rõ, có thẩm định nguồn, thì không chỉ là “kho lưu trữ”. Nó trở thành nền tảng tri thức có thẩm quyền, giúp AI trả lời đúng, giúp giáo dục bớt lệ thuộc vào nguồn trôi nổi, giúp xã hội có điểm tựa để kiểm chứng.
Tự chủ không nằm ở vỏ, mà nằm ở lõi
Có một ảo tưởng đang lan rộng, rằng chỉ cần dùng phần mềm tiếng Việt, đặt máy chủ trong nước, là đã tự chủ. Nhưng tự chủ thật sự không nằm ở vỏ. Nếu trọng số (weights), kiến trúc, không gian vector, dữ liệu huấn luyện chủ yếu do bên ngoài quyết định, nếu ta thiếu năng lực kiểm định, thì ta đang thuê năng lực, chứ chưa làm chủ.
Muốn đi tới chủ quyền thực chất, có thể nhìn theo ba tầng hành động, vừa kỹ thuật vừa thể chế.
Tầng thứ nhất là dữ liệu sạch và quản trị dữ liệu. Chuẩn hóa, số hóa, gắn siêu dữ liệu, phân quyền, tạo hành lang pháp lý để dữ liệu ký ức trở thành nền tảng tri thức có thẩm quyền, dùng được cho tìm kiếm và trợ lý ảo.
Cần xây dựng các kho dữ liệu và công cụ trong nước để tạo ra “bản đồ ý nghĩa” đáng tin cậy cho các lĩnh vực cốt lõi như lịch sử, pháp lý, giáo dục, văn hóa, ngôn ngữ.
Tầng thứ hai là năng lực làm chủ bản đồ ý nghĩa. Cần xây dựng các kho dữ liệu và công cụ trong nước để tạo ra “bản đồ ý nghĩa” đáng tin cậy cho các lĩnh vực cốt lõi như lịch sử, pháp lý, giáo dục, văn hóa, ngôn ngữ. Đây không nhất thiết là cuộc đua mô hình càng lớn càng tốt, mà là cuộc đua về dữ liệu sạch, chuẩn mực diễn giải, và quy trình kiểm định.
Tầng thứ ba, cơ chế kiểm chứng xã hội. Chủ quyền nhận thức không thể phó thác hoàn toàn cho kỹ thuật. Nó cần kiểm định độc lập, phản biện học thuật, và sự tham gia của báo chí, giáo dục, cộng đồng chuyên gia. Một xã hội khỏe là xã hội biết đặt câu hỏi, biết đối chiếu nguồn, biết tranh luận trên nền tảng sự thật, thay vì dựa hoàn toàn vào “thẩm quyền máy móc”.
Kết luận, chủ quyền hôm nay là quyền định nghĩa
Nếu chủ quyền truyền thống là quyền bảo vệ biên giới lãnh thổ, thì chủ quyền thời AI là quyền bảo vệ biên giới tri thức. Đây không chỉ là bài toán công nghệ. Đây là một thách thức an ninh phi truyền thống, nơi sự xói mòn diễn ra qua thông tin, qua ký ức số, qua hệ tọa độ ý nghĩa, âm thầm nhưng có sức công phá lâu dài.
Nếu chủ quyền truyền thống là quyền bảo vệ biên giới lãnh thổ, thì chủ quyền thời AI là quyền bảo vệ biên giới tri thức.
Nếu chủ quyền truyền thống là quyền bảo vệ biên giới lãnh thổ, thì chủ quyền thời AI là quyền bảo vệ biên giới tri thức.
Chủ quyền vector không phải là đóng cửa. Đó là mở cửa có điều kiện. Hợp tác nhưng không lệ thuộc. Tiếp thu nhưng không tự làm mờ giọng nói của mình. Và quan trọng nhất, xây dựng một lũy tre xanh trên không gian số, bằng dữ liệu sạch, bằng ký ức số có thẩm quyền, bằng năng lực kỹ thuật, và bằng ý chí chính trị, để bảo vệ chủ quyền nhận thức và tương lai của dân tộc.
Cần xây dựng một "lũy tre xanh" trên không gian số, bằng dữ liệu sạch, bằng ký ức số có thẩm quyền, bằng năng lực kỹ thuật, và bằng ý chí chính trị, để bảo vệ chủ quyền nhận thức và tương lai của dân tộc.
-----------------------------------------
Nguồn tham khảo
• Báo Nhân Dân điện tử, bài giới thiệu cuốn sách về an ninh quốc gia do Bộ trưởng Công an Tô Lâm chủ biên, ngày 30/11/2021.
• GS,TS Tô Lâm, sách về an ninh quốc gia và những điểm mới trong Văn kiện Đại hội XIII.
• Lee A. Bygrave, nghiên cứu về học máy (machine learning), chủ quyền nhận thức và quyền bảo vệ dữ liệu (data protection) liên quan đến quyết định tự động (automated decisions).
• Nick Couldry và Ulises A. Mejias, các nghiên cứu về chủ nghĩa thực dân dữ liệu (data colonialism).
Đào Trung Thành Chuyên gia tư vấn chiến lược Công nghệ thông tin và Trí tuệ nhân tạo