Trung Quốc phát triển SciencePedia để hạ bệ Wikipedia?

Trung Quốc phát triển SciencePedia để hạ bệ Wikipedia?
3 giờ trướcBài gốc
Wikipedia đang chịu áp lực cạnh tranh từ trí tuệ nhân tạo
Không chỉ cạnh tranh Wikipedia, SciencePedia ra đời còn nhắm khắc phục khiếm khuyết căn bản trong cách lưu trữ tri thức khoa học, cụ thể là việc mất đi các chuỗi lập luận dẫn xuất, hay còn gọi là “vật chất tối của tri thức”.
SciencePedia sử dụng một tác nhân AI Socrates để tạo ra 3 triệu câu hỏi dựa trên nguyên lý đầu tiên thuộc 200 khóa học, mỗi câu hỏi được nhiều mô hình ngôn ngữ lớn (LLM) độc lập giải và đối chiếu chéo kết quả để đảm bảo độ chính xác.
Cách tiếp cận này tạo nên một cơ sở tri thức Chuỗi Lập Luận Dài (Long Chain-of-Thought – LCoT), trong đó mọi khái niệm đều được lần ngược về tận những nguyên lý nền tảng, giúp tăng tính minh bạch và khả năng kiểm chứng.
Nền tảng còn tích hợp Công cụ Tìm kiếm Động não (Brainstorm Search Engine), cho phép người dùng thực hiện tra cứu ngược – tức là theo dõi chuỗi lập luận thay vì chỉ tìm định nghĩa. Hiện SciencePedia đã chứa khoảng 200.000 mục tri thức trong các lĩnh vực STEM, với bài viết có mật độ thông tin cao hơn và giảm 50% hiện tượng “ảo tưởng” (hallucination) so với các chuẩn đánh giá dựa trên GPT-4.
Sự đổi mới này mở ra cơ hội kinh doanh đáng kể trong các lĩnh vực như công cụ học tập ứng dụng AI, quản lý tri thức doanh nghiệp, và kiểm chứng nghiên cứu khoa học.
AI tạo tiến bộ trong quản lý thông tin
Những tiến bộ gần đây trong quản lý tri thức bằng AI đang làm thay đổi cách lưu trữ và truy cập thông tin khoa học, giải quyết những hạn chế tồn tại lâu nay ở các bách khoa toàn thư truyền thống như Wikipedia.
Theo một bài nghiên cứu của Google năm 2022 về phương pháp “chuỗi lập luận” (chain-of-thought prompting), các kho tri thức hiện nay thường ưu tiên kết luận ngắn gọn thay vì trình bày toàn bộ quá trình suy luận, khiến mối liên kết từ các nguyên lý cơ bản đến lý thuyết phức tạp bị đứt đoạn — hiện tượng được gọi là “vật chất tối của tri thức”.
Để khắc phục, các hệ thống AI tiên tiến – đặc biệt từ các tập đoàn công nghệ Trung Quốc – đang nổi lên nhằm xây dựng những bách khoa toàn thư có khả năng lập luận mạnh mẽ hơn.
Chẳng hạn, Ernie Bot của Baidu ra mắt tháng 3.2023 có thể tạo nội dung mang tính giải thích sâu, dù chưa phải là đối thủ trực tiếp của Wikipedia. Cùng năm, Viện Khoa học Trung Quốc cũng triển khai một dự án tương tự, sử dụng các tác nhân AI tạo hơn 1 triệu cặp hỏi-đáp trong lĩnh vực STEM tính đến giữa năm 2023.
Những nỗ lực này cho thấy xu hướng chuyển dịch sang các kho tri thức có khả năng kiểm chứng, dựa trên lập luận có thể truy xuất.
Trên bình diện toàn cầu, điều này phù hợp với xu thế chung: AI được dùng để gia tăng “mật độ tri thức”. Theo báo cáo của McKinsey năm 2024, các nền tảng học tập tăng cường bởi AI có thể cải thiện khả năng ghi nhớ kiến thức lên 30%.
Với hơn 100 tỉ nhân dân tệ đầu tư cho AI trong năm 2023 (theo truyền thông nhà nước), Trung Quốc đang trở thành quốc gia dẫn đầu về AI phục vụ khoa học và giáo dục, nhờ đó dần làm rõ những “vùng tối” trong lưu trữ tri thức và thúc đẩy các hệ thống tri thức động, có thể truy vết toàn bộ quá trình suy luận.
Tác động về kinh tế của những đổi mới
Theo Gartner năm 2023, các công cụ quản lý tri thức ứng dụng AI sẽ chiếm thị trường 50 tỉ USD vào năm 2025, với tăng trưởng mạnh ở khu vực châu Á – Thái Bình Dương, nhờ sự bứt phá của Trung Quốc.
Các doanh nghiệp có thể thu phí truy cập nâng cao để cung cấp chuỗi lập luận được kiểm chứng – tương tự mô hình LinkedIn Learning trong đào tạo trực tuyến.
Đặc biệt trong lĩnh vực nghiên cứu và phát triển (R&D), các công ty dược phẩm có thể dùng AI để lần ngược quy trình phát triển thuốc từ mức độ phân tử, giúp giảm sai sót đến 25% theo nghiên cứu của Deloitte 2024 về AI trong y tế.
Cạnh tranh trong lĩnh vực này đang trở nên gay gắt, khi Alibaba và Tencent đều đầu tư mạnh. Học viện DAMO của Alibaba từng báo cáo năm 2023 rằng các mô hình AI của họ có thể đối chiếu dữ liệu khoa học để tăng độ chính xác.
Tuy nhiên, vẫn tồn tại các rào cản pháp lý, như Luật Bảo vệ Thông tin Cá nhân của Trung Quốc (2021), với mức phạt lên tới 50 triệu nhân dân tệ nếu vi phạm. Về đạo đức, UNESCO (2023) nhấn mạnh tầm quan trọng của tính minh bạch và kiểm chứng để ngăn ngừa thiên vị dữ liệu.
Nhìn chung, thị trường này mở ra cơ hội lớn cho các công ty khởi nghiệp chuyên biệt, chẳng hạn phát triển công cụ tìm kiếm ngược cho kỹ sư, có thể mang lại tăng trưởng doanh thu 15% mỗi năm (theo Forrester 2024).
Nhờ khắc phục nhược điểm “nén tri thức” của các hệ thống truyền thống, doanh nghiệp có thể tận dụng AI như một lợi thế cạnh tranh trong đổi mới sáng tạo.
Về mặt kỹ thuật, các hệ thống này hoạt động theo kiến trúc đa tác nhân (multi-agent), trong đó nhiều mô hình ngôn ngữ độc lập cùng giải quyết vấn đề và đối chiếu chéo kết quả, qua đó giảm thiểu “ảo tưởng”.
Dùng phương pháp chuỗi lặp để giảm sai sót
Theo nghiên cứu của OpenAI năm 2022, phương pháp chuỗi lập luận nhiều bước có thể giảm sai sót 40% trong các truy vấn phức tạp.
Dẫu vậy, thách thức chính nằm ở chi phí tính toán: việc tạo hàng triệu câu hỏi như SciencePedia đòi hỏi tài nguyên GPU khổng lồ – ước tính theo báo cáo NVIDIA 2023 có thể tiêu tốn tới 1 triệu USD cho những đợt huấn luyện tương tự.
Các giải pháp được áp dụng bao gồm tối ưu lời nhắc (prompt) và tính toán phân tán, như trong bản cập nhật mô hình Pangu của Huawei năm 2023, giúp giảm mức tiêu thụ năng lượng.
Triển vọng tương lai là các đồ thị tri thức tích hợp với hơn 200.000 mục tri thức vào năm 2025, trải rộng từ toán học đến sinh học (theo dự báo IDC 2024).
Những mô hình của Baidu năm 2023 đã giảm 50% sai sót so với tiêu chuẩn cơ sở, minh chứng cho lợi thế cạnh tranh của Trung Quốc trong lĩnh vực này.
Tuy nhiên, các vấn đề đạo đức vẫn được đặt lên hàng đầu – đòi hỏi chuỗi suy luận có thể kiểm chứng để xây dựng niềm tin và chống lan truyền thông tin sai lệch.
Dù chi phí mở rộng còn cao, dịch vụ đám mây đang giúp tăng khả năng triển khai thực tế, và hiệu quả của các công cụ tri thức AI được dự báo sẽ tăng 20% vào năm 2026
Bùi Tú
Nguồn Một Thế Giới : https://1thegioi.vn/trung-quoc-phat-trien-sciencepedia-de-ha-be-wikipedia-240755.html