Nhân dịp đầu xuân Bính Ngọ 2026, Tạp chí Một Thế giới đã có cuộc trao đổi với ông Tạ Bá Hưng – Nguyên Cục trưởng Cục Thông tin KH-CN Quốc gia (nay là Cục Thông tin – Thống kê thuộc Bộ KH-CN), một trong những chuyên gia đầu ngành, để nhận diện những nút thắt và lộ trình "khơi thông" dòng chảy tri thức số Việt Nam và cả những kỳ vọng về một "trục xương sống" dữ liệu số bền vững cho nền khoa học nước nhà, đặc biệt là việc xây dựng cơ sở dữ liệu (CSDL) KH-CN quốc gia thống nhất, liên thông, theo tinh thần của các Nghị quyết và hướng dẫn của Nghị định 262/2025.
Chuyển đổi số: Hoạt động xuyên suốt và yêu cầu thiết yếu
- Thưa ông, chuyển đổi số (CĐS) trong lĩnh vực KH-CN được định nghĩa như thế nào trong bối cảnh hiện nay?
- Ông Tạ Bá Hưng: Trong cuộc cách mạng công nghiệp lần thứ tư, chuyển đổi số (CĐS) không còn là một lựa chọn mà đã trở thành "hệ điều hành" mới của mọi lĩnh vực. Riêng với khoa học, công nghệ và đổi mới sáng tạo (KH, CN&ĐMST), CĐS mang một sứ mệnh đặc biệt: Nó vừa là đối tượng cần nghiên cứu, vừa là công cụ cốt lõi để thúc đẩy năng suất của chính hoạt động nghiên cứu đó.
Ông Tạ Bá Hưng – Nguyên Cục trưởng Cục Thông tin KH-CN Quốc gia (nay là Cục Thông tin – Thống kê thuộc Bộ KH-CN)
CĐS trong KH-CN không đơn thuần là việc "tin học hóa" các quy trình quản lý hay quét các tài liệu giấy thành file PDF. Bản chất của CĐS là quá trình chuyển đổi mang tính hệ thống, thay đổi cách thức tạo ra tri thức, lưu trữ tri thức và chuyển giao tri thức dựa trên nền tảng dữ liệu số.
KH-CN là lĩnh vực tạo ra "đầu vào" cho các lĩnh vực khác. Nếu CĐS trong ngân hàng là để giao dịch nhanh hơn, thì CĐS trong KH-CN là để thông minh hóa nền kinh tế.
Trong KH-CN, sai số dữ liệu có thể dẫn đến sự sụp đổ của một công trình nghiên cứu triệu đô. Do đó, tiêu chuẩn dữ liệu trong CĐS KH-CN khắc nghiệt hơn nhiều so với thương mại điện tử. Trong bối cảnh hiện nay, CĐS trong KH-CN phải hướng tới mục tiêu: Lấy nhà khoa học làm trung tâm và lấy dữ liệu làm động lực.
CĐS trong KH-CN không phải là một công việc nhất thời, mà là một hoạt động xuyên suốt. Đó chính là phương thức tư duy, phương thức hoạt động chiếm lĩnh thực tế. Phải nói rằng, nếu không sử dụng CĐS, rất nhiều những đề án, chính sách đột phá sẽ khó thực hiện được, đặc biệt là trong vấn đề đổi mới thể chế, chính quyền địa phương và thông tin KH-CN.
Thực ra, trong thời gian qua, hoạt động thông tin KH-CN đã và đang làm CĐS khá tốt, ví dụ như việc xây dựng CSDL hay mạng thông tin để chia sẻ dữ liệu. Tuy nhiên, trong thời gian tới, nó phải được nâng lên một tầm quan trọng mới.
Tinh thần của Nghị quyết 57 đã nhấn mạnh điều này như là yêu cầu đột phá. Luật KH-CN hiện hành đã thể chế hóa tinh thần và chỉ đạo của Nghị quyết này trong một loạt các điều khoản liên quan trực tiếp đến hoạt động KH-CN.
- Thưa ông, Nghị định 262/2025 được ban hành trong bối cảnh CSDL KH-CN quốc gia còn phân tán, thiếu tính liên thông. Vậy, tinh thần của Luật KH-CN đã thể chế hóa cơ chế "chia sẻ và dùng chung" dữ liệu như thế nào để giải quyết vấn đề này?
Ông Tạ Bá Hưng: Luật KH-CN đã tập trung vào ba điểm hết sức quan trọng, tạo thành cơ chế nền tảng cho việc "chia sẻ và dùng chung" dữ liệu:
Thứ nhất là trách nhiệm bắt buộc của người hoạt động KH-CN. Ở tầm nhìn chung, Luật quy định trong những nguyên tắc hoạt động KH-CN, trách nhiệm của các bên là phải tham gia và chia sẻ, phổ biến tri thức của hoạt động KH-CN.
Cụ thể, cá nhân, tổ chức phải tham gia và cập nhật các cơ sở dữ liệu, các nền tảng số về quản lý hoạt động KH-CN quốc gia, và cập nhật thông tin của mình trên hệ thống thông tin quốc gia về hoạt động KH-CN.
Điều này có ý nghĩa sâu sắc: người hoạt động KH-CN không chỉ là đối tượng được phục vụ thông tin, mà phải có trách nhiệm đóng góp và chia sẻ thông tin. Đây là sự thể chế hóa rất quan trọng trong tinh thần của Nghị quyết.
Thứ hai là thúc đẩy chia sẻ dữ liệu nghiên cứu. Vấn đề chia sẻ dữ liệu nghiên cứu là một xu thế của thế giới nhưng ở Việt Nam chưa được nói đến nhiều, mặc dù đây là đòi hỏi khách quan và là công cụ để giúp phát triển KH-CN một cách hiệu quả.
Hiện nay, phần lớn dữ liệu từ thử nghiệm, thí nghiệm, điều tra, khảo sát... sau khi báo cáo, đề tài được bảo vệ xong thì bị "bỏ vào ngăn kéo", không được dùng chung. Điều này gây lãng phí lớn vì Nhà nước đã bỏ ra khá nhiều tiền để tạo ra dữ liệu đó. Dữ liệu nghiên cứu hết sức cần thiết vì nó không chỉ giúp nhóm nghiên cứu hoàn thành nhiệm vụ mà còn giúp các nhóm nghiên cứu khác cùng sử dụng, và là dữ liệu ban đầu cho các nghiên cứu thế hệ sau.
Dù hiện nay Luật KH-CN mới đạt mức độ khuyến khích chia sẻ dữ liệu, nhưng tôi tin rằng sắp tới, khi Nhà nước tạo ra được những khung, những chuẩn mực để chia sẻ, ta sẽ luật hóa gần như bắt buộc. Ví dụ: Khi nộp báo cáo hiệu quả nghiên cứu, phải nộp kèm theo dữ liệu để đưa vào CSDL dùng chung. Đây là bước đi quan trọng, được nêu hẳn trong Luật, về việc thu thập, chia sẻ và sử dụng hiệu quả những dữ liệu nghiên cứu.
Thứ ba là số hóa ở quy mô quốc gia và hạ tầng lõi. Tinh thần là số hóa phải ở quy mô quốc gia, không nhỏ lẻ. Điều này thể hiện qua việc tập trung vào hai yếu tố cốt lõi:
Đầu tư và duy trì hạ tầng số quản lý KH-CN: Tất cả các nhiệm vụ KH-CN, từ khi bắt đầu, kết thúc và sau khi kết thúc, mọi dữ liệu, tài liệu liên quan đến đánh giá đều được số hóa và đưa vào nền tảng.
Phát triển hệ thống thông tin quốc gia về KH-CN: Đây là nơi cung cấp thông tin trong nước và quốc tế cho tất cả các nhà khoa học, viện nghiên cứu, trường đại học. Luật cũng thúc đẩy và khuyến khích các tổ chức tham gia xây dựng CSDL trên nền tảng mở này. Nếu dữ liệu chỉ gom và giữ lại trong phạm vi nội bộ, thì rất lãng phí.
Tương lai của dữ liệu là công nghệ và AI
- Về lâu dài, việc thiếu tính liên thông giữa các CSDL của các Bộ, ngành và địa phương đang đặt ra những thách thức gì, thưa ông?
- Ông Tạ Bá Hưng: Vấn đề là CĐS trong lĩnh vực thông tin KH-CN cần được nâng cấp và áp dụng công nghệ mới. Chắc chắn, chúng ta có rất nhiều điều phải áp dụng và nâng cấp, ví dụ như: Sử dụng trí tuệ nhân tạo (AI) trong xử lý và phục vụ thông tin sao cho hiệu quả, đảm bảo tính khách quan và khoa học.
Chuyển đổi số trong KH-CN không chỉ là câu chuyện của phần mềm hay máy tính, mà là câu chuyện của sự chia sẻ và khát vọng về một Việt Nam hùng cường dựa trên tri thức.
Kết nối CSDL giữa trung ương và địa phương, các viện, các trường để làm những sàn giao dịch công nghệ, giới thiệu và kết nối viện, trường với doanh nghiệp, nhà khoa học. Kết nối theo CSDL giúp biết "cái gì là có, giá cả làm sao" và điều kiện để chuyển giao công nghệ.
Trong lộ trình chuyển đổi số quốc gia, dữ liệu được ví như "dầu mỏ" của nền kinh tế mới. Tuy nhiên, nếu dầu mỏ bị chia cắt và lưu trữ trong những bồn chứa riêng biệt không có đường ống kết nối, chúng ta không thể tạo ra năng lượng. Tình trạng thiếu liên thông giữa các CSDL của các Bộ, ngành và địa phương hiện nay đang tạo ra những "điểm nghẽn" chiến lược.
Việc thiếu tính liên thông không chỉ là vấn đề kỹ thuật mà còn là vấn đề quản trị và hiệu quả quốc gia. Điều này sẽ tạo ra 4 thách thức lớn hiện hữu:
Thứ nhất là sự lãng phí nguồn lực. Khi mỗi Bộ, ngành tự xây dựng hệ thống riêng mà không có chuẩn chung, chúng ta đang lãng phí hàng ngàn tỷ đồng cho việc thu thập trùng lặp. Một nhà khoa học khi làm đề tài nghiên cứu phải khai báo thông tin nhân thân, trình độ, và lịch sử nghiên cứu nhiều lần trên các hệ thống khác nhau của Bộ KH-CN, Bộ GD-ĐT hay các địa phương. Điều này tạo ra gánh nặng hành chính và làm nản lòng những người làm sáng tạo.
Thứ hai là "dữ liệu chết" và sự thiếu hụt bức tranh toàn cảnh. Dữ liệu chỉ có giá trị khi nó được đối soát và làm sạch. Khi dữ liệu nằm rời rạc, chúng ta chỉ thấy được "các mảnh ghép" thay vì "bức tranh toàn cảnh". Ví dụ, để đánh giá tác động của một công nghệ mới đối với kinh tế địa phương, chúng ta cần dữ liệu từ ngành KH-CN (sáng chế), ngành Công thương (sản xuất)... Thiếu liên thông khiến các quyết sách vĩ mô dựa trên những báo cáo thiếu hụt, dẫn đến rủi ro sai lệch trong dự báo.
Thứ ba là rào cản đối với đổi mới sáng tạo. Các startup và doanh nghiệp công nghệ cần dữ liệu mở để huấn luyện mô hình và phát triển sản phẩm. Khi dữ liệu bị đóng kín trong các cơ quan nhà nước, hệ sinh thái ĐMST bị mất đi "nguyên liệu" quan trọng nhất, khiến các sản phẩm AI của Việt Nam khó lòng cạnh tranh với thế giới.
Thứ tư là rủi ro về an ninh và tính toàn vẹn dữ liệu. Khi có quá nhiều hệ thống rời rạc, việc quản lý an ninh mạng trở nên phức tạp. Dữ liệu tại một nơi có thể đã được cập nhật (ví dụ: một bằng sáng chế vừa được cấp), nhưng ở hệ thống khác vẫn lưu thông tin cũ. Sự không đồng nhất này gây ra nhầm lẫn trong các giao dịch dân sự và quản lý nhà nước.
- Theo ông, các giải pháp công nghệ mới như AI có thể hỗ trợ như thế nào?
- Ông Tạ Bá Hưng: Trong bối cảnh truyền thống, việc kết nối dữ liệu thường đòi hỏi các quy chuẩn cực kỳ khắt khe và sự thống nhất tuyệt đối về định dạng - điều rất khó đạt được trong ngắn hạn. Tuy nhiên, sự xuất hiện của trí tuệ nhân tạo (AI) và đặc biệt là AI tạo sinh (Generative AI) đã thay đổi cuộc chơi.
Thách thức lớn nhất hiện nay là dữ liệu giữa các Bộ, ngành không cùng định dạng. AI có khả năng tự động đọc hiểu, trích xuất và phân loại thông tin từ các văn bản, báo cáo, bản vẽ kỹ thuật... để đưa về một chuẩn chung mà không cần con người phải nhập liệu thủ công. Điều này giúp rút ngắn thời gian liên thông dữ liệu từ hàng năm xuống còn hàng tuần.
Việc thiếu liên thông dữ liệu là một "căn bệnh" kinh niên của quá trình chuyển đổi số, nhưng AI chính là "liều thuốc" đặc trị.
AI có thể nhận diện các thực thể trùng lặp giữa các CSDL khác nhau. Chẳng hạn, một chuyên gia có thể xuất hiện với tên "Nguyễn Văn A" ở CSDL này và "N.V.A" ở CSDL kia. Các thuật toán học máy có thể xác minh và hợp nhất các hồ sơ này với độ chính xác tuyệt đối, tạo ra một "chân dung số" duy nhất và xuyên suốt.
Thay vì chỉ là những bảng biểu thô cứng, AI giúp xây dựng các đồ thị tri thức. Đây là công nghệ kết nối các mối quan hệ giữa: Nhà khoa học - Đề tài nghiên cứu - Doanh nghiệp ứng dụng - Kết quả kinh tế. Khi các CSDL được kết nối theo dạng mạng lưới này, AI có thể đưa ra các gợi ý cực kỳ chính xác cho các nhà quản lý về việc nên đầu tư vào hướng nghiên cứu nào.
Một lo ngại lớn của các Bộ, ngành là mất quyền kiểm soát dữ liệu khi liên thông. AI cung cấp giải pháp học máy liên kết. Công nghệ này cho phép huấn luyện các mô hình AI trên dữ liệu của nhiều bên mà không cần các bên phải thực sự gửi dữ liệu gốc cho nhau. Dữ liệu vẫn nằm tại máy chủ của Bộ, ngành đó, nhưng tri thức từ dữ liệu vẫn được chia sẻ và sử dụng chung cho mục đích quốc gia.
Việc thiếu liên thông dữ liệu là một "căn bệnh" kinh niên của quá trình chuyển đổi số, nhưng AI chính là "liều thuốc" đặc trị. Nếu chúng ta giải quyết được bài toán này, Việt Nam sẽ sở hữu một kho tàng tri thức khổng lồ, tạo tiền đề để khoa học thực sự trở thành động lực tăng trưởng kinh tế.
Dữ liệu là tài nguyên, nhưng chỉ khi dữ liệu chảy đi và tương tác với nhau, nó mới tạo ra giá trị thặng dư. Chuyển đổi số trong KH-CN, vì vậy, không chỉ là câu chuyện của phần mềm hay máy tính, mà là câu chuyện của sự chia sẻ và khát vọng về một Việt Nam hùng cường dựa trên tri thức.
Xin cảm ơn ông về những chia sẻ sâu sắc này!
Tuyết Nhung (thực hiện)