Dữ liệu KH-CN: Từ 'kho lưu trữ' đến tài sản chiến lược trong kỷ nguyên mới

Dữ liệu KH-CN: Từ 'kho lưu trữ' đến tài sản chiến lược trong kỷ nguyên mới
2 giờ trướcBài gốc
Dữ liệu không còn là những con số nằm im trong máy chủ, mà đã trở thành hàng hóa, thành tài sản quốc gia. Năm 2026, Luật Dữ liệu chính thức có hiệu lực, đánh dấu một bước ngoặt lịch sử cho ngành KH-CN Việt Nam.
Ông Tạ Bá Hưng – Nguyên Cục trưởng Cục Thông tin Khoa học và Công nghệ Quốc gia (nay là Cục Thông tin - Thống kê thuộc Bộ KH-CN).
Lần đầu tiên, dữ liệu được định danh rõ ràng là một loại tài sản đặc biệt, có thể giao dịch và tạo ra giá trị thặng dư. Để làm rõ hơn về "xương sống" của thị trường mới này, Tạp chí Một Thế Giới đã có cuộc đối thoại chuyên sâu với ông Tạ Bá Hưng – Nguyên Cục trưởng Cục Thông tin Khoa học và Công nghệ Quốc gia (nay là Cục Thông tin - Thống kê thuộc Bộ KH-CN).
Tài nguyên dữ liệu và khung pháp lý
- Thưa ông, năm 2026 được coi là "năm bản lề" khi Luật Dữ liệu chính thức đi vào cuộc sống. Ông đánh giá thế nào về tác động của hành lang pháp lý này đối với cộng đồng khoa học hiện nay?
- Ông Tạ Bá Hưng: Có thể nói, chúng ta đang đứng trước một cuộc "đại hồng thủy" về dữ liệu nhưng lại thiếu những "con tàu" đủ vững chãi để chuyên chở chúng. Trước năm 2026, dữ liệu KH-CN tại Việt Nam giống như những "ốc đảo" - rời rạc, thiếu quy chuẩn và quan trọng nhất là không có giá trị pháp lý khi mang ra trao đổi.
Luật Dữ liệu xuất hiện như một "khung xương" vững chắc. Nó giải quyết ba bài toán then chốt. Đó là xác định rõ ai là chủ sở hữu dữ liệu (Nhà nước, tổ chức hay cá nhân nhà khoa học); Buộc các dòng dữ liệu phải "nói cùng một ngôn ngữ" để có thể kết nối toàn quốc; Biến dữ liệu từ một sản phẩm phụ của nghiên cứu thành một loại tài sản có thể định giá, góp vốn và chuyển nhượng.
Dữ liệu hiện nay không chỉ là những bộ dữ liệu manh mún mà nó phải tổng hợp lại thành tài nguyên, tài nguyên của quốc gia. Sắp tới, ví dụ, hoạt động AI của chúng ta có phát triển và chất lượng của các AI có tốt hay không sẽ phụ thuộc rất nhiều vào khối lượng và chất lượng dữ liệu chúng ta sở hữu.
Cho nên, việc thể chế hóa thành Luật về dữ liệu là rất quan trọng. Luật không chỉ tạo sân chơi mà còn tạo ra những quy định, khuôn khổ: một mặt là khơi thông và sử dụng tốt những dạng dữ liệu này, mặt khác là đảm bảo bảo vệ những dữ liệu cần bảo vệ (như bí mật quốc gia hay quyền riêng tư cá nhân). Nếu luật chơi hợp lý, nó sẽ thu hút được rất nhiều người tham gia.
- Dữ liệu nghiên cứu trong lĩnh vực KH-CN có những đặc thù gì so với các loại dữ liệu cá nhân hay dữ liệu thông thường?
- Ông Tạ Bá Hưng: Dữ liệu nghiên cứu, mà thông tin KH-CN quan trọng nhất là loại này, quan tâm đến ba yếu tố chính: Tính chính xác của nó; Tính có thể khai thác và tương tác sử dụng được; Phải có quy định để tránh trường hợp chia sẻ ảnh hưởng đến việc đăng ký bằng sở hữu trí tuệ, bằng sáng chế độc quyền.
Nếu không tính toán và quy định rõ, việc công bố dữ liệu trên Sàn giao dịch có thể vô hình trung được coi là một lần đã bộc lộ sáng chế của mình, và khi đó cơ quan chức năng sẽ không cấp bằng độc quyền cho nữa. Do đó, cần cân nhắc kỹ cái gì và khi nào công bố, công bố ở mức độ nào với dữ liệu và kế hoạch nghiên cứu. Đây là chuyện dài, nhưng các nước trên thế giới cũng đã có kinh nghiệm khai thác rồi, chúng ta hoàn toàn có thể học tập.
- Ông đánh giá thế nào về việc quản lý và khai thác dữ liệu của Việt Nam hiện nay?
- Ông Tạ Bá Hưng: Hiện nay, các cơ quan đã nhận thức rõ hơn về việc phải quản lý dữ liệu sao cho hiệu quả. Vai trò của việc tích hợp dữ liệu là rất quan trọng. Ví dụ như dữ liệu về dân số liên quan đến rất nhiều lĩnh vực khác nhau. Nếu không tích hợp, các Bộ, ngành, địa phương đua nhau đầu tư vào những cơ sở dữ liệu (CSDL) chồng chéo, lãng phí.
Việc chia sẻ này mang đến hai khía cạnh, đó là trách nhiệm của công dân, của các cơ quan, tổ chức về dữ liệu của mình và đóng góp cho xã hội và công cụ pháp lý mà Nhà nước ban hành để điều tiết, huy động sự tham gia, và quy định giám sát, thưởng phạt.
Việc triển khai các CSDL Quốc gia về dân số, đất đai, doanh nghiệp trong thời gian qua đã bắt đầu có những thành tựu tốt. Vấn đề sắp tới là làm thế nào để tích hợp nó thành một tài nguyên dữ liệu của toàn quốc, đảm bảo dữ liệu là sạch, sống và được cập nhật liên tục để có thể sử dụng được.
Để dữ liệu trở thành tài sản, nó phải trải qua quá trình "vốn hóa". Trong kinh tế học hiện đại, dữ liệu có đặc tính của một hàng hóa công nhưng lại mang giá trị thương mại tư nhân cao.
Dữ liệu KH-CN không giống dữ liệu tiêu dùng. Đó là kết quả của hàng ngàn giờ thí nghiệm, của những sai số và thành công. Ví dụ, dữ liệu về gen cây trồng bản địa hay biến đổi khí hậu tại Việt Nam là cực kỳ đắt giá với các tập đoàn công nghệ sinh học toàn cầu.
Khác với tài sản vật chất (dùng là hao mòn), dữ liệu càng dùng càng giá trị. Luật Dữ liệu 2026 cho phép chúng ta xây dựng các sàn giao dịch dữ liệu, nơi nhà khoa học có thể bán quyền truy cập cho doanh nghiệp để ứng dụng vào sản xuất ngay lập tức.
Luật Dữ liệu 2026 không đơn thuần là những con chữ khô khan trên mặt giấy. Đó là lời khẳng định rằng: Trong thế kỷ 21, quốc gia nào làm chủ được dữ liệu, quốc gia đó làm chủ được vận mệnh phát triển. Với những người làm khoa học, đây là lúc để bước ra khỏi "tháp ngà" và đưa những giá trị xám vào dòng chảy kinh tế thực thụ.
- Trong lĩnh vực thông tin KH-CN, việc tích hợp CSDL Quốc gia có vai trò gì trong việc chống lãng phí và nâng cao hiệu quả đầu tư?
- Ông Tạ Bá Hưng: Việc chia sẻ những dữ liệu chắc chắn sẽ mang lại tác dụng và hiệu quả rất lớn.
Tận dụng tối đa: Dữ liệu càng nhiều người sử dụng thì càng có giá trị. Nếu CSDL Quốc gia tự xây dựng mà không chia sẻ, ít người sử dụng sẽ dẫn đến lãng phí nguồn lực.
Hiệu quả đầu tư: Nhà nước bỏ ra hàng chục tỷ đồng mỗi năm để mua CSDL và tài liệu KH-CN quốc tế. Nếu không tuyên truyền và mở rộng để nhiều người cùng sử dụng, đó cũng là sự lãng phí kinh tế của Nhà nước.
Với những người làm khoa học, đây là lúc bước ra khỏi "tháp ngà" và đưa những giá trị xám vào dòng chảy kinh tế thực thụ.
Trong Nghị định về chức năng, nhiệm vụ của các tổ chức thuộc Bộ KH-CN, Bộ cũng giao nhiệm vụ rất quan trọng cho Cục Thông tin: Phát triển và bổ sung tập trung nguồn tin của KH-CN. Điều này có nghĩa là thay vì các viện, các trường, các ngành tự mua nguồn tin riêng lẻ dẫn đến trùng lặp, Nhà nước sẽ đầu tư tập trung, sử dụng hạ tầng thông tin hiện tại để giúp mọi người có thể truy cập và sử dụng rộng rãi, tránh được tình trạng trùng lặp, nâng cao hiệu quả đầu tư công.
- Với ý định thành lập Sàn giao dịch dữ liệu, theo ông, thách thức lớn nhất của Việt Nam là gì khi nhiều nước phát triển cũng đối mặt với khó khăn tương tự?
- Ông Tạ Bá Hưng: Đó là nỗi sợ "mất bản quyền" và "an ninh dữ liệu". Nhà khoa học sợ rằng khi chia sẻ dữ liệu, họ sẽ mất đi lợi thế nghiên cứu.
Để giải quyết, Luật Dữ liệu 2026 đã tích hợp các quy định về công nghệ bảo mật (PETs) và Blockchain. Mọi giao dịch dữ liệu đều được lưu vết, không thể tẩy xóa. Tuy nhiên, chúng ta vẫn cần một sự thay đổi về tư duy: Từ "giữ kín để bảo tồn" sang "chia sẻ để phát triển".
Dữ liệu nếu chỉ nằm trong ổ cứng của nhà khoa học, nó là dữ liệu chết. Khi nó được đưa lên sàn giao dịch và kết nối với nhu cầu của doanh nghiệp, nó mới thực sự là tài sản.
Chủ trương lập sàn là đúng, nhưng trước khi triển khai vào thực tế phải nghiên cứu rất kỹ tính khả thi. Thách thức lớn nhất không chỉ nằm ở kỹ thuật mà còn ở tâm lý xã hội:
Tâm lý chia sẻ: Tâm lý của con người, của địa phương, của các viện, trường là muốn giữ dữ liệu. Nếu không thể chế hóa được luật chơi mà mọi người đều chấp nhận và thấy cần thiết, việc triển khai sẽ phức tạp. Người có dữ liệu chưa chắc đã sẵn sàng đóng góp và chia sẻ.
Nguy cơ trục lợi và bảo mật: Những đối tượng tiêu cực có thể trục lợi nhanh hơn. Dữ liệu liên quan không chỉ là dữ liệu riêng tư mà còn mang tính chất bí mật quốc gia hoặc là tài sản công nghệ của các doanh nghiệp. Cần phải có công cụ pháp lý cần và đủ để bảo vệ.
Vấn đề sở hữu trí tuệ: Việc công bố dữ liệu phải đảm bảo không ảnh hưởng đến quyền đăng ký sáng chế độc quyền.
Theo tôi, tốt nhất là phải làm từng bước, từ cái dễ đến cái phức tạp. Vừa làm vừa hoàn thiện, nâng cao nhận thức và chứng tỏ cho mọi người thấy đây là môi trường cần phải tham gia, có lợi cho cá nhân, đơn vị và xã hội.
- Với doanh nghiệp, dữ liệu ngày nay được xem như một loại tài sản. Theo ông, sàn giao dịch dữ liệu có thể tạo ra một sân chơi công bằng cho tất cả các doanh nghiệp không?
- Ông Tạ Bá Hưng: Đối với các doanh nghiệp, họ giữ dữ liệu của họ quan trọng, có khi hơn cả tiền mặt, vì nó liên quan đến sự sống còn và phát triển của họ.
Chia sẻ có điều kiện: Bước đầu, chắc chắn không thể tất cả dữ liệu được chia sẻ trên sàn. Chỉ những dữ liệu nào mà việc chia sẻ mang lại lợi ích cho doanh nghiệp và người khác sử dụng mới được đưa lên.
Cơ chế mua bán, trao đổi: Sàn giao dịch sẽ là nơi để các bên biết nhau có gì và khi cần thì trao đổi, mua bán. Dữ liệu là tiền, là tài sản. Doanh nghiệp có thể chọn bán, cho không (những dữ liệu muốn người khác biết để quảng bá), hoặc trao đổi hàng đổi hàng (anh có cái tôi cần, tôi có cái anh cần).
Vận hành linh hoạt: Cơ chế vận hành sàn cần linh hoạt, không chỉ là chia sẻ rộng rãi. Nó phải tạo ra sân chơi để mọi người biết được cái gì đang có và điều kiện gì để truy cập dữ liệu.
Ví dụ trong lĩnh vực KH-CN, Bộ KH-CN quản lý việc công bố khoa học (các bài đăng trên tạp chí). Tạp chí có thể đưa thông tin bài báo lên CSDL chung, nhưng phải có thời gian bảo hộ công văn - tức là sau vài tháng (khi tạp chí đã bán hết số của mình), bài viết mới được công bố rộng rãi. Điều này vừa đảm bảo lợi ích kinh doanh của tạp chí (có tiền) vừa giúp các nhà khoa học đạt được chỉ số trích dẫn cao hơn do bài viết được nhiều người tiếp cận.
Tóm lại, sàn giao dịch dữ liệu là xu hướng tất yếu, nhưng cần có công cụ pháp lý và cơ chế vận hành chi tiết, linh hoạt để đảm bảo cân bằng lợi ích giữa trách nhiệm xã hội, bảo vệ tài sản doanh nghiệp, và quyền riêng tư cá nhân.
Xin cảm ơn ông về những chia sẻ!
Tuyết Nhung (thực hiện)
Nguồn Một Thế Giới : https://1thegioi.vn/du-lieu-kh-cn-tu-kho-luu-tru-den-tai-san-chien-luoc-trong-ky-nguyen-moi-246281.html