Đô thị thông minh: Không phải chuyện công nghệ, mà là chuyện dữ liệu

Đô thị thông minh: Không phải chuyện công nghệ, mà là chuyện dữ liệu
3 giờ trướcBài gốc
Nói đến đô thị thông minh, nhiều người nghĩ ngay đến camera, trí tuệ nhân tạo hay các trung tâm điều hành với màn hình lớn. Nhưng nếu bỏ lớp công nghệ bên ngoài đi, thứ quyết định lại nằm ở chỗ khác: dữ liệu.
Theo các tiêu chuẩn quốc tế của ISO, dữ liệu được coi là “dòng máu” của đô thị thông minh. Cách nhìn này không phải là một khái niệm mang tính lý thuyết, mà phản ánh đúng bản chất vận hành: mọi quyết định chỉ có thể chính xác khi dựa trên thông tin đo đếm được, được cập nhật theo thời gian thực hoặc gần thời gian thực.
Muốn biết một tuyến đường có bắt đầu ùn tắc hay không phải có số liệu về lưu lượng phương tiện. Muốn biết môi trường không khí có vấn đề hay không phải có số liệu quan trắc. Muốn biết một cơ sở y tế có đang quá tải hay không cũng phải có số liệu khám chữa bệnh. Nếu không có dữ liệu, việc điều hành sẽ quay lại cách quen thuộc: chờ báo cáo, hoặc dựa vào cảm nhận. Khi đó, quyết định thường đến chậm và khó tránh khỏi sai lệch.
Cao Bằng đang tích cực triển khai hệ thống camera trên nhiều tuyến đường chính, đặc biệt tại khu vực trung tâm và các điểm giao thông phức tạp.
Trong điều kiện những địa bàn còn phân tán, hạ tầng chưa đồng đều, khoảng cách giữa nơi phát sinh vấn đề và nơi ra quyết định còn lớn, hạn chế này càng bộc lộ rõ. Không phải vì thiếu nỗ lực, mà vì thiếu thông tin đủ nhanh và đủ tin cậy để hành động kịp thời.
Dữ liệu vì vậy không phải là phần phụ của hệ thống mà là hạ tầng. Nhưng cần hiểu rõ “hạ tầng” ở đây không phải là một khái niệm chung chung. Dữ liệu được coi là hạ tầng vì nó phải luôn tồn tại để các hệ thống khác sử dụng, phải được duy trì liên tục chứ không phải làm xong rồi để đó, và phải phục vụ đồng thời nhiều mục đích khác nhau. Nó không nằm yên như hồ sơ lưu trữ mà phát sinh trong quá trình vận hành, được cập nhật hàng ngày, thậm chí từng giờ, và được sử dụng lặp lại cho nhiều quyết định khác nhau. Chính đặc điểm này khiến dữ liệu trở thành nền tảng vận hành thực sự, chứ không chỉ là “thông tin tham khảo”.
Sai ở chỗ coi dữ liệu là thứ để lưu, không phải để dùng
Một vướng mắc khá phổ biến hiện nay là cách tiếp cận dữ liệu còn dừng ở mức lưu trữ. Nhiều nơi cho rằng việc quét hồ sơ giấy thành file, đưa bản đồ lên máy tính hoặc nhập báo cáo vào phần mềm đã là xây dựng dữ liệu.
Cách làm này giải quyết được việc lưu giữ, nhưng chưa tạo ra khả năng sử dụng. Dữ liệu chỉ thực sự có giá trị khi được tổ chức theo cấu trúc thống nhất để các hệ thống khác nhau có thể hiểu giống nhau. Ví dụ, “lưu lượng phương tiện” phải được đo theo cùng một cách; “chất lượng không khí” phải theo cùng một thang đo. Các tiêu chuẩn như ISO 37120 đặt ra các chỉ tiêu và phương pháp đo chính là để tạo ra sự thống nhất đó.
Tuy nhiên, việc có chuẩn chưa đồng nghĩa với việc có thể dùng chung. Chuẩn chỉ là điều kiện để các hệ thống “hiểu nhau”. Để dữ liệu thực sự được chia sẻ và sử dụng giữa các đơn vị, cần có cơ chế kết nối thông qua API, cần có quy định bắt buộc chia sẻ, và cần có mô hình quản trị rõ ràng. Nếu thiếu những yếu tố này, dữ liệu dù có chuẩn vẫn nằm rời rạc trong từng hệ thống.
Ở những nơi mà mỗi ngành, mỗi cấp đang quản lý dữ liệu theo cách riêng, không có ràng buộc chia sẻ, thì việc “có dữ liệu” không đồng nghĩa với việc “dùng được dữ liệu”.
Một lớp vấn đề sâu hơn nằm ở cách hiểu dữ liệu. Nếu cùng một khái niệm nhưng mỗi nơi định nghĩa khác nhau thì dữ liệu không thể ghép lại. Ví dụ, “hộ gia đình” hay “diện tích đất” nếu được hiểu khác nhau giữa các hệ thống, thì dù có kết nối kỹ thuật, dữ liệu vẫn không thể sử dụng chung. Đây là vấn đề về ngữ nghĩa dữ liệu - một vấn đề ít được chú ý nhưng lại là điều kiện quyết định để liên thông thực sự xảy ra.
Một hệ thống dữ liệu thực chất vận hành như một “bộ não”
Khi dữ liệu đã tồn tại và có thể kết nối, câu hỏi tiếp theo là xử lý như thế nào để phục vụ điều hành. Cách làm phổ biến là xây dựng một nền tảng dữ liệu dùng chung, có thể hiểu như “bộ não” của hệ thống. Dữ liệu từ nhiều nguồn khác nhau được đưa về đây, bao gồm dữ liệu từ thiết bị thu thập tự động, từ các hệ thống hành chính như đất đai, tài chính, từ phản ánh của người dân, cũng như các nguồn dữ liệu mở.
Điểm quan trọng là các dữ liệu này không phải được tạo ra một lần, mà phát sinh liên tục trong quá trình vận hành thực tế. Các dữ liệu này được đưa vào một lớp tích hợp, thường gọi là Data Hub hoặc Data Lake. Đây không phải là một nơi lưu trữ duy nhất theo nghĩa vật lý, mà là một lớp kết nối thống nhất để các hệ thống có thể trao đổi dữ liệu với nhau. Thành phần cốt lõi của lớp này là các giao diện kết nối, cho phép dữ liệu đi từ hệ thống này sang hệ thống khác.
Tuy nhiên, cần nhìn thẳng vào thực tế: lớp tích hợp không tự giải quyết được tình trạng phân mảnh. Nếu dữ liệu đầu vào không đúng, không có chuẩn chung hoặc không được chia sẻ, thì dù có xây dựng nền tảng, hệ thống vẫn rời rạc như cũ.
Sau khi được tích hợp, dữ liệu phải được làm sạch, chuẩn hóa và liên kết giữa các nguồn. Đây là phần công việc tốn thời gian và nguồn lực nhất, nhưng lại là điều kiện bắt buộc để dữ liệu có thể sử dụng được. Nếu bỏ qua bước này, toàn bộ hệ thống phía trên sẽ không có giá trị thực tế.
Dữ liệu vận hành theo một dòng chảy liên tục
Dữ liệu không tồn tại riêng lẻ mà vận hành theo một chuỗi liên tục. Nó phát sinh từ cấp cơ sở, nơi trực tiếp xử lý công việc hàng ngày, sau đó được đưa lên các hệ thống cấp trên thông qua các kết nối.
Tại cấp điều hành, dữ liệu được làm sạch, chuẩn hóa theo cùng cấu trúc và cùng cách hiểu, rồi được tổng hợp thành các chỉ tiêu phục vụ quản lý. Từ đó, người điều hành có thể nhìn thấy tình trạng thực tế và đưa ra quyết định.
Trong điều kiện mà nhiều hoạt động vẫn đang được thực hiện thủ công hoặc bán thủ công, việc đảm bảo dòng chảy này liên tục là một thách thức lớn. Chỉ cần một khâu bị đứt - dữ liệu không được cập nhật, không được chuẩn hóa, hoặc không được chia sẻ - thì toàn bộ hệ thống sẽ không vận hành như kỳ vọng.
Trong điều kiện lý tưởng, dữ liệu cho phép ra quyết định gần như ngay lập tức
Một ví dụ dễ thấy là giao thông. Khi một điểm bắt đầu ùn tắc, hệ thống có thể ghi nhận ngay sự thay đổi thông qua camera, dữ liệu từ phương tiện cho thấy tốc độ di chuyển giảm, và trạng thái của hệ thống đèn tín hiệu được kiểm tra đồng thời. Từ các dữ liệu này, nguyên nhân có thể được xác định và phương án xử lý có thể được đưa ra ngay. Đây là cách hệ thống vận hành trong điều kiện lý tưởng, khi dữ liệu đầy đủ, được thu thập tự động và các hệ thống đã được kết nối.
Tuy nhiên, cần nhìn vào điều kiện thực tế. Không phải nơi nào cũng có đủ cảm biến, đủ dữ liệu và đủ kết nối để đạt được mức độ này. Ở nhiều địa bàn, dữ liệu vẫn chủ yếu được tổng hợp thủ công, cập nhật theo chu kỳ, hoặc nằm rải rác ở nhiều hệ thống khác nhau. Trong điều kiện đó, việc điều hành vẫn phải dựa nhiều vào con người. Vì vậy, khả năng ra quyết định theo thời gian thực không phải là điểm xuất phát, mà là mục tiêu cần từng bước tiến tới.
Lực lượng Cảnh sát giao thông, Công an tỉnh giám sát về giao thông ùn tắc, phương tiện vi phạm trên hệ thống camera.
Công nghệ không phải nút thắt, quản trị mới là vấn đề
Trong thực tế triển khai, trở ngại lớn nhất không nằm ở công nghệ, mà nằm ở chất lượng và khả năng sử dụng của dữ liệu. Dữ liệu phải đảm bảo đúng, đủ, sạch và được cập nhật thường xuyên. Nếu dữ liệu không đáng tin cậy, mọi phân tích phía sau đều không có giá trị.
Đồng thời, cần làm rõ quyền truy cập dữ liệu, xác định ai được sử dụng, sử dụng vào mục đích gì, dữ liệu được lưu trữ ở đâu và trách nhiệm thuộc về ai khi xảy ra sai sót.
Việc chia sẻ dữ liệu không thể dựa vào sự tự nguyện. Nếu không có quy định bắt buộc, không có cơ chế kiểm tra và không gắn với trách nhiệm cụ thể, thì dữ liệu sẽ tiếp tục bị giữ lại trong từng đơn vị. Trong bối cảnh bộ máy nhiều cấp, nhiều ngành cùng tham gia, nếu không có cơ chế điều phối đủ mạnh, thì dù có nền tảng kỹ thuật, hệ thống cũng khó vận hành hiệu quả.
Điểm nghẽn lớn nhất: dữ liệu bị chia cắt
Thực tế cho thấy vấn đề không nằm ở chỗ thiếu dữ liệu mà ở chỗ dữ liệu bị chia cắt. Mỗi đơn vị có một hệ thống riêng, một cách làm riêng, không có chuẩn chung và không có cơ chế chia sẻ. Khi cần kết nối thì không thể thực hiện.
Nhiều hệ thống đã được đầu tư nhưng không khai thác được hết giá trị vì dữ liệu không liên thông. Đây là nguyên nhân dẫn đến lãng phí trong chuyển đổi số, đặc biệt trong điều kiện nguồn lực còn hạn chế.
Dữ liệu dùng chung không phải là gom về một chỗ
Một cách hiểu sai khác là cho rằng dữ liệu dùng chung chỉ là tập trung tất cả dữ liệu về một nơi. Thực tế, dữ liệu dùng chung đòi hỏi phải được chuẩn hóa, có khả năng liên thông và có cùng cách hiểu. Nếu thiếu các yếu tố này, việc kết nối chỉ mang tính hình thức.
Nếu chưa có kiến trúc dữ liệu rõ ràng mà đã đầu tư phần mềm, mỗi hệ thống sẽ phát triển theo một hướng khác nhau, và khi cần kết nối sẽ phải điều chỉnh lại từ đầu, gây tốn kém cả về thời gian và nguồn lực.
Làm ở cấp tỉnh phải bắt đầu từ việc rất cụ thể
Để triển khai hiệu quả, việc đầu tiên không phải là đầu tư công nghệ mà là rà soát dữ liệu hiện có. Cần làm rõ mỗi đơn vị đang có dữ liệu gì, dữ liệu ở dạng nào, chất lượng ra sao và khả năng sử dụng chung đến đâu. Sau đó mới tiến hành chuẩn hóa, xây dựng lớp tích hợp dữ liệu và ban hành quy định về chia sẻ giữa các hệ thống.
Trong điều kiện nguồn lực còn hạn chế, không thể làm dàn trải. Cách làm phù hợp là bắt đầu từ một số bài toán cụ thể, nơi nhu cầu điều hành rõ ràng và dữ liệu có thể từng bước hoàn thiện, sau đó mở rộng dần. Cũng cần nhìn thẳng vào chi phí. Phần tốn kém nhất không nằm ở phần mềm, mà ở việc làm sạch dữ liệu, chuẩn hóa và duy trì vận hành. Nếu không tính đến phần này ngay từ đầu, hệ thống rất dễ bị dừng lại giữa chừng.
Quản trị dựa trên dữ liệu là thay đổi cách điều hành
Quản trị dựa trên dữ liệu không phải là có một hệ thống hiển thị, mà là thay đổi cách điều hành. Đó là việc giao nhiệm vụ dựa trên số liệu, theo dõi tiến độ bằng số liệu, đánh giá kết quả bằng số liệu và ra quyết định dựa trên số liệu.
Thay vì chờ báo cáo tổng hợp, người quản lý có thể trực tiếp nhìn vào hệ thống để nắm được tình hình thực tế, xác định điểm chậm và làm rõ trách nhiệm. Khi đó, dữ liệu không còn là thứ để lưu trữ mà trở thành công cụ điều hành.
Càng đầu tư mà không rõ dữ liệu, càng dễ đi sai
Toàn bộ câu chuyện cho thấy một điểm nhất quán: đô thị thông minh không bắt đầu từ công nghệ, mà bắt đầu từ dữ liệu, từ cách chuẩn hóa, tổ chức và quản trị dữ liệu. Nếu những yếu tố này không được xác định rõ, việc đầu tư dù lớn đến đâu cũng khó đạt hiệu quả. Hệ thống có thể hiện đại, nhưng chất lượng quyết định không được cải thiện.
Trong điều kiện cần sử dụng hiệu quả từng nguồn lực, tránh đầu tư dàn trải và tránh lặp lại những hạn chế đã thấy rõ, đây không chỉ là câu chuyện kỹ thuật, mà là một yêu cầu về cách làm. Và nếu không làm rõ ngay từ đầu, càng làm càng khó sửa về sau.
Lê Hải Hòa - Ủy viên dự khuyết Trung ương Đảng, Phó Bí thư Tỉnh ủy, Chủ tịch UBND tỉnh
Nguồn Cao Bằng : https://baocaobang.vn/do-thi-thong-minh-khong-phai-chuyen-cong-nghe-ma-la-chuyen-du-lieu-3187365.html