Ngành công nghiệp "huấn luyện AI" phát triển tại vùng nông thôn Trung Quốc. Ảnh minh họa: The New York Times.
Khi công chúng nói về trí tuệ nhân tạo (AI), câu chuyện thường mang tính vĩ mô và trừu tượng. Khi nghĩ đến nhân sự làm việc trong lĩnh vực này, nhiều người hình dung về một tầng lớp tinh hoa. Đó được cho là những cá nhân xuất sắc, được săn đón bởi dòng vốn toàn cầu, có thể thay đổi tiến trình văn minh. Tuy nhiên, thực tế lại khác.
Khoảng 9h sáng, một nhóm bà mẹ trẻ vừa đưa con đến trường mầm non hoặc tiểu học, rồi vội vã tới nơi làm việc. Bước vào phòng máy tính, họ gần như không kịp nghỉ, lập tức đăng nhập để giành các tác vụ mới nhất. Công việc của họ là gán nhãn dữ liệu một cách thủ công để “nuôi dạy” AI, theo Sixth Tone.
'Giáo viên đào tại AI'
Đây là thế giới mà các nhà nghiên cứu như Xia Bingqing tại Đại học Sư phạm Hoa Đông đã dành 5 năm để tìm hiểu.
AI cần được “nuôi dưỡng”. Trí tuệ nhân tạo cần luyện tập, phải được dạy từng chút một về tri thức, giá trị và chuẩn mực xã hội của con người. Theo nghĩa đó, AI không hề có tính chất “tương lai” hay “tinh hoa” như cách người ta tưởng tượng.
AI không lơ lửng trên mây, mà tồn tại nơi mặt đất, ở những thung lũng Trung Quốc, bên trong các “trung tâm gán nhãn dữ liệu” thường được xây dựng tại các khu tái định cư từ chương trình xóa đói giảm nghèo.
Công việc gán nhãn dữ liệu trở thành một phần của ngành công nghiệp trí tuệ nhân tạo (AI). Đồ họa: Sixth Tones.
AI hiện diện qua những dãy máy tính, chuột, tai nghe, đồng hồ bấm giờ, phiếu sửa lỗi và các yêu cầu làm lại. Những người lao động này đôi khi được truyền thông gọi là “giáo viên đào tạo AI”.
Tuy nhiên, cách gọi đó mang tính lãng mạn hóa. Thực chất, họ làm công việc chuyển đổi thế giới thành một loại ngôn ngữ mà máy móc có thể hiểu được. Họ xử lý dữ liệu thô, bao gồm hình ảnh, âm thanh, văn bản, rồi phân loại, gán nhãn để tạo thành dữ liệu huấn luyện.
Họ vẽ khung quanh người, xe hay ổ gà trong ảnh. Họ cắt nhỏ bản ghi âm thành các đơn vị từ ngữ. Họ chấm điểm hội thoại, giúp máy học cách phân biệt giữa phản hồi phù hợp và không phù hợp với chuẩn mực xã hội.
Cơ hội cho các vùng quê
Trên bình diện quốc tế, loại lao động này thường được nhìn nhận qua lăng kính phân công toàn cầu. Trong khi kỹ sư và mô hình tập trung ở các nước phát triển, việc gán nhãn được “thuê ngoài” ở các quốc gia đang phát triển với mức thù lao thấp.
Tuy nhiên, các “ông lớn” Internet Trung Quốc không muốn chuyển việc ra nước ngoài. Ngoài yếu tố chi phí, họ còn lo ngại rò rỉ dữ liệu, bao gồm lộ trình nghiên cứu và phát triển. Vì vậy, họ chọn mô hình “nội địa hóa”, chuyển công việc từ Bắc Kinh, Hàng Châu, Thâm Quyến về các tỉnh nội địa như Sơn Tây, Thiểm Tây, Tân Cương, Quý Châu hay Hà Nam.
Những khu vực này đón nhận cơ hội với sự kỳ vọng lớn. Với nhiều thành phố nhỏ, việc tham gia vào nền kinh tế AI dường như là điều không tưởng do thiếu năng lực tính toán, nhân lực kỹ thuật và vốn đầu tư. Song, “ngành dữ liệu” lại khả thi hơn khi có các tính chất như rào cản thấp và sử dụng nhiều lao động.
Trên thực tế, công việc này giống dây chuyền sản xuất, bao gồm mật độ lao động lớn, giá trị đơn vị thấp, tỷ lệ nghỉ việc cao, gây mỏi mắt và áp lực thần kinh. Nó không đòi hỏi bằng cấp cao, mà cần sự chăm chỉ, bền bỉ và kiên nhẫn.
Với chính quyền địa phương, đây là cơ hội để ghi nhận các thành tích như việc làm trong nền kinh tế số, tăng trưởng công nghiệp và ổn định cộng đồng. Điều này đặc biệt quan trọng khi nhiều khu vực đang mất dân số.
Tại các khu tái định cư, nhiều làng được di dời từ vùng núi xuống. Một cán bộ cộng đồng nhấn mạnh: “Chúng tôi phải giữ người ở lại”. Người dân mất đất, kỹ năng cũ không còn giá trị, người trẻ rời đi, chỉ còn lại người già và trẻ em. Để thực sự ở lại, họ cần có việc làm ổn định và gần nhà.
Công việc mang tính chất dây chuyền diễn ra ở các vùng nông thôn Trung Quốc, phục vụ cho các "ông lớn" Internet. Ảnh minh họa: Sixth Tone.
Năm 2018, cơ hội xuất hiện khi cộng đồng này hợp tác với một công ty công nghệ (được gọi là B-Tech). Sau nhiều vòng đàm phán, trung tâm gán nhãn dữ liệu đầu tiên được xây dựng. Địa phương cung cấp mặt bằng miễn phí 3 năm, hỗ trợ chi phí, đổi lại công ty tạo việc làm và ưu tiên tuyển phụ nữ có hoàn cảnh khó khăn.
Nhìn từ xa, đây là mô hình “đôi bên cùng có lợi”. Tuy nhiên, thực tế phức tạp hơn nhiều. Đơn hàng từ các công ty công nghệ đến theo từng đợt. Khi công việc giảm, thu nhập bấp bênh, người lao động rời đi. Khi nhu cầu tăng, doanh nghiệp lại phải tuyển mới, đào tạo lại, dẫn đến chất lượng giảm và khối lượng sửa lỗi tăng.
Chính quyền địa phương can thiệp bằng các chương trình đào tạo và trợ cấp để giữ lao động “trong trạng thái sẵn sàng”. Khi ít việc, người lao động tham gia các khóa huấn luyện cơ bản và nhận trợ cấp 50 NDT mỗi ngày. Khi đơn hàng giảm mạnh, họ có thể nhận hỗ trợ tới 500 NDT.
Trên giấy tờ, đây là công tác hỗ trợ việc làm. Nhưng thực chất, phương án này giúp duy trì lực lượng lao động ổn định, hạn chế tình trạng nghỉ việc.
Công tác quản lý trong trung tâm dựa nhiều vào hiểu biết địa phương như ai phải đón con lúc nào, ai có vấn đề sức khỏe hay ai có thể làm thêm giờ. Trong giai đoạn cao điểm, người lao động được chia nhóm. Người trẻ, ít ràng buộc gia đình được giao việc năng suất cao, trong khi các bà mẹ đảm nhận nhiệm vụ đơn giản hơn.
Một quản lý dự án dữ liệu AI cho biết công ty từng kỳ vọng thuật toán có thể tối ưu hóa khâu quản lý lao động. Tuy nhiên, điều này đòi hỏi chi phí rất lớn. Cuối cùng, họ nhận ra cách phân công dựa trên kinh nghiệm của quản lý địa phương hiệu quả và rẻ hơn. Tỷ lệ chính xác tại các trung tâm nội bộ có thể đạt 97-98%, vượt nhiều nền tảng ngoài.
Nhiều người hình dung AI vận hành trên “đám mây”. Song, tại các vùng quê Trung Quốc, trí tuệ nhân tạo giống một dây chuyền sản xuất trên mặt đất. Mỗi cú click chuột, mỗi lần sửa lỗi, mỗi lần người lao động vội vã rời phòng máy lúc 16h30 để đón con đều góp phần vận hành hệ thống.
Khi nhìn kỹ hơn, có thể thấy trí tuệ không chỉ thuộc về máy móc, mà còn được xây dựng từ công sức của những con người ít được biết tên.
Linh Vũ