Những bước tiến mới
Vào ngày 26.12, phòng thí nghiệm AI của Trung Quốc DeepSeek đã công bố mô hình v3 của họ. Bằng cách triển khai các chip có công suất nhỏ được thiết kế để đáp ứng các hạn chế do Hoa Kỳ áp đặt và chỉ tốn 5,6 triệu USD chi phí phát triển, DeepSeek đã đạt được hiệu suất tương đương với GPT-4 của OpenAI, một mô hình được cho là có chi phí phát triển lên tới hơn 100 triệu USD.
Mỹ và Trung Quốc bước vào cuộc đua AI với những biên giới mới. Ảnh: X Screengrab
Giống như hầu hết các phòng thí nghiệm của Trung Quốc, DeepSeek đã mở mã nguồn mô hình mới của họ, cho phép bất kỳ ai cũng có thể chạy phiên bản riêng của hệ thống hiện đại này.
Thông báo tin trên được đưa ra trong bối cảnh Thung lũng Silicon ngày càng lo ngại rằng kỷ nguyên của những tiến bộ đột phá về khả năng AI đã kết thúc. Nếu DeepSeek công bố mô hình của họ sớm hơn bốn ngày, có vẻ như tương lai của AI nằm ở việc tối ưu hóa và giảm chi phí thay vì đột phá về khả năng.
Thế nhưng thông tin này được đưa ra trong vòng một tuần sau khi OpenAI trình làng o3, phiên bản nâng cấp của mô hình suy luận o1, lần đầu được giới thiệu vào tháng 9, quảng bá khả năng "lý luận nâng cao" của phiên bản này. Phiên bản mới được xếp hạng trong nhóm 99,9% các lập trình viên cạnh tranh nhất và có thể giải đúng các bài toán khó nhất thế giới với tốc độ nhanh gấp 10 lần so với thế hệ trước.
Biên giới mới của cuộc đua
Hai sự kiện đã báo hiệu một kỷ nguyên mới cho sự phát triển AI và một biên giới mới của cuộc đua ngày càng khốc liệt giữa Hoa Kỳ và Trung Quốc để giành quyền thống trị trong không gian này. Các hạn chế xuất khẩu chip không những không thể kìm hãm khiến Trung Quốc tụt hậu đáng kể so với Hoa Kỳ mà còn không giải quyết được ranh giới tiếp theo cho sự phát triển AI.
Biên giới đó là lý luận – dạy AI suy nghĩ từng bước như con người. Trong khi các mô hình trước đó xuất sắc trong việc trò chuyện, o3 thể hiện khả năng giải quyết vấn đề thực sự, không chỉ xuất sắc trong các nhiệm vụ trước kia thường làm AI bối rối, mà còn trong các bài kiểm tra nhiều chuyên gia hàng đầu về AI tin rằng phải mất nhiều năm nữa mới có thể giải quyết được.
Tổng giám đốc điều hành Microsoft Satya Nadella đã mô tả phương pháp lý luận này là "một quy luật mở rộng khác", nghĩa là phương pháp này có thể mang lại những cải tiến như đã thấy trong vài năm qua nhờ dữ liệu và sức mạnh tính toán tăng lên.
Những cải tiến theo hướng này ít có khả năng gây căng thẳng cho giới hạn về năng lực chip. Thay vào đó, tài năng, hiệu quả năng lượng và nguồn điện giá rẻ sẽ là chìa khóa.
Trong khi đó, tại Virginia, một trung tâm dữ liệu lớn của Hoa Kỳ, các cơ sở mới có thể phải chờ nhiều năm chỉ để đảm bảo được kết nối nguồn điện. Sau hai thập kỷ nhu cầu không đổi, các công ty tiện ích và cơ quan quản lý của Hoa Kỳ đang phải vật lộn để thích ứng với nhu cầu điện năng khổng lồ của các AI tiên tiến.
Trong khi đó, Trung Quốc đang nhanh chóng mở rộng cơ sở hạ tầng về điện của mình, với các mạng lưới máy tính tích hợp mới đang được xây dựng trên khắp các khu vực như Bắc Kinh - Thiên Tân - Hà Bắc. Sản lượng điện của Trung Quốc đã tăng 64% trong thập kỷ qua, trong khi Hoa Kỳ vẫn trì trệ.
Bên cạnh đó, nếu chỉ xem xét cuộc đua ở cấp độ quốc gia có thể hiểu lầm về khả năng của Trung Quốc. Bởi ở quốc gia này, thay vì một gã khổng lồ công nghệ có uy tín như Tencent hay Alibaba hay ByteDance phát triển mô hình tốt nhất, thì nơi vừa cho ra đời mô hình V3 chỉ là phòng thí nghiệm nhỏ DeepSeek với khoảng 200 người.
Hoa Kỳ vẫn là trung tâm thu hút nhân tài toàn cầu, nhưng theo ấn phẩm gần đây của PNAS, các nhà nghiên cứu Trung Quốc đang rời bỏ nước Mỹ để trở về nước với số lượng lớn hơn bao giờ hết. Bộ trưởng Thương mại Hoa Kỳ sắp mãn nhiệm Gina Raimondo đã gọi những nỗ lực kìm hãm Trung Quốc là một "việc ngu ngốc" trong một cuộc phỏng vấn với tờ Wall Street Journal vào cuối tháng trước.
Quỳnh Vũ