Nghịch lý nằm ở chỗ Trung Quốc có đủ mô hình AI mạnh từ DeepSeek V4 đến Qwen 3.6 Max và GLM-5, nhưng các "chợ đen API Claude" vẫn không vơi khách.
Sự hình thành của thị trường xám cung cấp dịch vụ AI tại Trung Quốc
Theo ghi nhận từ tờ South China Morning Post (SCMP) trong bài đăng ngày 10/5, một thị trường xám bao gồm các nền tảng API trung chuyển đang phát triển mạnh mẽ tại Trung Quốc. Thị trường này cung cấp giải pháp giúp các lập trình viên nội địa tiếp cận những mô hình AI hàng đầu thế giới như Claude của Anthropic hay Gemini của Google vốn đang bị giới hạn truy cập. Cơ chế vận hành dựa trên các máy chủ trung gian đặt tại nước ngoài, đóng vai trò trạm chuyển tiếp yêu cầu và phản hồi, cho phép người dùng trong nước sử dụng dịch vụ mà không cần kết nối trực tiếp.
Anthropic đã mở rộng các biện pháp kiểm soát với Trung Quốc đại lục, Hồng Kông và Ma Cao trên cả truy cập web Claude, API và cả Claude Code. Ảnh: AFP
Các dịch vụ này hiện được rao bán công khai trên nhiều nền tảng thương mại điện tử. SCMP cho biết, các nhà cung cấp đang quảng cáo rầm rộ quyền truy cập vào các phiên bản nguyên bản như Claude Opus, gói Claude Code không giới hạn và các biến thể giữ nguyên năng lực xử lý. Điển hình trên sàn đồ cũ Xianyu của Alibaba, đã có những gian hàng hoàn thành hơn 2.200 đơn hàng với cam kết dịch vụ "độ trễ thấp, không cần VPN" dành cho toàn bộ dòng mô hình Claude 3.5.
Trước tình trạng này, Anthropic đã triển khai các biện pháp kỹ thuật để bảo vệ rào cản địa lý. Dữ liệu tổng hợp từ nền tảng VPN Lantern cho thấy hệ thống của Claude hiện thực hiện xác thực vị trí IP cho từng yêu cầu thay vì chỉ kiểm tra lúc đăng nhập. Hệ thống này có khả năng nhận diện các dải IP của trung tâm dữ liệu, IP VPN dùng chung và các lỗi rò rỉ dữ liệu như DNS/WebRTC. Mặc dù việc sử dụng VPN truyền thống thường xuyên dẫn đến tình trạng tài khoản bị khóa giữa phiên làm việc, nhưng thị trường ngầm vẫn duy trì được sức sống nhờ nhu cầu thực tế từ đội ngũ kỹ thuật. Sự sẵn sàng chi trả mức phí cao để tiếp cận năng lực của các mô hình Claude đã tạo nên một động lực kinh tế bền bỉ cho các dịch vụ trung gian này.
Claude Code - kẻ thay đổi luật chơi
Sức mạnh thực sự giúp Anthropic tạo nên sự khác biệt không nằm ở việc mô hình Claude "thông minh hơn" Qwen hay DeepSeek bao nhiêu phần trăm trên các bảng xếp hạng, mà nằm ở Claude Code. Đây là công cụ dòng lệnh (CLI) mang tính đột phá, cho phép AI tự thực hiện chu trình khép kín: từ đọc hiểu, chỉnh sửa, kiểm thử cho đến đệ trình mã nguồn xuyên suốt toàn bộ dự án. Thay vì phải can thiệp từng bước, lập trình viên giờ đây chỉ cần đưa ra mệnh đề đơn giản, "thêm chức năng đăng nhập vào dự án này", phần còn lại sẽ do Claude tự vận hành.
Vị thế của Claude Code lớn đến mức ngay cả những mô hình mã nguồn mở mạnh nhất Trung Quốc như DeepSeek V4 cũng phải tìm cách tối ưu hóa để tương thích với hệ khung tác tử (agent framework) của Anthropic. Ảnh: Anthropic
Hiệu quả thực tế của công cụ này đã được chứng minh qua những con số tài chính ấn tượng. Theo phân tích từ MorphLLM vào tháng 3, Claude Code đã mang về doanh thu định kỳ hàng năm (ARR) lên tới 2,5 tỉ USD, chiếm hơn một nửa tổng doanh thu mảng doanh nghiệp của Anthropic. Đây không còn là những lời quảng cáo hào nhoáng, mà là sự lựa chọn kinh tế của hàng nghìn đội ngũ kỹ thuật. Họ sẵn sàng chi trả 100 - 200 USD mỗi tháng cho mỗi nhân sự, bởi giá trị thời gian và năng suất mà công cụ này mang lại vượt xa chi phí đầu tư.
Sức mạnh của Claude Code còn được cộng hưởng từ chiến lược phân tầng sản phẩm và hệ sinh thái tính năng phụ trợ mà các đối thủ chưa thể theo kịp. Anthropic đã thiết lập ba phân khúc rõ rệt: Claude Haiku 4.5 tối ưu về tốc độ và chi phí, Sonnet 4.6 cân bằng giữa hiệu năng và giá cả, trong khi Opus 4.7 là "át chủ bài" cho các tác vụ phức tạp nhất. Đi kèm với đó là những đặc quyền kỹ thuật như khả năng ghi nhớ toàn bộ dự án trong cùng một cửa sổ ngữ cảnh, cơ chế tự nén thông tin để duy trì sự mạch lạc và khả năng điều phối nhiều "trợ lý" làm việc song song trên các mảng khác nhau của dự án.
Điểm khiến các đối thủ hụt hơi chính là những tính năng đặc quyền mà Anthropic tích hợp sâu vào hệ thống từ khả năng ghi nhớ toàn bộ dự án trong một cửa sổ ngữ cảnh, tự nén thông tin để duy trì sự mạch lạc trong các phiên làm việc dài, cho đến cơ chế bảo mật (xin phép trước khi xóa file) và khả năng điều phối nhiều "trợ lý ảo" làm việc song song trên các phân mảng khác nhau.
Vị thế thống trị của Claude Code lớn đến mức các đối thủ mã nguồn mở cũng phải tìm cách "thích nghi để tồn tại". Theo MIT Technology Review ngày 24/4, DeepSeek đã tối ưu hóa mô hình V4 của mình để tương thích hoàn toàn với các khung tác tử/tác nhân (agent framework) phổ biến như Claude Code, OpenClaw hay CodeBuddy. Mô hình mạnh nhất Trung Quốc này đang tự định vị mình là một "động cơ thay thế" lý tưởng bên trong "chiếc xe" do Anthropic thiết kế. Thậm chí, cộng đồng kỹ thuật quốc tế còn chia sẻ rộng rãi các hướng dẫn cách hoán đổi Qwen vào CLI của Claude Code. Điều này khẳng định một thực tế thú vị: Bộ não có thể là Qwen hay DeepSeek, nhưng "khung gầm" vận hành tiêu chuẩn của thế giới lập trình AI vẫn đang là sản phẩm của Anthropic.
Tác động của các quy định quản lý nội dung đối với mô hình AI nội địa
Bên cạnh các yếu tố kỹ thuật, quy trình kiểm soát nội dung được xem là một nhân tố ảnh hưởng đến hiệu năng của các mô hình AI. Theo báo cáo từ Financial Times, Cục Quản lý Không gian mạng Trung Quốc (CAC) đã thiết lập các tiêu chuẩn kiểm duyệt nghiêm ngặt đối với các mô hình ngôn ngữ lớn do các tập đoàn và startup công nghệ như ByteDance, Alibaba, Moonshot và 01.AI phát triển. Theo hướng dẫn vận hành công bố vào tháng 2/2024, các đơn vị này có trách nhiệm xây dựng bộ lọc gồm hàng nghìn từ khóa và câu hỏi liên quan đến các vấn đề nhạy cảm nhằm đảm bảo tuân thủ các giá trị cốt lõi theo quy định của cơ quan quản lý.
Quá trình tuân thủ này dẫn đến một số thay đổi trong quy trình vận hành và phân bổ nguồn lực. Cụ thể, thời gian huấn luyện mô hình có thể kéo dài hơn do yêu cầu rà soát và loại bỏ các dữ liệu chính trị không phù hợp. Đồng thời, một phần nguồn lực nghiên cứu của các doanh nghiệp phải chuyển dịch từ việc tối ưu hóa tính hữu dụng của mô hình sang việc xây dựng và duy trì các hệ thống rào cản kỹ thuật để kiểm soát đầu ra thông tin.
Các phân tích kỹ thuật đã chỉ ra những biểu hiện cụ thể của quy trình này trên các mô hình lập luận thực tế. Theo quan sát của ChinaFile vào tháng 3, mô hình DeepSeek-R1, vốn nổi bật với khả năng hiển thị chuỗi tư duy (Chain-of-Thought), thường có phản ứng đặc thù khi gặp các chủ đề giới hạn. Trong một số trường hợp, hệ thống sẽ phân tích dữ liệu trong thời gian ngắn, sau đó tự động ngắt quá trình suy luận, xóa thông tin hiển thị và phản hồi không thể trả lời. Hiện tượng này cũng được ghi nhận trong môi trường lập trình chuyên sâu, khi các thuật toán kiểm soát có thể nhận diện nhầm các yêu cầu về kỹ thuật mạng hoặc phân tích lỗ hổng bảo mật là nội dung nhạy cảm, từ đó làm gián đoạn công việc của người dùng.
Nghiên cứu so sánh giữa năm 2023 và 2025 của hai học giả Pan và Xu (được China Digital Times dẫn lại) cũng xác nhận xu hướng phản hồi của các AI này. Kết quả thực nghiệm cho thấy các mô hình được huấn luyện trên nguồn dữ liệu đã qua kiểm soát thường có xu hướng từ chối trả lời, cung cấp thông tin chọn lọc hoặc đưa ra các phản hồi ngắn gọn đối với các chủ đề mang tính tranh luận. Trong các tác vụ kỹ thuật, sự ưu tiên tính an toàn và tuân thủ đôi khi dẫn đến việc mô hình đưa ra câu trả lời không trực diện hoặc từ chối các yêu cầu chuyên môn hợp lệ.
Hoàng Vũ