Huawei phản bác cáo buộc sao chép mô hình Qwen của Alibaba

6 giờ trướcBài gốc

Phòng thí nghiệm Noah Ark Lab của Huawei đưa ra tuyên bố giải thích vào thứ Bảy tuần qua, một ngày sau khi tổ chức có tên HonestAGI đăng tải bài báo bằng tiếng Anh trên nền tảng chia sẻ mã nguồn GitHub.

Huawei phủ nhận sao chép mô hình Qwen của Alibaba.

Bài báo cho rằng mô hình Pangu Pro Moe (Mixture of Experts) của Huawei có “mối tương quan bất thường” với mô hình Qwen 2.5 14B của Alibaba. Theo bài báo, điều này cho thấy mô hình của Huawei có thể được tạo ra thông qua việc “tái sử dụng” và không được huấn luyện từ đầu. Thông tin trên đã gây ra nhiều tranh luận sôi nổi trong giới AI trực tuyến và trên các phương tiện truyền thông công nghệ Trung Quốc.

Bài báo còn cho rằng các phát hiện của họ chỉ ra khả năng vi phạm bản quyền, việc giả mạo thông tin trong các báo cáo kỹ thuật và những tuyên bố sai lệch về khoản đầu tư của Huawei vào việc huấn luyện mô hình.

Trong tuyên bố vừa phát đi, phòng thí nghiệm Noah Ark Lab khẳng định mô hình Pangu Pro Moe “không dựa trên việc huấn luyện tăng dần từ các mô hình của nhà sản xuất khác” và đã “đạt được những đổi mới quan trọng trong thiết kế kiến trúc và các tính năng kỹ thuật”. Họ cũng cho biết đây là mô hình quy mô lớn đầu tiên được xây dựng hoàn toàn trên chip Ascend của Huawei.

Huawei cũng nhấn mạnh đội ngũ phát triển của họ đã tuân thủ nghiêm ngặt các yêu cầu về giấy phép mã nguồn mở cho bất kỳ mã của bên thứ ba nào được sử dụng, nhưng không nêu rõ từng tham khảo những mô hình mã nguồn mở nào.

Chiến lược mã nguồn mở của Huawei sẽ được đón nhận ở các nước đang phát triển, nơi doanh nghiệp nhạy cảm hơn với giá cả, tương tự như các sản phẩm khác của Huawei.

Vào tháng 1 năm nay, startup DeepSeek của Trung Quốc đã gây sốc cho Thung lũng Silicon khi ra mắt mô hình mã nguồn mở R1 với chi phí thấp, làm dấy lên cuộc cạnh tranh gay gắt giữa các gã khổng lồ công nghệ Trung Quốc để tung ra các sản phẩm cạnh tranh.

Qwen 2.5-14B được Alibaba phát hành vào tháng 5/2024, thuộc dòng mô hình Qwen 2.5 kích thước nhỏ, có thể triển khai trên máy tính cá nhân và điện thoại thông minh.

Dù Huawei đã sớm tham gia lĩnh vực mô hình ngôn ngữ lớn với phiên bản Pangu đầu tiên vào năm 2021, nhưng họ được cho là đang tụt hậu so với các đối thủ. Cuối tháng 6 vừa qua, Huawei đã mở mã nguồn các mô hình Pangu Pro Moe trên nền tảng GitCode của Trung Quốc, nhằm thúc đẩy việc ứng dụng công nghệ AI của mình bằng cách cung cấp quyền truy cập miễn phí cho các nhà phát triển.

Trong khi Qwen hướng đến người dùng phổ thông và có các dịch vụ chatbot tương tự ChatGPT, các mô hình Pangu của Huawei chủ yếu được sử dụng trong các lĩnh vực như chính phủ, tài chính và sản xuất.

Huawei đã công bố mở mã nguồn hai mô hình trí tuệ nhân tạo thuộc dòng Pangu, cùng với một số công nghệ suy luận mô hình, vào ngày 30/6. Bản phát hành này đi kèm với công nghệ suy luận mô hình được tối ưu hóa cho chip Ascend của Huawei. Các chuyên gia công nghệ nhận định động thái này sẽ giúp công ty bị Mỹ liệt vào danh sách đen tiếp tục phát triển hệ sinh thái AI và mở rộng ra thị trường quốc tế.

Chip Ascend của Huawei được thiết kế dành riêng cho các tác vụ AI, cung cấp sức mạnh tính toán cần thiết để huấn luyện và triển khai các mô hình quy mô lớn. Tuy nhiên, hiệu quả thực tế của các mô hình này trong các ứng dụng vẫn còn là một dấu hỏi. Điều này đặc biệt đáng chú ý khi các đối thủ như Tencent, Alibaba và Baidu tiếp tục đầu tư mạnh mẽ vào phát triển AI.

Huawei gọi việc mở mã nguồn là một bước quan trọng trong “chiến lược hệ sinh thái Ascend”, giúp thúc đẩy ứng dụng AI trong “hàng nghìn ngành công nghiệp”. Hệ sinh thái Ascend bao gồm các sản phẩm AI được xây dựng quanh dòng chip AI Ascend, được xem là đối thủ hàng đầu của Trung Quốc so với sản phẩm của gã khổng lồ chip Mỹ Nvidia, vốn bị hạn chế bán các sản phẩm tiên tiến cho Trung Quốc.

Đức Bình

Nguồn Xây Dựng : https://baoxaydung.vn/huawei-phan-bac-cao-buoc-sao-chep-mo-hinh-qwen-cua-alibaba-192250707161028474.htm