Các gã khổng lồ công nghệ bị kiện vì sử dụng sách có bản quyền huấn luyện AI

3 giờ trướcBài gốc

Apple bị cáo buộc dùng sách lậu huấn luyện mô hình OpenELM

Vào thứ Sáu, một vụ kiện tập thể đã được đệ trình lên tòa án liên bang ở Bắc California, cáo buộc Apple sao chép các tác phẩm được bảo vệ bản quyền mà không có sự đồng ý, không ghi công và không bồi thường cho các tác giả.

Apple bị cáo buộc dùng sách lậu huấn luyện mô hình ngôn ngữ lớn OpenELM.

"Apple không hề cố gắng trả tiền cho những tác giả vì sự đóng góp của họ vào dự án tiềm năng sinh lợi lớn này", theo đơn kiện do hai tác giả Grady Hendrix và Jennifer Roberson đứng tên.

Vụ kiện này là một phần trong làn sóng các vụ kiện gần đây từ các tác giả, cơ quan báo chí và nhiều bên khác, cáo buộc các công ty công nghệ lớn vi phạm các quy định bảo vệ tác phẩm của họ.

Cùng ngày, startup trí tuệ nhân tạo Anthropic đã tiết lộ trong một hồ sơ tòa án ở California rằng họ phải chi một khoản tiền lớn để dàn xếp một vụ kiện tập thể từ một nhóm tác giả. Nhóm này cáo buộc Anthropic sử dụng sách của họ để huấn luyện chatbot AI Claude mà không được phép. Anthropic không thừa nhận trách nhiệm pháp lý trong thỏa thuận, nhưng các luật sư của nguyên đơn gọi đây là khoản bồi thường bản quyền lớn nhất được công bố công khai trong lịch sử.

Trước đó, vào tháng 6, Microsoft cũng bị một nhóm tác giả kiện vì sử dụng sách của họ mà không xin phép để huấn luyện mô hình trí tuệ nhân tạo Megatron. Meta Platforms và OpenAI, được Microsoft hậu thuẫn, cũng đối mặt với các cáo buộc tương tự về việc lạm dụng tài liệu có bản quyền trong quá trình huấn luyện AI.

Vụ kiện chống lại Apple cáo buộc công ty này sử dụng một tập hợp sách lậu đã biết để huấn luyện các mô hình ngôn ngữ lớn "OpenELM". Theo đơn kiện, Hendrix, sống tại New York, và Roberson, ở Arizona, cho biết các tác phẩm của họ nằm trong tập dữ liệu lậu này.

Câu hỏi cốt lõi về quyền sử dụng hợp pháp vẫn đang được tranh luận trong các vụ kiện bản quyền AI khác. Một thẩm phán tại San Francisco, khi xem xét một vụ kiện tương tự chống lại Meta, đã phán quyết ngay sau quyết định của Alsup rằng việc sử dụng tác phẩm có bản quyền mà không được phép để huấn luyện AI sẽ là bất hợp pháp trong "nhiều trường hợp".

Anthropic đồng ý bồi thường 1,5 tỷ USD

Công ty trí tuệ nhân tạo Anthropic đã đồng ý chi 1,5 tỷ USD để dàn xếp một vụ kiện tập thể từ các tác giả, cáo buộc công ty sử dụng sách của họ để huấn luyện chatbot AI Claude mà không xin phép.

Anthropic đã đồng ý chi 1,5 tỷ USD để dàn xếp vụ kiện tập thể từ các tác giả cáo buộc công ty sử dụng sách của họ để huấn luyện chatbot AI Claude.

Hôm qua (5/9), Anthropic thông báo với thẩm phán liên bang tại San Francisco về việc họ đã đạt được thỏa thuận bồi thường 1,5 tỷ USD để giải quyết vụ kiện tập thể từ một nhóm tác giả. Các tác giả này cáo buộc Anthropic sử dụng trái phép sách của họ để huấn luyện chatbot AI Claude. Trong hồ sơ gửi tòa án, các nguyên đơn yêu cầu Thẩm phán Quận William Alsup phê chuẩn thỏa thuận này, sau khi công bố thỏa thuận vào tháng 8 mà không tiết lộ chi tiết hay số tiền cụ thể.

"Thỏa thuận này gửi đi một thông điệp mạnh mẽ tới các công ty AI và những người sáng tạo rằng việc lấy các tác phẩm có bản quyền từ những trang web lậu là sai trái", các luật sư của nguyên đơn tuyên bố. Họ gọi đây là khoản bồi thường bản quyền lớn nhất trong lịch sử và là trường hợp đầu tiên trong kỷ nguyên trí tuệ nhân tạo.

Thỏa thuận được đề xuất đánh dấu vụ dàn xếp đầu tiên trong hàng loạt vụ kiện chống lại các công ty công nghệ như OpenAI, Microsoft và Meta Platforms, liên quan đến việc sử dụng tài liệu có bản quyền để huấn luyện các hệ thống AI tạo sinh. Trong khuôn khổ thỏa thuận, Anthropic cam kết hủy bỏ các bản sao sách tải xuống mà các tác giả cáo buộc công ty đã sao chép lậu. Tuy nhiên, Anthropic vẫn có thể đối mặt với các khiếu nại vi phạm bản quyền liên quan đến nội dung do các mô hình AI của họ tạo ra.

Quỹ bồi thường 1,5 tỷ USD tương đương với 3.000 USD cho mỗi cuốn trong số 500.000 cuốn sách được tải xuống và con số này có thể tăng nếu phát hiện thêm các tác phẩm bị sử dụng. Trong một tuyên bố, Anthropic khẳng định công ty "cam kết phát triển các hệ thống AI an toàn, giúp con người và tổ chức mở rộng khả năng, thúc đẩy khám phá khoa học và giải quyết các vấn đề phức tạp". Thỏa thuận không bao gồm việc thừa nhận trách nhiệm pháp lý.

Vụ kiện tập thể được các tác giả Andrea Bartz, Charles Graeber và Kirk Wallace Johnson khởi xướng vào năm ngoái. Họ lập luận rằng Anthropic, được hậu thuẫn bởi Amazon và Alphabet, đã sử dụng trái phép hàng triệu cuốn sách lậu để huấn luyện trợ lý AI Claude trả lời các câu hỏi của con người. Những cáo buộc này tương tự như hàng loạt vụ kiện khác từ các tác giả, cơ quan báo chí, nghệ sĩ thị giác và những người cho rằng các công ty công nghệ đã đánh cắp tác phẩm của họ để sử dụng trong huấn luyện AI.

Các công ty công nghệ lập luận rằng hệ thống của họ sử dụng hợp pháp các tài liệu có bản quyền để tạo ra nội dung mới, mang tính chuyển đổi. Tuy nhiên, vào tháng Sáu, Thẩm phán Alsup phán quyết rằng Anthropic sử dụng hợp pháp các tác phẩm của tác giả để huấn luyện Claude, nhưng công ty đã vi phạm quyền của họ khi lưu trữ hơn 7 triệu cuốn sách lậu trong một "thư viện trung tâm" không nhất thiết được dùng cho mục đích huấn luyện.

Một phiên tòa dự kiến bắt đầu vào tháng 12 để xác định số tiền bồi thường mà Anthropic phải trả cho hành vi bị cáo buộc là vi phạm bản quyền, với thiệt hại tiềm tàng lên tới hàng trăm tỷ USD. Giám đốc điều hành của Authors Guild, Mary Rasenberger, trong một tuyên bố vào thứ Sáu, gọi thỏa thuận này là "một bước tiến quan trọng trong việc thừa nhận rằng các công ty AI không thể chỉ đơn giản lấy cắp tác phẩm sáng tạo của các tác giả để xây dựng AI của họ".

Đức Bình

Nguồn Xây Dựng : https://baoxaydung.vn/cac-ga-khong-lo-cong-nghe-bi-kien-vi-su-dung-sach-co-ban-quyen-huan-luyen-ai-192250906110728528.htm