Biểu tượng OpenAI và ChatGPT. Ảnh: AFP/TTXVN
Trang theconversation.com vừa có bài phân tích về vụ kiện của 5 hãng truyền thông lớn nhất Canada (Torstar, Postmedia, The Globe and Mail, The Canadian Press và CBC/Radio-Canada) đối với OpenAI, với cáo buộc vi phạm bản quyền và yêu cầu bồi thường thiệt hại lên tới hàng tỷ USD.
Vụ kiện này diễn ra sau các vụ kiện tương tự từ The New York Times và nhiều công ty truyền thông tại Mỹ vào đầu năm nay, liên quan đến việc OpenAI thu thập và sử dụng nội dung từ các trang web tin tức để đào tạo ChatGPT mà không được phép.
Trọng tâm của các vụ kiện là cáo buộc OpenAI đã "sao chép" một lượng lớn nội dung từ các trang tin tức để thu lợi nhuận mà không trả tiền cho các tác giả gốc. Theo đơn kiện, từ năm 2015, các trang web này đã quy định rõ ràng rằng nội dung của họ chỉ dành cho "mục đích sử dụng cá nhân, phi thương mại".
OpenAI chưa đưa ra phản hồi chính thức cho vụ kiện tại Canada, nhưng khẳng định rằng việc sử dụng tài liệu tin tức để đào tạo chatbot là hành vi hợp pháp theo nguyên tắc "sử dụng hợp lý" trong luật bản quyền.
Điểm mấu chốt của các khiếu nại trong vụ kiện ở Canada là việc OpenAI sao chép các công trình và sử dụng trái phép để kiếm lợi nhuận thông qua việc “thu thập dữ liệu”. Nhưng liệu thu thập dữ liệu có thực sự là sao chép hay không? Và nếu có, liệu nó có được coi là hành vi hợp pháp không?
Luật bản quyền ở Canada và Mỹ cho phép sao chép hoặc sử dụng trái phép một tác phẩm được bảo vệ trong một số trường hợp ngoại lệ. Tòa án xem xét một loạt các yếu tố, bao gồm mục đích của việc sao chép (thương mại hoặc giáo dục), mức độ sao chép và tác động đối với tác phẩm gốc.
Ngay sau khi tờ New York Times đệ đơn kiện, OpenAI đã lập luận rằng việc đào tạo chatbot trên các tài liệu tin tức thu thập từ web không vi phạm bản quyền. Công ty cho rằng hoạt động này nằm trong phạm vi sử dụng hợp lý và được nhiều chuyên gia pháp lý cũng như các tổ chức dân sự ủng hộ.
Theo các học giả, mô hình trí tuệ nhân tạo (AI) không được thiết kế để sao chép dữ liệu đào tạo mà học từ dữ liệu ở cấp độ trừu tượng, không có bản quyền. Nhóm phi lợi nhuận Creative Commons cũng đồng tình, so sánh việc OpenAI sử dụng tài liệu tin tức với việc Google số hóa hàng triệu cuốn sách để xây dựng cơ sở dữ liệu tìm kiếm. Cả hai hoạt động này đều mang tính "biến đổi" dữ liệu gốc, tạo ra sản phẩm phục vụ mục đích khác, không cạnh tranh trực tiếp hay gây tổn thất cho tác giả ban đầu.
Trước áp lực từ vụ kiện, OpenAI đã cam kết tôn trọng quyền từ chối của các cơ quan báo chí về việc sử dụng nội dung của họ làm dữ liệu đào tạo. Đồng thời, công ty bắt đầu ký kết thỏa thuận cấp phép nội dung với một số tổ chức tin tức.
Tuy nhiên, các vụ kiện vẫn tiếp tục và các thẩm phán tại Canada và Mỹ sẽ sớm đưa ra phán quyết về việc thu thập dữ liệu này có vi phạm bản quyền hay không, và liệu hành vi đó có được coi là sử dụng hợp lý hay không.
Hà Linh (P/v TTXVN tại Ottawa)