Trang chủKhoa học - Công nghệCông nghệ sốMeta bị cáo buộc dùng nội dung sách vi phạm bản quyền...

Meta bị cáo buộc dùng nội dung sách vi phạm bản quyền để huấn luyện AI


Theo TechSpot, một nhóm tác giả tại Mỹ đã đệ đơn kiện Meta với cáo buộc công ty này sử dụng trái phép các cuốn sách để huấn luyện mô hình AI tạo sinh (generative AI). Trong khi Meta phủ nhận hành vi vi phạm bản quyền, các email nội bộ vừa được công khai cho thấy một số nhân sự cấp cao và kỹ sư của công ty đã thảo luận về việc tải xuống kho sách lậu để phục vụ quá trình huấn luyện AI.

Meta bị cáo buộc dùng nội dung sách vi phạm bản quyền để huấn luyện AI- Ảnh 1.

Meta AI đang vướng vào tranh cãi pháp lý khi bằng chứng nội bộ về việc đã tải xuống và lan truyền kho sách lậu để huấn luyện AI

Hồ sơ vụ kiện cho thấy Meta đã sử dụng các tập dữ liệu gây tranh cãi, bao gồm “LibGen” – kho lưu trữ hàng triệu cuốn sách bị vi phạm bản quyền. Trước đây, Meta từng lập luận rằng việc sử dụng những dữ liệu này thuộc phạm vi “sử dụng hợp lý”. Tuy nhiên, các email mới tiết lộ Meta không chỉ tải về mà còn phân phối các tệp dữ liệu này thông qua mạng BitTorrent, đặt ra những vấn đề pháp lý nghiêm trọng.

Theo nội dung email, Meta đã tải xuống và chia sẻ ít nhất 81,7 terabyte dữ liệu từ nhiều kho sách vi phạm bản quyền, trong đó có 35,7 terabyte từ Z-Library và LibGen. Các nguyên đơn gọi đây là một “chiến dịch torrent đáng kinh ngạc” khi Meta không chỉ tải về mà còn chủ động lan truyền các tệp dữ liệu này ở quy mô lớn.

Một email nội bộ từ tháng 4.2023 của nhà nghiên cứu Nikolay Bashlykov thuộc Meta ghi nhận: “Torrent trên máy tính công ty có vẻ không ổn.” Dù câu nói này kết thúc bằng một biểu tượng cảm xúc cười, nhưng chỉ vài tháng sau, giọng điệu của ông đã thay đổi rõ rệt. Vào tháng 9.2023, Bashlykov cho biết ông đã liên hệ với bộ phận pháp lý của Meta vì hành vi sử dụng torrent – đồng nghĩa với việc “gieo mầm” dữ liệu vi phạm bản quyền rõ ràng là vi phạm luật.

Các tài liệu cũng chỉ ra rằng Mark Zuckerberg, CEO của Meta, đã nhận thức được việc công ty sử dụng LibGen. Để tránh bị phát hiện, Meta được cho là đã triển khai các máy chủ bên ngoài hệ thống chính của Facebook nhằm che giấu hoạt động torrent và phân phối dữ liệu. Một email nội bộ khác của nhân viên Frank Zhang đề cập đến chiến thuật này với thuật ngữ “chế độ tàng hình” (stealth mode).

Hiện tại, Meta đang đầu tư mạnh vào phát triển AI và các dịch vụ liên quan đến AI tạo sinh. Công ty cũng đang tìm cách tích hợp các chatbot và nhân vật AI vào hệ sinh thái mạng xã hội của mình. Tuy nhiên, trước những bằng chứng mới được tiết lộ, Meta có thể gặp nhiều khó khăn trong việc bảo vệ lập luận “sử dụng hợp lý” của mình khi đối mặt với vụ kiện từ các tác giả.




Nguồn: https://thanhnien.vn/meta-bi-cao-buoc-dung-noi-dung-sach-vi-pham-ban-quyen-de-huan-luyen-ai-185250209012630928.htm

Cùng chủ đề

Nổi bật

Mới nhất

Cùng tác giả

Phát hiện điều tuyệt vời của 1 viên dầu cá omega-3 mỗi ngày

Một gram omega-3 mỗi ngày có thể làm chậm tốc độ lão hóa sinh học. ...

Ông Trump bị kiện vì đình chỉ chương trình định cư Mỹ

Những người tị nạn cùng gia đình và các tổ chức ủng hộ người tị nạn nộp đơn kiện Tổng thống Mỹ Donald Trump vì đã dừng chương trình định cư dành cho nhóm người này. ...

Bài đọc nhiều

Apple phát hành iOS 18.3 mới cho iPhone 11

Apple lần đầu tiên phát hành iOS 18l.3 vào thứ hai tuần trước và nhiều khả năng phiên bản mới này sẽ khắc phục lỗi ảnh hưởng đến các mẫu iPhone 11 nên người dùng cần cập nhật bàng cách: Truy cập Cài đặt- Cài đặt chung- Cập nhật phần mềm Được biết, các tính năng chính trong iOS 18.3 liên quan đến Apple Intelligence và bao gồm Visual Intelligence và các thay đổi đối với tóm tắt "thông...

Liên hợp quốc coi Việt Nam là đối tác quan trọng về chuyển đổi số và AI

Ngày 5/2, tại Trụ sở Liên hợp quốc (LHQ) ở New York (Mỹ), Đại sứ Đặng Hoàng Giang, Trưởng Phái đoàn Thường trực Việt Nam tại LHQ, đã có cuộc làm việc ông Amandeep Singh Gill, Phó Tổng Thư ký, Đặc phái viên của Tổng Thư ký LHQ về Công nghệ. ...

Cùng chuyên mục

Tình báo Hàn Quốc cáo buộc DeepSeek thu thập dữ liệu cá nhân “quá mức”

Cơ quan tình báo Hàn Quốc cáo buộc ứng dụng AI DeepSeek của Trung Quốc thu thập dữ liệu cá nhân "quá mức" và sử dụng dữ liệu đầu vào để đào tạo, đồng thời đặt câu hỏi về phản ứng của ứng dụng đối với các câu hỏi liên quan đến vấn đề dân tộc. ...

Mới nhất

Cần thiết bổ sung vốn điều lệ để VEC phát triển bền vững

Chính phủ kiến nghị Quốc hội chấp thuận chủ trương đầu tư bổ sung vốn điều lệ cho Công ty mẹ - VEC giai đoạn 2024-2026 là 38.251 tỷ đồng. Chính phủ kiến nghị Quốc hội chấp thuận chủ trương đầu tư bổ sung vốn điều lệ cho Công ty mẹ - VEC giai đoạn 2024-2026 là 38.251 tỷ đồng. ...

Học sinh mầm non, tiểu học được nghỉ học khi nhiệt độ ngoài trời dưới 10°C

Theo quy định của Sở GD&ĐT Hà Nội, học sinh mầm non, tiểu học được nghỉ học nếu nhiệt độ xuống dưới 10 độ C, học sinh trung học được nghỉ học nếu nhiệt độ xuống dưới 7 độ C.

Ngành công thương tạo cơ hội thúc đẩy khoa học công nghệ phát triển

Thực hiện chủ trương, đường lối của Đảng, chính sách của Nhà nước, chỉ đạo của Chính phủ, Thủ tướng Chính phủ về KH&CN, ngành công thương đã cụ thể hóa và đồng bộ...

Một thung lũng ở Đắk Lắk có làng triệu phú người Nùng Cao Bằng, cả làng giàu có nhờ trồng cây gì?

Nằm giữa thung sâu, bao quanh đồi núi bạt ngàn, những ngôi nhà sàn truyền thống khang trang đỏ tươi màu ngói của người Nùng An (dân tộc Nùng) ở làng...

Giá vàng lần đầu vượt 2.900 USD, lập loạt kỷ lục mới: Sắp lên 95 triệu đồng

Giá vàng trên thị trường quốc tế tăng không ngừng nghỉ, liên tiếp lập kỷ lục mới trong bối cảnh căng thẳng thương mại leo thang và lạm phát có tín hiệu tăng trở lại. Vàng nhẫn lên đỉnh mới, còn miếng SJC có thể sớm đạt 95 triệu đồng. Rạng sáng 11/2 (giờ Việt Nam), giá vàng giao ngay...

Mới nhất