
Новый коллективный иск был подан сегодня в федеральный суд Северной Калифорнии, обвиняющий Apple в незаконном использовании книг для обучения своих ИИ-моделей. Вот подробности.
Авторы основывают обвинения на собственных документах Apple
Как сообщает Reuters, авторы Грейди Хендрикс и Дженнифер Робертсон обвиняют Apple в использовании пиратского набора данных, включающего их произведения. Из искового заявления:
«Однако Apple создает часть этого нового предприятия, используя Books3, набор данных пиратских книг, защищенных авторским правом, который включает опубликованные работы истцов и класса. Apple использовала Books3 для обучения своих языковых моделей OpenELM. Apple, вероятно, также обучала свои фундаментальные языковые модели с использованием этого же пиратского набора данных».
Обвинение основано на деталях, предоставленных Apple в ее статье об OpenELM — модели с открытым исходным кодом, которую компания сделала доступной на Hugging Face в прошлом году.
В статье упоминается RedPajama как один из наборов данных, использованных в модели. RedPajama, в свою очередь, использует набор данных под названием Books3, который, как утверждается в иске, является «известным собранием пиратских книг».
Авторы просят суд разрешить рассмотрение иска в качестве коллективного против Apple и запрашивают следующие средства правовой защиты после судебного разбирательства присяжными:
- Разрешить рассмотрение этого дела как коллективного иска, где истцы выступают в качестве представителей класса, а адвокаты истцов — в качестве адвокатов класса;
- Взыскать с истцов и класса установленные законом убытки, компенсационные убытки, возмещение, прибыль и любую другую помощь, которая может быть разрешена по закону или справедливости;
- Навсегда запретить Ответчику незаконное, недобросовестное и нарушающее права поведение, изложенное в настоящем документе;
- Приказать уничтожить в соответствии со статьей 17 Свода законов США § 503(b) все модели Apple Intelligence или другие LLM-модели и обучающие наборы, которые включают работы истцов и членов класса;
- Взыскание судебных издержек, расходов и гонораров адвокатов, как предусмотрено законом; и
- Любую другую или дальнейшую помощь, которую Суд сочтет надлежащей, справедливой и равноправной.
Иск последовал за неоднозначными результатами в аналогичных делах
По совпадению (а может и нет), иск появился вскоре после рекордного $1,5-миллиардного урегулирования, достигнутого Anthropic в очень похожем деле.
Интересно, что Meta недавно столкнулась с аналогичным судебным процессом, но дело решилось в ее пользу, поскольку судья постановил, что использование ею книг, защищенных авторским правом, для обучения своих ИИ-моделей подпадает под добросовестное использование. Это мнение недавно поддержал президент Трамп:
«Нельзя ожидать, что у вас будет успешная программа ИИ, когда за каждую статью, книгу или что-либо еще, что вы прочитали или изучили, вы должны платить. (…) Вы просто не можете этого сделать, потому что это невозможно».
Как вы думаете, должны ли авторы получать компенсацию за использование их книг для обучения моделей ИИ? Дайте нам знать в комментариях.
Скидки на аксессуары на Amazon