Предъявлен коллективный иск: Apple обвиняют в скрейпинге миллионов видео с YouTube для обучения ИИ

В иске утверждается, что Apple использовала набор данных, состоящий из миллионов видео с YouTube, для обучения модели ИИ, как описано в исследовании, опубликованном в конце 2024 года. Вот подробности.

Amazon и OpenAI также обвиняются

Как заметил MacRumors, в предложенном коллективном иске, поданном компаниями Ted Entertainment, Matt Fisher и Golfholics, утверждается, что Apple обошла средства защиты YouTube от скрейпинга для загрузки миллионов видео.

Согласно документу, команда исследователей Apple опубликовала исследование под названием STIV: Scalable Text and Image Conditioned Video Generation, в котором они утверждают, что использовали набор данных под названием Panda-70M для обучения модели генерации видео, описанной в статье.

Из иска:

Набор данных Panda 70M функционирует как карта или индексный файл, идентифицирующий конкретные видео и клипы YouTube по URL, идентификатору видео и временной метке. Одно видео YouTube может быть разделено на множество клипов, каждый из которых рассматривается как отдельный обучающий образец. Извлечение любого клипа требует независимого доступа к исходному видео на YouTube и выделения обозначенного сегмента, что представляет собой отдельный акт обхода для каждого извлеченного клипа.

Истцы утверждают, что их контент появляется в наборе данных более 500 раз, и просят представить «всех других аналогично пострадавших» в рамках предложенного коллективного иска.

По сути, они утверждают, что, хотя набор данных предоставляет только ссылки на видео, Apple якобы обошла средства защиты YouTube от скрейпинга для загрузки и использования основного контента для обучения своих моделей ИИ.

По этой причине они требуют судебного разбирательства присяжными по всем пунктам обвинения и просят о следующем:

  1. Утверждение этого дела как коллективного иска и назначение истцов и адвокатов истцов для представления класса;
  2. Признать, что Ответчик умышленно обошел системы защиты авторских прав YouTube, предназначенные для защиты аудиовизуального контента истцов и членов класса.
  3. О возмещении установленных законом убытков (до максимально допустимого законом за каждое нарушение), судебных запретов, а также судебных издержек и гонораров адвокатов в соответствии со статьей 1203 Раздела 17 Свода законов США;
  4. О предоставлении такого справедливого возмещения в соответствии с Разделом 17, Разделом 28 и/или присущими суду полномочиями, которое необходимо для предотвращения или ограничения нарушения авторских прав истцов и членов класса, включая предварительный и постоянный судебный запрет, требующий, чтобы Ответчик и его должностные лица, агенты, служащие, сотрудники, адвокаты, директора, правопреемники, цессионарии, лицензиаты и все остальные, активно сотрудничающие или участвующие с любым из них, прекратили нарушение или способствование, помощь, разрешение, поощрение, продвижение, индуцирование или существенное содействие или участие в нарушении любых исключительных прав истцов или членов класса по федеральному закону, включая, помимо прочего, контент, указанный в Приложениях A, B и C;
  5. О присуждении предварительного и послесудебного процента, в максимально доступной степени, по любой денежной сумме, включенной в решение против Ответчика; и
  6. О таком другом и дальнейшем возмещении, которое Суд сочтет справедливым и надлежащим.

Помимо Apple, истцы подали предлагаемые коллективные иски против Amazon и OpenAI, утверждая, что обе компании также использовали набор данных Panda-70M в своих процессах обучения моделей ИИ.

Стоит проверить на Amazon