
В иске утверждается, что Apple использовала набор данных, состоящий из миллионов видео с YouTube, для обучения модели ИИ, как описано в исследовании, опубликованном в конце 2024 года. Вот подробности.
Amazon и OpenAI также обвиняются
Как заметил MacRumors, в предложенном коллективном иске, поданном компаниями Ted Entertainment, Matt Fisher и Golfholics, утверждается, что Apple обошла средства защиты YouTube от скрейпинга для загрузки миллионов видео.
Согласно документу, команда исследователей Apple опубликовала исследование под названием STIV: Scalable Text and Image Conditioned Video Generation, в котором они утверждают, что использовали набор данных под названием Panda-70M для обучения модели генерации видео, описанной в статье.
Из иска:
Набор данных Panda 70M функционирует как карта или индексный файл, идентифицирующий конкретные видео и клипы YouTube по URL, идентификатору видео и временной метке. Одно видео YouTube может быть разделено на множество клипов, каждый из которых рассматривается как отдельный обучающий образец. Извлечение любого клипа требует независимого доступа к исходному видео на YouTube и выделения обозначенного сегмента, что представляет собой отдельный акт обхода для каждого извлеченного клипа.
Истцы утверждают, что их контент появляется в наборе данных более 500 раз, и просят представить «всех других аналогично пострадавших» в рамках предложенного коллективного иска.
По сути, они утверждают, что, хотя набор данных предоставляет только ссылки на видео, Apple якобы обошла средства защиты YouTube от скрейпинга для загрузки и использования основного контента для обучения своих моделей ИИ.
По этой причине они требуют судебного разбирательства присяжными по всем пунктам обвинения и просят о следующем:
- Утверждение этого дела как коллективного иска и назначение истцов и адвокатов истцов для представления класса;
- Признать, что Ответчик умышленно обошел системы защиты авторских прав YouTube, предназначенные для защиты аудиовизуального контента истцов и членов класса.
- О возмещении установленных законом убытков (до максимально допустимого законом за каждое нарушение), судебных запретов, а также судебных издержек и гонораров адвокатов в соответствии со статьей 1203 Раздела 17 Свода законов США;
- О предоставлении такого справедливого возмещения в соответствии с Разделом 17, Разделом 28 и/или присущими суду полномочиями, которое необходимо для предотвращения или ограничения нарушения авторских прав истцов и членов класса, включая предварительный и постоянный судебный запрет, требующий, чтобы Ответчик и его должностные лица, агенты, служащие, сотрудники, адвокаты, директора, правопреемники, цессионарии, лицензиаты и все остальные, активно сотрудничающие или участвующие с любым из них, прекратили нарушение или способствование, помощь, разрешение, поощрение, продвижение, индуцирование или существенное содействие или участие в нарушении любых исключительных прав истцов или членов класса по федеральному закону, включая, помимо прочего, контент, указанный в Приложениях A, B и C;
- О присуждении предварительного и послесудебного процента, в максимально доступной степени, по любой денежной сумме, включенной в решение против Ответчика; и
- О таком другом и дальнейшем возмещении, которое Суд сочтет справедливым и надлежащим.
Помимо Apple, истцы подали предлагаемые коллективные иски против Amazon и OpenAI, утверждая, что обе компании также использовали набор данных Panda-70M в своих процессах обучения моделей ИИ.
Стоит проверить на Amazon