Apple фигурирует в иске об ИИ из-за набора данных, который, по заявлению компании, не используется для Apple Intelligence

Apple фигурирует в новом иске об ИИ от издательства Chicken Soup for the Soul, сообщает Reuters. Однако в иске упоминается набор данных, который, как уже заявила Apple, не используется для питания Apple Intelligence.

Согласно репортажу Reuters:

Издатель книг Chicken Soup for the Soul во вторник подал иск против нескольких крупных технологических компаний в федеральный суд Калифорнии, обвиняя их в неправомерном использовании своего контента для обучения систем искусственного интеллекта.

Издатель заявил, что Apple (AAPL.O), Google (GOOGL.O), Nvidia (NVDA.O), Meta Platforms (META.O), OpenAI, Anthropic, Perplexity ‌AI и xAI Илона Маска использовали пиратские копии его книг для обучения своих чат-ботов отвечать на запросы пользователей.

В иске, который можно прочитать полностью здесь, Apple обвиняется в использовании книг для обучения своих технологий ИИ:

Данное дело касается простого и умышленного акта кражи, представляющего собой нарушение авторских прав. Anthropic, Google, OpenAI, Meta, xAI, Apple, Perplexity и NVIDIA незаконно скопировали огромные объемы книг, защищенных авторским правом, без разрешения, а затем использовали эти украденные копии для создания и обучения своих коммерческих больших языковых моделей («LLM») и/или оптимизации своих продуктов. Ответчики присвоили себе работы тысяч авторов, включая писателей-бестселлеров, журналистов, удостоенных Пулитцеровской премии, и создателей широко известных научно-популярных и художественных произведений.

Далее в документах указывается, что The Pile использовался для обучения Apple Foundation Models.

Вместо получения лицензий или оплаты за использование этих произведений, каждый Ответчик
скачал пиратские копии книг истца с сайтов теневых библиотек, таких как The Pile, LibGen, Z-Library и Anna’s Archive, а затем воспроизвел, разобрал, проанализировал, перекопировал, использовал и встроил эти работы в свои LLM (и/или использовал эти работы для оптимизации своего продукта) для ускорения коммерческой разработки и победы в гонке генеративного ИИ. Закон об авторском праве запрещает именно такое поведение. […]

«Apple Foundation Models» опирались на The Pile и Books 3.

Если The Pile вам знаком, то, скорее всего, потому, что он всплыл в другом обвинении, связанном с обучением ИИ в 2024 году, с участием видео с YouTube.

Однако в то время Apple заявила, что данный набор данных использовался только в исследовательских целях и не применялся ни в каких моделях, лежащих в основе Apple Intelligence или функций машинного обучения.

Имеет ли это значение в данном судебном деле? Безусловно, это будет актуальным, но нам придется подождать решения суда, чтобы узнать, является ли это разницей без существенного отличия или нет.