
Новое поколение Siri будет работать на генеративном ИИ-чат-боте, и аналитики ожидают, что оно будет выпущено с iOS 18 и анонсировано на WWDC в этом году.
Хотя Apple критиковали за отставание Siri, новый отчет гласит, что это потому, что компания стремится быть гораздо более амбициозной, чем существующие системы генеративного ИИ…
AppleGPT
Хотя компания не делала никаких анонсов о своей работе с генеративным ИИ, летом сообщалось, что компания уже создала собственную систему большой языковой модели (LLM), получившую название AppleGPT.
На данный момент инструмент используется только внутри компании, но затем в отчете говорилось, что «люди, знакомые с этой работой, считают, что Apple планирует сделать значимое объявление, связанное с ИИ, в следующем году».
Хотя этот отчет вызвал достаточно ажиотажа, чтобы спровоцировать рост акций AAPL, мы тогда предостерегли, что клиентам не следует ожидать скорого использования новой мощной службы Siri.
Цели Apple гораздо амбициознее, чем у ChatGPT
Хотя Apple могла бы запустить свою LLM завтра, компания стремится обогнать такие системы, как ChatGPT, двумя способами:
- Обработка на устройстве
- Выход за рамки обработки языка, чтобы включить аудио и видео с ИИ
Обработка на устройстве
Такие ИИ-системы, как ChatGPT, выполняют всю обработку на удаленных серверах, но исследовательские работы, написанные Apple, предполагают, что у компании есть гораздо более амбициозная цель: использование обработки на устройстве.
Это имело бы преимущество в скорости и конфиденциальности, но обеспечение работы таких служб в ограниченной памяти мобильных устройств представляет собой огромную проблему – и это считается ключевой причиной того, что компания тратит время перед запуском.
Мы уже видели, как компания сделала небольшой шаг к этой цели: в сентябре в последних моделях Apple Watch была запущена Siri для работы в автономном режиме.
Аудио и видео с ИИ, а также язык
ChatGPT известен как LLM, потому что он связан с обработкой языка. Но амбиции Apple выходят за рамки этого, стремясь включить обработку видео и аудио с помощью ИИ.
Мы снова видели некоторые ранние признаки этого: обработка визуальных и звуковых данных с помощью ИИ была замечена в функциях Door Detection и Live Captions.
Ожидается, что новое поколение Siri будет запущено в iOS 18
Financial Times сообщает об ожидаемом запуске гораздо более мощной версии Siri.
Конференция разработчиков Apple Worldwide Developers Conference, обычно проводимая в июне, широко ожидается как мероприятие, на котором компания представит свою последнюю операционную систему iOS 18. Аналитики Morgan Stanley ожидают, что мобильное программное обеспечение будет нацелено на поддержку генеративного ИИ и может включать в себя голосовой помощник Siri, работающий на LLM…
«Что касается чипов в их устройствах, то с точки зрения дизайна и архитектуры они определенно все больше ориентируются на ИИ», — сказал Дилан Патель, аналитик консалтинговой фирмы в области полупроводников SemiAnalysis.
Это перекликается с отчетом инсайдера Apple ранее в этом месяце, а Morgan Stanley указывает на списки вакансий Apple как на дополнительное свидетельство.
Почти половина вакансий Apple в области ИИ теперь включает термин «Глубокое обучение», который относится к алгоритмам, лежащим в основе генеративного ИИ — моделям, которые могут за секунды генерировать человекоподобный текст, аудио и код.
Мнение 9to5Mac
Хотя по-прежнему существует много спекуляций, идея крупного перезапуска Siri в этом году кажется все более правдоподобной.
LLM-модели, такие как ChatGPT, полностью изменили ожидания от того, чего мы теперь ждем от ИИ-систем. В то время как Apple могла ссылаться на конфиденциальность как на причину ограничения возможностей Siri по сравнению с конкурентами, которые обрабатывают большой объем личных данных, мы достигли точки, когда Siri выглядит неприемлемо глупой. Это должно измениться, и трудно представить, как Apple могла бы ждать дольше этого года.
Использование генеративного ИИ для работы Siri значительно повысит возможности интеллектуального помощника Apple, в то время как обработка на устройстве позволит компании продолжать демонстрировать свои конфиденциальные данные. Интеграция обработки видео и аудио дает компании реальный шанс убедить всех, что ожидание того стоило.
Фото: Омид Армин на Unsplash