
The Information опубликовал отчет с интересными деталями о партнерстве Apple с Google, согласно которому Gemini станет основой для ее ИИ-функций, включая новую Siri. Вот подробности.
Внутренняя доработка, отсутствие брендинга Google или Gemini
Вчерашнее совместное заявление о том, что Apple решила использовать Gemini для своих ИИ-функций, было скудным на технические подробности.
Компании заявили, что функции Apple на базе Gemini «продолжат работать на устройствах Apple и в Private Cloud Compute», что означает, что Google по своей задумке не будет иметь доступа к пользовательским данным, но на этом все.
Сегодня The Information опубликовал интересный взгляд на некоторые аспекты партнерства, включая тот факт, что Apple сможет самостоятельно настраивать свою версию модели Gemini:
Apple может попросить Google внести изменения в работу модели Gemini, но в остальном Apple сможет самостоятельно дорабатывать Gemini, чтобы она отвечала на запросы так, как предпочитает Apple, сообщил источник, участвующий в проекте.
Кроме того, отчет частично отвечает на вопрос, который многие задавали себе или спекулировали о нем, когда речь заходит о том, насколько заметным будет брендинг Google во всем пользовательском опыте:
В текущем прототипе системы Apple на базе Gemini ответы ИИ не содержат никакого брендинга, связанного с Google или Gemini, сказал этот человек.
Хотя окончательный пользовательский опыт может отличаться от текущей реализации, это отчасти перекликается с отчетом Bloomberg конца прошлого года, в котором Марк Гурман сказал:
Я не ожидаю, что какая-либо из компаний когда-либо публично обсудит это партнерство, и вы не должны ожидать, что Siri будет переполнена сервисами Google или функциями Gemini, уже доступными на устройствах Android. Это просто означает, что Siri будет работать на основе модели, которая действительно сможет предоставлять ожидаемые пользователями ИИ-функции — все это с пользовательским интерфейсом Apple.
The Information также отмечает, что Apple ожидает, что Siri на базе Gemini улучшит свою производительность в ответах, связанных с мировыми знаниями, фактически отвечая на вопрос («например, описывая население страны или научную информацию»), а не просто предоставляя ссылки для перехода.
Siri на базе Gemini станет лучше оказывать эмоциональную поддержку
В отчете The Information также отмечается, что Apple ожидает, что Siri на базе Gemini станет лучше оказывать эмоциональную поддержку:
«Еще один распространенный набор вопросов, с которыми Siri исторически испытывала трудности, включал эмоциональную поддержку, например, когда клиент говорит голосовому помощнику, что он чувствует себя одиноким или подавленным. В версии на базе Gemini Siri будет давать более подробные и разговорные ответы, как это делают ChatGPT и Gemini, сказал этот человек.»
Установление эмоциональной поддержки в качестве цели может быть рискованным шагом, поскольку нет недостатка в задокументированных случаях, когда уязвимые пользователи причиняли себе вред после разговоров с чат-ботами.
Во многих случаях системы вместо предоставления соответствующего руководства по безопасности или направления пользователей к реальной помощи, выдавали галлюцинации, неправильно оценивали ситуацию или не улавливали серьезность разговора, иногда с серьезными последствиями.
Как именно Siri на базе Gemini будет справляться с этой ситуацией, когда она неизбежно возникнет, еще предстоит увидеть.
О тех двух разных системах
В августе прошлого года на общекорпоративном собрании глава отдела программного обеспечения Apple Крейг Федериги затронул одну из самых больших проблем с неудачной модернизацией Siri компанией Apple.
В то время Bloomberg сообщал:
Федериги объяснил, что проблема была вызвана попыткой выпустить версию Siri, которая объединяла две разные системы: одну для обработки текущих команд — например, установки таймеров — и другую, основанную на больших языковых моделях, программном обеспечении, стоящем за генеративным ИИ. «Мы изначально хотели создать гибридную архитектуру, но поняли, что такой подход не позволит нам достичь качества Apple», — сказал Федериги.
Хотя отчет The Information не углубляется в этот технический аспект, он отмечает следующее:
Хотя некоторые распространенные задачи Siri, такие как установка таймера, напоминания или отправка конкретного текстового сообщения контакту в телефоне, по-прежнему будут выполняться с использованием технологий, хранящихся на устройствах Apple, новая версия Siri также сможет обрабатывать случаи, когда вопрос клиента не понимается четко.
Например, если кто-то просит Siri отправить текстовое сообщение своей матери или сестре, но клиент не сохранил их имена таким образом в своих контактах, Siri на базе Gemini сможет просмотреть их сообщения, чтобы выяснить, кто из их контактов, скорее всего, является их матерью или сестрой, сказал этот человек.
Другими словами, похоже, что Apple по-прежнему стремится объединить традиционные, не требующие высокого риска задачи обработки естественного языка (такие как установка таймеров или создание простых напоминаний) с более сложными, недетерминированными задачами в единый, оптимизированный пользовательский опыт. И это правильно, с точки зрения пользовательского опыта.
Проблема в том, что, хотя на первый взгляд это может показаться пустяком, это оказалось сложной задачей, даже для Google и для Amazon. Поэтому будет интересно узнать больше об этом по мере приближения фактического запуска первых функций партнерства.
Временная шкала
Наконец, отчет также подтверждает, что развертывание ИИ-функций Apple на базе Gemini будет постепенным:
Некоторые функции будут запущены этой весной. Другие, включая способность Siri запоминать предыдущие разговоры с клиентом, или проактивные функции, которые могут предложить им уехать, чтобы избежать пробок перед встречей в аэропорту, указанной в их календаре Apple, ожидаются к анонсу на ежегодной конференции разработчиков компании в июне, сказал этот человек.
Вы можете прочитать полный отчет The Information здесь.
Акции на аксессуары на Amazon