
Люди годами жалуются на Siri, утверждая, что она отстает от Alexa и Google Assistant. Учитывая явные доказательства того, что 2024 год принесет значительные улучшения AI-функциям Apple, сможет ли Siri в iOS 18 наконец исправить положение?
Я очень надеюсь, что ответ положительный, и думаю, что есть три намека, дающих некоторые основания для оптимизма…
Долгое ожидание Apple по улучшению Siri
Apple не спешила с внедрением генеративного ИИ по трем причинам.
Во-первых, у компании хорошо отлаженный подход к новым технологиям. Она предпочитает позволять другим компаниям устранять проблемы на переднем крае, и выходит на рынок только тогда, когда чувствует, что может предложить опыт, превосходящий конкурентов.
Во-вторых, Apple уделяет большое внимание конфиденциальности, стремясь выполнять как можно больше обработки на устройстве, а не отправлять личные данные на сервер для обработки. Мы уже видели, как компания сделала небольшой шаг к этой цели: в последних моделях Apple Watch в сентябре была запущена автономная Siri.
В-третьих, Apple — консервативная компания (с маленькой буквы «с»), которая по возможности избегает противоречий. Генеративный ИИ восхищает людей кажущимся интеллектом своих ответов, но также совершает некоторые поразительно глупые вещи — от предложения фразы с нацистским приветствием в качестве предлагаемого ответа до, казалось бы, попыток мошенничества.
Я также утверждал, что голосовой интерфейс повышает ставки.
Но это тот год
Как бы я ни думал, что Apple ждала веских причин, сейчас ситуация достигла той точки, когда ждать дальше просто невозможно, и уже есть множество свидетельств того, что 2024 год — это год, когда Apple присоединится к поезду генеративного ИИ.
Bloomberg сообщил, что Apple называет iOS 18 одним из самых значительных обновлений iOS за всю историю, и что ИИ является его основным направлением.
Financial Times были немного более конкретны, указав, что в этом году Siri будет работать на основе генеративной модели ИИ в стиле ChatGPT.
9to5Mac обнаружил в бета-версии iOS 17.4 свидетельства того, что Apple работает над новой версией Siri, работающей на генеративных ИИ-технологиях.
Даже генеральный директор Тим Кук, который обычно скуп на слова, когда речь заходит о будущих планах Apple, заявил, что компания «рада поделиться подробностями о нашей текущей работе в этой области [ИИ] позднее в этом году».
Так чего же мы можем ожидать?
Намек 1: Первоначальная цель команды Siri
Одним из самых больших недостатков Siri является то, что она не смогла эффективно взаимодействовать с другими приложениями. Она, конечно, может управлять устройствами умного дома, и существуют Siri Shortcuts, но в целом, если то, что вы хотите сделать, требует стороннего приложения, Siri не поможет. Отсюда печально известная фраза «Вот что я нашел в интернете».
Но именно это и нужно, чтобы превратить Siri в действительно полезного и интеллектуального помощника. Чтобы она фактически начала выполнять некоторые задачи, которые в настоящее время выполняют личные ассистенты.
Фактически, это то, чего хотела достичь первоначальная команда Siri. До приобретения Apple, сторонняя версия приложения имела интеграцию с 42 различными сервисами. Именно Apple отключила эту возможность, вероятно, чтобы Siri могла делать меньше вещей, но более надежно.
Таким образом, Apple пошла своим путем, с значительно сокращенными возможностями Siri, а первоначальная команда создала новый интеллектуальный помощник — Viv, обеспечив глубокую интеграцию со сторонними приложениями для выполнения сложных задач.
Вот пример того, что Viv могла делать еще в 2016 году:
«Приготовь мне пиццу из Pizz’a Chicago рядом с моим офисом», — сказал один из инженеров в свой смартфон. Это был их первый реальный тест Viv, технологии искусственного интеллекта, которую команда тихо разрабатывала более года. Все немного нервничали. Затем появилось сообщение от Viv: «Хотите добавки?»
Инженеры, всего восемь человек, начали добавлять: «Пепперони». «Половина сыра». «Салат Цезарь». Воодушевленные результатом, они засыпали Viv новыми командами: Добавь еще начинки. Убери добавки. Измени средний размер на большой.
Примерно через 40 минут — и после нескольких заминок, когда Viv перепутала адрес офиса — приехал водитель Pizza Chicago с четырьмя пиццами, приготовленными на заказ.
Намек 2: Способность генеративного ИИ угадывать намерения
С тех пор, конечно, появился генеративный ИИ.
Хотя большинство людей впечатлены результатом — который в лучших примерах больше похож на написанный человеком, чем машиной — для меня самым впечатляющим является то, как технологии вроде ChatGPT обрабатывают ввод. Они действительно хороши в угадывании наших намерений.
Если Siri сможет понять, чего мы пытаемся достичь, и сможет взаимодействовать со сторонними приложениями и сервисами, такими как Uber, Booking.com, авиакомпании и так далее, то мы открываем возможность использования нескольких приложений для выполнения сложных задач.
Намек 3: Собственные исследования Apple по взаимодействию с приложениями
Последний намек мы получили ранее на этой неделе.
В исследовательской работе Apple описывается, как компания разрабатывает Ferret-UI, систему генеративного ИИ, специально предназначенную для анализа экранов приложений. В статье несколько расплывчато говорится о потенциальных применениях этого — вероятно, намеренно — но самой захватывающей возможностью было бы использование ее для более продвинутой Siri […]
Пользователь мог бы дать Siri команду вроде «Проверь рейсы из JFK в Бостон завтра и забронируй место на рейсе, который доставит меня туда к 10 утра, а общая стоимость составит менее 200 долларов». Затем Siri могла бы взаимодействовать с приложением авиакомпании для выполнения задачи.
Что это может означать для Siri в iOS 18?
Если сложить все это вместе, мы получим совершенно новую Siri, которая использует возможности генеративного ИИ для понимания наших запросов; взаимодействует с популярными существующими сервисами; и может взаимодействовать с другими приложениями на нашем iPhone.
Это позволит Siri отвечать на такие запросы, как:
«Я еду на WWDC 2024 — предложи варианты рейсов и отелей».
Генеративный ИИ выполняет необходимое парсинг. Он знает, что нужно узнать, где проводится WWDC и на какие даты. Он использует наше известное домашнее местоположение, чтобы определить, откуда нам нужно ехать.
Он использует приложения, установленные на моем iPhone, чтобы определить, какими авиакомпаниями я пользуюсь и какие гостиничные группы предпочитаю. Для популярных сервисов он затем использует созданные Apple интеграции Siri с этими сервисами.
Там, где Apple не создала интеграцию Siri, она взаимодействует с другими приложениями по мере необходимости для выполнения наших намерений.
Я не говорю, что мы можем дойти до того, чтобы просто доверить Siri все бронировать! Я думаю, ей придется сначала представлять свои предложения нам, чтобы мы могли выбирать. Но как только мы это сделаем, тогда можно будет сказать: «Продолжай и забронируй Mosser и американские рейсы, вылетающие в 3 часа дня 9-го числа и возвращающиеся в 11 утра 15-го числа».
Мечты или реалистичные ожидания?
Прошло почти десять лет с тех пор, как я написал запрос на добавление функции, призывающий Siri к взаимодействию со сторонними приложениями. Этого пока не произошло; может ли это наконец произойти сейчас?
Это, безусловно, амбициозная цель. Но первоначальная команда Siri уже продемонстрировала, сколько было возможно еще до появления генеративного ИИ. Учитывая прорывы, сделанные с тех пор, я хотел бы верить, что вышеописанное осуществимо.
Каково ваше мнение? Считаете ли вы, что это разумное ожидание для совершенно новой версии Siri, работающей на генеративном ИИ в iOS 18? Пожалуйста, пройдите наш опрос и поделитесь своими мыслями в комментариях.