Разговорная Siri должна быть настолько хороша, чтобы получить ее только в 2027 году

Один из самых странных аспектов истории Apple заключается в том, что за 14 лет компания превратилась из одного из лидеров в области интеллектуальных помощников в одного из крупнейших отстающих.

Мы прошли путь от футуристически ощущаемой Siri в 2011 году до болезненно неадекватной Apple Intelligence в 2025 году….

14 лет Siri

Я до сих пор помню презентацию iPhone 4S, когда Siri стала причиной, по которой мне пришлось срочно его покупать.

Apple не создавала Siri: она впервые появилась как стороннее приложение для iPhone. Но именно решение Стива Джобса купить эту технологию и интегрировать ее в iPhone вывело ее на публику и сделало интеллектуального помощника неотъемлемой частью того, чего мы теперь ожидаем от смартфона.

Четырнадцать лет должны были дать Apple достаточно времени, чтобы превратить Siri в феноменально мощного помощника, и тем не менее… этого не произошло. Еще в 2015 году я описал будущие возможности, которые хотел бы видеть, включая предоставление ей возможности взаимодействия с нашими приложениями. Потребовалось целое десятилетие, чтобы Apple даже начала предоставлять эту функцию!

Что еще более удивительно для меня, так это то, что в 2018 году я составил список действительно базовых вещей, которые Siri по-прежнему не могла делать, и она *до сих пор* не может делать несколько из этих вещей!

Сегодня Siri выглядит как Lada, а ChatGPT и ее аналоги — Mercedes.

Однако у Apple есть пара оправданий для того, чтобы не соответствовать производительности современных LLM.

Надежность — один из факторов

Во-первых, надежность.

OpenAI, Google и другие придерживались подхода «двигайся быстро и ломай вещи» в отношении ИИ. Когда ChatGPT и Google Bard были еще новыми, я отмечал их способность совершать поистине чудовищные ошибки. Например, при просьбе помочь написать научную статью ChatGPT просто выдумывал несуществующие ссылки. Google Bard даже дал неверный ответ на вопрос во время демонстрации того, насколько он умен.

Я тогда подчеркивал, что голосовые ответы Siri делают подобные ошибки еще более опасными.

Если есть что-то более опасное, чем не знать что-то важное, так это просить информацию и получать неверный ответ с большой уверенностью.

Когда поиск Google показывает вам обычные результаты рядом с окном чата, отвечающим на тот же вопрос, компании очень легко включить заметные предупреждения о том, что ответ чата может быть неточным.

Но Siri разработана для предоставления голосовых ответов на голосовые запросы. Еще более раздражающим, чем «ответ» Siri на вопрос: «Вот что я нашел в Интернете», было бы: «Вот подробный ответ, который вы сначала должны прослушать, затем я отмечу, что он может быть некорректным, и порекомендую вам поискать в Интернете».

Приватность — другой

Другой важный фактор — конфиденциальность. Siri всегда работала в соответствии с двумя основными принципами, уважающими конфиденциальность:

  • Обработка на устройстве, где это возможно
  • Анонимные запросы при использовании серверов Apple

Обработка на устройстве никогда не может быть такой же умной, как обработка, выполняемая мощными машинами в дата-центрах, а обеспечение того, чтобы сервер Siri не знал, кто вы, также мешает ему быть таким же умным, как сервер Google, имеющий доступ к вашей истории поиска и знающий о вас миллион вещей.

Я утверждал в прошлом году, что, хотя ожидание Siri на базе LLM разочаровывает, в долгосрочной перспективе выигрыш от конфиденциальности будет того стоить.

Огромный объем личных данных, необходимых для того, чтобы Siri стала по-настоящему умным и полезным интеллектуальным помощником, хранится прямо на наших устройствах, в Apple Calendar, Contacts, Files, Health, Mail, Maps, Messages, Wallet и так далее. У нас также будет возможность предоставлять Siri доступ к конкретным сторонним приложениям по нашему выбору, опять же прямо на наших устройствах.

Как только Siri сможет получить доступ к этим приложениям, она наконец-то сможет стать столь же мощной, как конкурирующие системы, сохраняя при этом нашу конфиденциальность.

В долгосрочной перспективе это то будущее ИИ, которое я хочу: помощник, который много знает о моей жизни, чтобы действовать как личный помощник, но только на моих устройствах с моего разрешения. Это та LLM Siri, которую строит Apple, и хотя я хотел бы иметь эти возможности прямо сейчас, я думаю, что ожидание того стоит.

Теперь мы ожидаем еще более долгой задержки

Я написал это, когда ожидалось, что разговорная Siri будет запущена в начале 2026 года, что уже казалось долгим ожиданием. Но, согласно последним сведениям из Bloomberg, запуск теперь перенесен на 2027 год — а возможно, и позже!

Гурман говорит, что сотрудники подразделения ИИ Apple теперь полагают, что более разговорная версия Siri не появится у потребителей раньше iOS 20 «в лучшем случае».

Это *действительно* повышает ожидания

Две вещи универсально верны для всего, чего приходится долго ждать. Во-первых, ожидание мучительно и кажется вечностью. Во-вторых, когда оно заканчивается, радость от получения означает, что мы скоро забываем о боли задержки.

Перенесемся в будущее, когда разговорная Siri будет на наших телефонах, и *если* она действительно оправдает ожидания и наконец-то продемонстрирует тот уровень интеллекта, который нам действительно нужен, тогда это будет правдой. Мы будем закатывать глаза, вспоминая, как долго Apple шла к этому, но все будет прощено.

Но такая продолжительность задержки *драматически* повышает ожидания от того, какой должна быть Siri в 2027 году. Просто подумайте, что ChatGPT, Claude, Gemini, Llama и DeepSeek смогут делать к тому времени!

Подумайте о новой разговорной Alexa от Amazon и о том, на что *она* будет способна через два года разработки, используя все данные, которые компания собрала о запросах, которые ей делают люди.

Siri будет оцениваться не по возможностям сегодняшних чат-ботов, а по возможностям тех, которые будут через два года. Это будет феноменально высокая планка, и Apple *действительно* должна ее достичь.

Изображение: Michael Bower/9to5Mac