Несмотря ни на что, чат-бот Siri кажется правильным решением

Вчерашний отчет гласит, что мы увидим чат-бот Siri в iOS 27, несмотря на то, что компания ранее отклоняла эту идею.

Если это правда, то компания примет двухэтапную стратегию, чтобы наконец-то наделить новую Siri интеллектом, которого ей так долго не хватало…

От научной фантастики к позору

Я уже говорил, что когда Apple впервые запустила Siri в 2011 году, это казалось большим шагом к тому, что раньше было научной фантастикой. Это была функция, ради которой я обновился до iPhone 4S, и я был очень впечатлен ею в те бурные первые дни.

Однако, перенесемся в 2026 год, и так называемый интеллектуальный помощник уже давно стал для Apple позором по всем тем причинам, которые мы подробно обсуждали ранее; мне не нужно их повторять.

Есть один недостаток Siri, который я *должен* обсудить, но я доберусь до него.

Этап 1: Siri на базе Gemini

Apple давно обещала гораздо более умную новую Siri, которая изначально должна была работать на базе Apple Intelligence. Это… не прошло гладко.

Однако на прошлой неделе ситуация резко изменилась, когда компания подтвердила сообщения о том, что новая Siri будет работать на базе моделей Gemini от Google. В то время как модели ChatGPT от OpenAI заняли доминирующую позицию в области генеративного ИИ, теперь широко признано, что Gemini от Google как минимум равны им, а во многих отношениях превосходят их.

Бета-запуск Google функции Personal Intelligence на базе Gemini дает нам хорошее представление о том, чего ожидать от новой Siri. Основное преимущество заключается в способности модели использовать сложную комбинацию источников для генерации ответов, включая персонализированную информацию, извлеченную из используемых нами приложений и сервисов Apple.

С точки зрения способности Siri действовать как интеллектуальный агент для выполнения задач, это будет поистине революционное улучшение по сравнению с сегодняшней Siri.

Этап 2: Чат-бот Siri

Изначально Apple придерживалась мнения, что чат-боты не являются особенно полезным пользовательским интерфейсом для встроенного интеллектуального помощника. Я подозреваю, что причина этого заключалась в том, что компания была очень сосредоточена на возможностях агентного ИИ — поручать Siri, чего мы хотим достичь, и позволять ей использовать встроенные приложения для выполнения задачи.

Например, мы можем попросить Siri забронировать столик на ужин в том тайском ресторане, где мы были несколько месяцев назад и который нам очень понравился. Siri сможет получить название ресторана, используя информацию, которую она может извлечь из таких источников, как подтверждение предыдущего бронирования в текстовом сообщении, история в Apple Maps или фотография, которую мы сделали там. Затем она сможет использовать приложение для бронирования, чтобы забронировать столик для нас и уведомить нас после получения подтверждения.

Я лично считаю, что агентный ИИ станет самым полезным развитием в этой области, но это не означает, что чат-ботам нет места вообще.

Роль чат-бота

Я сказал, что есть один недостаток Siri, который я должен здесь обсудить, и это то, что она *ужасно* плоха в контексте. Если вы задаете Siri один вопрос или даете одну инструкцию, а затем сразу же следуете связанным вопросом, она часто ведет себя так, как будто совершенно не понимает, о чем вы говорили всего три секунды назад.

В: Привет, Siri, кто играл Бэтмена в последнем фильме?
О: В мае 2019 года Роберт Паттинсон был выбран на роль Брюса Уэйна/Бэтмена.
В: А Робин?
О: Я не знаю, кто такой Робин.

Это та область, в которой чат-боты преуспевают, постепенно становясь лучше в этом со временем. Например, это начальные ответы на серию вопросов, которые я только что задал ChatGPT, намеренно используя расплывчатые формулировки, которые мог бы использовать типичный нетехнический пользователь.

Это поток, о котором Siri в настоящее время может только мечтать. ChatGPT может даже ссылаться на темы, которые мы обсуждали дни или недели назад. (Хотя он утверждает, что не знал, что ссылается на что-то, что я написал, когда я задал вопрос через полчаса).

Конечно, применимы все обычные предостережения относительно чат-ботов: неверные ответы, устаревшая информация и иногда дикие галлюцинации. (Хотя примеры, которые я привожу выше, используют его как Google, потому что именно так поступает большинство людей, я лично не склонен использовать его таким образом: я в основном использую его для мозгового штурма идей.)

Мы должны ожидать множества сбоев от новой Siri. Но ничто из этого не меняет того факта, что разговорные потоки — это чрезвычайно полезная возможность, поэтому я считаю, что Apple приняла правильное решение выбрать этот путь как *дополнение* к функциям агентного ИИ.

Вы согласны или не согласны? Поделитесь своим мнением в комментариях.

Фото: Solen Feyissa на Unsplash