Технологии чат-ИИ в конечном итоге сделают Siri умнее, но не в ближайшее время [Мнение]

Технологии чат-ИИ, без сомнения, самое захватывающее событие в мире технологий за последнее время – они предоставляют ответы на вопросы, пишут эссе, генерируют рабочий код и даже сдают экзамены MBA через диалоговый интерфейс.

Microsoft объявила, что версия ChatGPT будет использоваться для функции диалогового поиска в её поисковой системе Bing. Google поспешила объявить, что она также будет использовать собственный чат-бот с ИИ, Bard, для поиска. Означает ли всё это, что Apple тоже присоединится к этой технологии чат-ИИ нового поколения, чтобы наконец сделать Siri умнее…?

Что такое технологии чат-ИИ?

Вместо того чтобы писать об этом самому, я решил попросить самую известную систему – ChatGPT – сделать это за меня. Я спросил её: «Что такое ChatGPT?», и вот её ответ:

ChatGPT — это языковая модель, разработанная OpenAI.

Это передовая языковая модель ИИ, основанная на архитектуре трансформера, которая была обучена на большом корпусе текстовых данных. Она может генерировать человекоподобный текст на основе заданного запроса и используется для различных приложений, таких как чат-боты, языковой перевод, ответы на вопросы и завершение текста.

Название «ChatGPT» расшифровывается как «Chat Generative Pre-trained Transformer» (Генеративный предварительно обученный трансформер для чатов). Часть «предварительно обученный» означает, что модель была обучена на огромном объёме текстовых данных до выпуска, что позволяет точно настраивать её для конкретных задач с меньшим объёмом данных, специфичных для задачи.

К этому я бы добавил лишь, что общее название для этого типа технологий — большие языковые модели, или LLM.

Её первый ответ на вопрос «Каковы преимущества систем чат-ИИ, таких как ChatGPT?» почему-то был сосредоточен на приложениях для обслуживания клиентов. Она утверждала, что для многих рутинных запросов клиентов бот мог бы реалистично заменить операторов-людей. Затем я продолжил, спросив: «А что насчёт использования за пределами обслуживания клиентов?»

Да, помимо обслуживания клиентов, системы чат-ИИ, такие как ChatGPT, также могут использоваться для нескольких других целей, включая:

  1. Личная помощь: Системы чат-ИИ могут использоваться в качестве виртуальных помощников для личных или деловых задач, таких как планирование встреч или поиск информации.
  2. Продажи и маркетинг: Системы чат-ИИ могут использоваться для поддержки продаж и маркетинговых усилий, взаимодействуя с потенциальными клиентами и предоставляя информацию о продуктах.
  3. Образование и обучение: Системы чат-ИИ могут использоваться для предоставления образовательного контента и ответов на вопросы студентов, дополняя или заменяя традиционные методы.
  4. Здравоохранение: Системы чат-ИИ могут использоваться для предоставления медицинской информации, диагностики симптомов или связи пациентов с медицинскими специалистами.
  5. Финансовые услуги: Системы чат-ИИ могут использоваться для предоставления финансовых консультаций, управления инвестициями или ответов на вопросы, связанные с банковской деятельностью.
  6. Исследования и разработки: Системы чат-ИИ могут использоваться для поддержки исследований, отвечая на вопросы, генерируя идеи или помогая с анализом данных.
  7. Развлечения: Системы чат-ИИ могут использоваться для развлечений, например, для генерации шуток или игр.

Это сразу демонстрирует одно из ключевых преимуществ ChatGPT перед Siri: она понимает контекст. Siri иногда это делает – например, когда я спросил: «Где Дели?», она показала мне город на карте, а когда я продолжил вопросом «Который час там?», она поняла, что я всё ещё говорю о Дели, и дала правильный ответ. Но в большинстве случаев, если вы зададите дополнительный вопрос, Siri понятия не имеет.

Например, когда я спросил: «Как мне добраться до Тауэра?», она открыла Apple Maps и показала мне маршрут. Но когда я продолжил вопросом: «Что я могу там увидеть?», она понятия не имела, о чём я спрашиваю.

Будет ли Apple использовать технологии чат-ИИ, чтобы сделать Siri умнее?

Долгосрочный ответ: да. Уже ясно, что эта технология станет будущим поиска, и что её возможности заставляют все текущие ИИ смарт-устройств – Siri, Alexa и Google Assistant – выглядеть глупыми, как полено.

Apple также явно проявляет большой интерес к ИИ. Она разработала собственный чип Neural Engine специально для задач ИИ. Фотографические возможности iPhone также в значительной степени обусловлены вычислительной фотографией, которая основана на ИИ. И у неё проводится ежегодный внутренний саммит по ИИ. Можно с уверенностью сказать, что ChatGPT и Bard станут ключевыми темами мероприятия в следующем месяце.

Но не стоит затаивать дыхание в ожидании более умной Siri в ближайшее время, по двум причинам. Во-первых, это фирменный подход Apple почти ко всем новым технологиям: выжидать и наблюдать. Компания редко стремится первой выйти на рынок с какой-либо новой технологией. Вместо этого она наблюдает за тем, что делают другие, а затем пытается понять, как сделать это лучше.

Но есть и более конкретная вторая причина…

Технологии чат-ИИ гораздо глупее, чем кажется

Системы, подобные ChatGPT, хорошо выглядят умными. Они пишут очень убедительно, потому что были обучены на миллионах документов, написанных людьми, и по сути свободно заимствуют из всего, что видели, чтобы воспроизводить всё: от конкретных фраз до структур документов.

Но всё своё кажущееся знание они также черпают из тех же миллионов источников. Из них они понятия не имеют, как отличить правду от вымысла; обоснованную позицию от предрассудков; статистические данные от предубеждений; надёжные данные от мусора.

Если вы попросите ChatGPT, например, написать научную статью, он с радостью это сделает. Но он будет черпать данные из случайных источников и, как отмечает Nature, придумывать несуществующие ссылки.

ChatGPT и его конкуренты работают, изучая статистические закономерности языка в огромных базах данных онлайн-текстов — включая любые неправды, предубеждения или устаревшие знания. Когда LLM затем получают запросы (такие как тщательно структурированные запросы Грини и Пивидори переписать части рукописей), они просто выдают, слово за словом, любой способ продолжить разговор, который кажется стилистически правдоподобным.

В результате LLM легко генерируют ошибки и вводящую в заблуждение информацию, особенно по техническим темам, для которых у них могло быть мало данных для обучения. LLM также не могут показать источники своей информации; если их попросят написать научную работу, они придумывают вымышленные цитаты. «Инструменту нельзя доверять в плане достоверности фактов или предоставления надёжных ссылок», — отмечалось в январской редакционной статье о ChatGPT в журнале Nature Machine Intelligence.

Более забавный пример:

Столь же забавный пример – ошибка Bard от Google в ответе на вопрос во время живой демонстрации, призванной показать, насколько он впечатляющ. Его спросили: «О каких новых открытиях JWST я могу рассказать моему 9-летнему ребёнку?»

Он дал ответ: «JWST сделал первые снимки планеты за пределами нашей Солнечной системы». К сожалению для Google и Bard AI, первые прямые изображения экзопланеты за пределами нашей Солнечной системы были получены с помощью VLT в 2004 году, согласно NASA, а не JWST, как заявил Bard. Это могло быть связано с некорректными сообщениями, которые Bard AI видел и которые были интерпретированы как верные.

Google удалила видео, и на момент написания статьи её акции упали на 6%. Ошибка остаётся видна всему миру в твите Google:

Таким образом, хотя поисковые системы Bing и Google внедрят системы чат-ИИ в результаты, они не заменят их в ближайшее время.

Устные ответы Siri несут гораздо большие риски

Если есть что-то более опасное, чем не знать что-то важное, так это спрашивать информацию и получать неверный ответ с большой уверенностью.

Когда поиск Google показывает вам обычные результаты рядом с окном чата, отвечающим на тот же вопрос, компании очень легко включить заметные предупреждения о том, что ответ чата может быть неточным.

Но Siri предназначена для предоставления устных ответов на устные вопросы. Ещё более раздражающим, чем Siri, «отвечающая» на вопрос фразой «Вот что я нашла в интернете», было бы «Вот длинный ответ, который вам сначала нужно выслушать, затем я отмечу, что он может быть неверным, и порекомендую вам искать в интернете».

Но у неё огромный потенциал для HomeKit

Возможно, нам придётся подождать, прежде чем Siri сможет использовать эквивалент ChatGPT от Apple для ответов на вопросы, но одна демонстрация уже показала потенциал в предоставлении Siri возможности лучше понимать наши потребности в умном доме.

Это вполне может стать разумной отправной точкой для Apple, чтобы начать использовать эту технологию – и я очень надеюсь, что так и будет. Тем более что мне недавно пришлось переименовать сцену HomeKit под названием «Я ложусь спать», потому что, после того как она правильно интерпретировала её пару недель, выключая свет в гостиной и включая в спальне, Siri решила вместо этого выключить весь свет и разблокировать мою входную дверь, видимо, решив, что я ухожу…

Визуализация: Aideal Hwa/Unsplash