Мнение: Viv — это именно то, чем Siri должна была стать к настоящему времени

Как давние читатели знают, я давно являюсь поклонником Siri. Как я часто отмечал, это мой основной способ взаимодействия с моим iPhone (отчасти поэтому мне не нужен экран большего размера). Я диктую большинство своих сообщений, и если есть возможность попросить Siri сделать что-то за меня, а не делать это самому, я делаю.

Но у Siri есть один серьезный недостаток: она не имеет доступа к сторонним приложениям. Существует бесчисленное множество приложений, в которых я хотел бы, чтобы Siri выполняла основную работу, как я писал в прошлом году в разделе «Запрос функции»:

Я пока не могу спросить время отправления моего следующего поезда домой, хотя на моем телефоне есть приложение, которое может ответить на этот вопрос. Я не могу попросить его показать мне сегодняшний Timehop, ни отправить его в Facebook. Я не могу попросить его отправить что-то в чат Hipchat или Slack. Я не могу попросить его вызвать Uber. Я не могу попросить его перевести «Где находится ближайшая аптека?» на китайский. Я мог бы назвать множество других примеров, но вы поняли.

Если бы Apple предоставила API для доступа сторонних разработчиков к Siri, я уверен, что многие бы воспользовались этой возможностью. И я, конечно, не одинок в этом желании — в нашем опросе 95% из вас согласились со мной.

Но оказывается, что создатели Siri хотели пойти еще дальше…

Вместо того чтобы просто просить Siri вызывать сторонние приложения для выполнения задач, они хотели устранить посредника и напрямую интегрироваться с самими базовыми сервисами. Например, сообщив Siri, что вам нужен автомобиль, чтобы забрать шестерых из вашего офиса, она бы напрямую связалась с серверами Uber для оформления заказа. Целью команды было «переосмыслить саму мобильную коммерцию».

Apple, по какой-то причине, не согласилась. В то время, когда она купила Siri, она заставила команду удалить поддержку всех сторонних приложений, изначально интегрированных с сервисом — всего около 45 — и запустить его без них. С тех пор команда все больше разочаровывалась растущим разрывом между своими амбициями в отношении сервиса и гораздо более скромными возможностями, которые Apple позволяла ей внедрять.

В результате треть команды покинула Apple, чтобы создать совершенно нового интеллектуального помощника, который делал бы все то, что им не разрешалось делать с Siri: Viv. Вчера мы получили первый взгляд на результат на данный момент — и это невероятно впечатляет. Если вы еще не посмотрели видео, я настоятельно рекомендую это сделать.

Что больше всего отличает Viv от Siri, так это то, что все запросы и ответы Siri жестко закодированы. Кому-то пришлось сесть и подумать обо всех различных вопросах, которые могут быть заданы Siri, и обо всех различных формулировках, которые могут быть использованы, и предоставить ответ на каждый из них.

Конечно, Siri создает впечатление, что она немного умнее, потому что у нее часто бывает несколько ответов на один и тот же запрос, поэтому она кажется более человечной и менее роботизированной, но по сути это простая база данных запросов и ответов.

Некоторые из этих ответов, конечно, содержат переменные. Если вы спросите Siri, понадобится ли вам зонтик в Лондоне сегодня вечером (он понадобится, кстати), Siri запрашивает базу данных погоды, чтобы определить ответ. Но в том, как она работает, относительно мало интеллекта. Именно поэтому соучредители Siri Даг Киттлаус и Адам Чейер довольно пренебрежительно называют реализацию Siri от Apple просто «умным чат-ботом с ИИ».

Viv делает гораздо более сложную работу.

Viv начинает с попытки определить *намерение* вашего запроса. Он анализирует все различные элементы запроса и сводит их к тому, что он может понять. Например, в одном запутанном примере в видео Киттлаус спросил Viv: «Будет ли теплее 70 градусов возле моста Золотые Ворота после 5 вечера на послезавтра?»

Я только что протестировал это на Siri, и все, что она смогла сделать, — это веб-поиск по моему вопросу. Viv, напротив, разбил запрос на составные части. Он определил, что «теплее 70 градусов» — это вопрос о погоде. Он смог найти «возле моста Золотые Ворота» как место. Он знал, что «послезавтра» — это (на момент запроса) 11 мая. И он знал, что конкретное время означает, что потребуются почасовые прогнозы. Он очень быстро ответил на вопрос.

Но именно *то, как* Viv отвечает на вопрос, поражает. Вместо того чтобы обращаться к базе данных, Viv генерирует код. Этот код — это программное обеспечение, которое имеет возможность ответить на вопрос. И он делает все это — анализирует запрос, пишет код, выполняет его и доставляет ответ — так же быстро, как Siri.

Конечно, Киттлаус знал, на какие вопросы Viv может и не может ответить, но он был достаточно уверен, что вся демонстрация проходила вживую. Записанных ответов не было.

Киттлаус и его команда работают над этим уже некоторое время. Wired получили информацию еще в 2014 году.

Viv преодолевает эти ограничения, генерируя собственный код на лету, без программистов. Возьмем сложную команду, например: «Найди мне рейс в Даллас с местом, куда поместится Шак». Viv проанализирует предложение, а затем продемонстрирует свой лучший трюк: автоматическое создание быстрой, эффективной программы для связи сторонних источников информации — скажем, Kayak, SeatGuru и медиа-руководства NBA — чтобы определить доступные рейсы с большим пространством для ног. И все это он сможет сделать за долю секунды.

Я помню, как читал тогда полушуточный пример конечной цели действительно умного помощника.

Киттлаус говорит, что конечным результатом будет цифровой помощник, который знает, чего вы хотите, прежде чем вы попросите. Он представляет себе кого-то, кто неуверенно держит телефон у рта возле забегаловки в 2 часа ночи и говорит: «Я пьян». Без каких-либо уточнений Viv свяжется с предпочтительной службой такси пользователя, отправит ее по адресу, где он полубессознательно лежит, и укажет водителю отвезти его домой. Больше никакого сознания не потребуется.

Пример забавный, но это мощное выражение того, как действительно *персональный* интеллектуальный помощник должен работать. Он плавно и без усилий объединяет то, что он знает о нас — где мы находимся, где мы живем, какую службу такси мы обычно используем — чтобы выполнить задачу с минимальным количеством подсказок.

Это также означает, что тип задачи высокого уровня, который я предвидел в своей более ранней статье, кажется вполне осуществимым.

Привет Siri, организуй обед с Сэмом на следующей неделе

Работаю — скоро вернусь…

Хорошо, я организовал обед с Сэмом на следующую среду в 13:00 в Bistro Union в Clapham Park

Это использует то, что она знает обо мне, что она знает о Сэме, и доступ (с разрешения) к календарю Сэма на уровне занятости/свободы и местоположения, чтобы выяснить все детали, которые иначе могли бы занять у нас двоих десять минут предложений и контраргументов.

Почему Apple хотела отказаться от такого рода возможностей, мне непонятно. Возможно, это пристрастие Apple к контролю. Если вы используете базу данных запросов и ответов, то вы имеете полный контроль над всем, что говорит и делает Siri. Открытый подход Viv «решать на лету» менее предсказуем и, возможно, с точки зрения Apple, слишком рискован.

Но я знаю одно: каким бы верным я ни был Siri до сих пор, если Viv действительно оправдает ожидания, то в тот момент, когда он станет доступен на моем iPhone, Siri уйдет в историю.

Что вы думаете по этому поводу? Примите участие в нашем опросе и, пожалуйста, поделитесь своими мыслями — и особенно примерами запросов, которые вы хотели бы видеть обрабатываемыми Viv — в комментариях.