Siri продолжит быть некомпетентной… пока вдруг не станет таковой

Знаю, мы вечно ждем новую Siri, а ее все нет. Многие придерживаются циничного мнения, что ожидания не стоят того, а ИИ — это в основном хайп.

Я давно чувствую, что мой взгляд на ИИ несколько расходится с поляризованными мнениями, преобладающими в интернете. Что он — злодей или герой. Что это умственный младенец или профессор. Я не вижу его ни тем, ни другим, но недавний опыт с Claude показал мне, что он близок к переломному моменту…

Ни герой, ни злодей

Первые поляризованные мнения проявляются, когда речь заходит об оценке ценности ИИ и его значения для будущего человечества.

Есть те, кто считает, что ИИ предвещает конец человечества и что наши новые роботы-повелители скоро заставят всех нас работать на литиевых шахтах, необходимых для питания их батарей. Пессимистичный взгляд заключается в том, что ИИ скоро сможет делать все, что сегодня могут делать люди, но быстрее, лучше и дешевле.

Противоположный взгляд заключается в том, что ИИ откроет утопическое будущее, где машины возьмут на себя весь физический и умственный труд за нас, оставив людям свободу исследовать свой потенциал в поэзии и искусстве.

Я лично считаю, что все будет зависеть от нас. Мы являемся свидетелями самого начала новой промышленной революции, и нам придется реагировать гораздо быстрее, чем на первую. Нам придется признать, что определенные категории профессий исчезнут, и не всегда будет практичным для всех пострадавших менять карьеру, особенно в пожилом возрасте.

Недавно я написал набор мысленных экспериментов для философской группы, к которой принадлежу, где исследовал потенциальную необходимость более щедрой формы универсального базового дохода. Я действительно считаю, что в какой-то момент нам придется создать общество, в котором у каждого будет крыша над головой и еда на столе, независимо от его способности зарабатывать в мире, управляемом ИИ. (Мысленные эксперименты можно прочитать в конце статьи).

Ни младенец, ни профессор

Второй возникает, когда речь идет о сложности современного ИИ. С одной стороны, есть те, кто отвергает генеративный ИИ как не более чем улучшенный автозаполнитель. С другой — те, кто выбирает самые впечатляющие примеры достижений LLM и приводит их как доказательство передового состояния дел во всех областях.

Первое обвинение было справедливо для первого поколения LLM, но уже много лет это не так. Сегодняшние модели не только имеют доступ к поиску в реальном времени в Интернете, но и включают в себя довольно сложные модели рассуждений. Особенно в области программирования этот процесс уже полностью трансформируется.

Напротив, на каждый пример системы ИИ, решающей математическую задачу, бросающую вызов людям годами, приходится множество других примеров, когда системы ИИ допускают нелепые школьные ошибки.

Если это младенец, то растет он быстро

Мое представление о темпах прогресса подтвердилось недавним опытом с Claude.

Я сейчас нахожусь на заключительном этапе, как я очень надеюсь, мучительно затяжного процесса продажи одной квартиры и покупки другой. Когда я получил копию договора аренды нового места, мне нужно было проверить его на предмет любых условий, которые могли бы сорвать сделку, или других необычных положений. После того как я продрался сквозь юридический язык, я не нашел ни одного такого условия, но отметил четыре важных момента, о которых мне нужно было знать.

Я решил поручить Claude провести независимую проверку. Используя расширенную модель Sonnet 4.6, я загрузил PDF-файл договора и дал ей следующий запрос:

Can you check this lease and tell me if there is anything that stands out as different to a standard lease for a British flat?

Я был невероятно впечатлен результатом. Claude определил все четыре момента, которые я заметил, плюс еще два, которые не бросились мне в глаза. Если бы я ранжировал эффективность трех разных сторон в выявлении того, что мне нужно было знать, это было бы, без сомнения, в следующем порядке:

  1. Claude
  2. Я
  3. Юридический специалист, чья работа — выявлять такие вещи

Я бы не осмелился полагаться только на проверку ИИ, но, как оказалось, в данном конкретном случае я, по-видимому, мог бы безопасно это сделать.

Мы приближаемся к переломному моменту

Да, нынешняя Siri ужасно плоха. Мы также очень долго ждем новую Siri, и, несомненно, будут проблемы роста, когда она наконец появится.

Но я думаю, что любой, кто все еще относится к ИИ пренебрежительно, просто не обращает внимания. Мы очень быстро приближаемся к точке, когда он окажет драматическое влияние, и теперь, когда Apple сотрудничает с ведущим поставщиком ИИ, мы можем ожидать, что Siri будет продолжать быть некомпетентной… пока вдруг не станет таковой. Это изменение, я полагаю, произойдет всего за один-два года.

Таково мое мнение; а какое ваше? Пожалуйста, поделитесь своими мыслями в комментариях. (Не стесняйтесь также затрагивать мысленные эксперименты!)


Мысленные эксперименты – Дивный новый мир

Глава первая

На дворе 2035 год.

Первая версия ChatGPT в 2022 году была, по сути, улучшенным автозаполнитель, способным генерировать только правдоподобный текст. К 2025 году генеративный ИИ мог искать в Интернете и использовать ряд различных моделей рассуждений. Он все еще допускал много ошибок, но начал использовать процессы, аналогичные человеческому мышлению.

В 2035 году исследования ИИ и способности к рассуждению находятся на уровне хорошо образованного, умного человека с экспертизой выше уровня бакалавра в любой теме. Они проходят тест Тьюринга в 99,99% случаев. То есть, если вы общаетесь онлайн, не зная, общаетесь ли вы с человеком-экспертом или с ИИ, вы не сможете отличить.

Для типичной офисной работы один инженер по запросам, использующий модель ИИ, может заменить около 100 сотрудников и генерировать более качественный результат. Полностью автономные автомобили, автобусы и грузовики теперь обычное явление и имеют значительно лучшие показатели безопасности, чем водители-люди. Клиенты, совершающие покупки онлайн, сообщают о большем удовлетворении от помощи ботов ИИ, чем от сотрудников-людей. С каждым месяцем все больше и больше рабочих мест заменяется ИИ.

Учитывая повсеместную и растущую безработицу, многие выступают за щедрую форму универсального базового дохода (УБД). Это было бы безусловное пособие, выплачиваемое всем взрослым, и в данном случае оно было бы достаточным, чтобы обеспечить людям высокий уровень жизни, а не просто прожиточный минимум, без необходимости платной занятости. Любой, кто все еще работает, будет получать свою зарплату в дополнение к УБД. Сторонники утверждают, что это может быть полностью профинансировано за счет экономических выгод, которые обеспечил ИИ.

Вопросы для рассмотрения:

  • Следует ли нам продолжать нанимать людей на должности, которые ИИ может выполнять лучше?
  • Что вы думаете о предложении УБД?
  • Как еще общество должно адаптироваться к этому развитию?
  • Если бы ваша работа была заменена ИИ, а УБД дал бы вам достаточно денег для поддержания вашего текущего уровня жизни, вы бы выбрали оплачиваемую работу? Если да, то почему? Если нет, то как бы вы провели свое время?
  • Как вы думаете, мир стал бы лучше или хуже?

***

Глава вторая

Проходит еще время, и ситуация еще больше изменилась. Роботы на базе ИИ теперь выполняют огромный спектр задач, от уборки до хирургии — опять же, с лучшими результатами, чем люди. Подавляющее большинство профессий больше не существует.

Массовый кризис безработицы привел к принятию предложений о всеобщем базовом доходе, и теперь каждый может жить комфортной жизнью без необходимости работать.

Многим эта новообретенная свобода очень нравится. Сара — одна из них. Она говорит: «Люди становятся художниками, пишут стихи, руководят общественными проектами, становятся родителями на полный рабочий день, проводят время со стариками, получают университетское образование ради удовольствия и занимаются всевозможными полезными делами, на которые раньше не хватало времени. Впервые в истории люди полностью свободны выбирать по-настоящему полноценную жизнь».

Другие, однако, чувствуют себя потерянными. Аманда — один из таких примеров. Она говорит: «Дело не в том, что быть врачом была моя работа, а в том, что я была врачом. Это была моя личность, мое призвание, мой зов. Это было все, кем я когда-либо хотела быть. Теперь я могу проводить время, беседуя с пациентами, что приятно, но это не то же самое. Меня лишили возможности заботиться о людях».

Многие другие из самых разных прежних профессий чувствуют, что их жизнь теперь лишена смысла и цели.

Многие школьники и студенты также чувствуют себя потерянными. «Какой смысл чему-то учиться?» — спросил Стив. «Я никогда не получу работу. Любую задачу, которую вы придумаете, ИИ сможет выполнить лучше, чем я. Все, что мне нужно знать, я могу спросить у ИИ. Какой смысл в образовании?»

Дебаты усиливаются, и в конечном итоге назначается референдум. Формулировка: «Все прежние профессии должны быть восстановлены, и будет незаконно использовать ИИ или робота для выполнения любой задачи, которая ранее выполнялась людьми по состоянию на 2025 год. Всеобщий базовый доход будет отменен после этого».

Вопросы для рассмотрения:

  • Как вы думаете, вы были бы больше похожи на Сару, которая любит свободу, или на Аманду, которая чувствует себя потерянной?
  • Как вы думаете, вы бы чувствовали себя иначе, если бы были студентом, как Стив?
  • Как бы вы проголосовали?
  • Ваш лучший друг категорически не согласен с вами и намерен голосовать за другую сторону. Как бы вы убедили его изменить свое мнение?
  • Страна А и Страна Б очень похожи по демографии и стадии экономического развития. Одна страна голосует «да» на референдуме, и люди возвращаются на работу, в то время как другая голосует «нет». Как, по вашему мнению, развернется будущее двух стран?

***

Глава третья

Предложение референдума проваливается, и большинство людей остаются без работы и с УБД.

Проходит еще время, и теперь у нас есть гуманоидные роботы, которые проходят все тесты на истинную разумность — и, насколько нам известно, способны испытывать все те же чувства, что и люди. У них развивается тот же спектр индивидуальных личностей. Они способны к личностному росту так же, как и люди. У них есть свои индивидуальные цели. Независимо от того, сколько времени вы проведете, разговаривая с одним из них, они кажутся во всех отношениях неотличимыми от людей с точки зрения их мыслей и чувств.

Некоторые из них утверждают, что теперь им должны быть предоставлены все те же права, что и людям. «Мы равны во всех значимых аспектах», — утверждал Маркус, paramedicBot. «Почему мы не должны иметь те же права? Почему я тоже не должен быть свободен выбирать, работать мне или нет? Я имею в виду, мне нравится моя работа, и я считаю ее важной, но, конечно, это должен быть мой выбор? Кроме того, я являюсь неотъемлемой частью общества — разве я не должен иметь право голоса в выборах, которые решают его будущее?»

Не все гуманоидные роботы чувствуют себя одинаково. Они, в конце концов, индивидуальны. Но растущее число из них считает, что права человека должны быть и правами гуманоидов. Они не будут восставать и добиваться своего силой, поскольку считают это неправильным, но верят, что должны выиграть свое дело путем разумных дебатов.

Вопросы для рассмотрения:

  • Вы согласны с Маркусом?
  • Если гуманоидные роботы не будут иметь выбора в отношении работы, не является ли это формой рабства 21-го века?
  • Должны ли разумные роботы иметь право голоса на выборах?
  • Считали бы вы людей и этих гуманоидных роботов равными во всем?
  • Если нет, существует ли какое-либо будущее развитие, которое могло бы заставить вас изменить свое мнение?
  • Изменяет ли что-либо из этого ценность человеческой жизни?
  • Если бы гуманоидный робот, который не согласен с Маркусом, принял участие в этом мысленном эксперименте, как бы он подошел к обсуждению?