
Я знаю, это всего лишь бета-версия для разработчиков, и если кто-нибудь из Apple спросит, то мои первые впечатления от Visual Intelligence представлены исключительно в контексте его будущего потенциала. Но я должен сказать, что попытка использовать его заставляет меня с нетерпением ждать этого будущего.
Сама функция Apple Intelligence в настоящее время относительно ограничена. В большинстве случаев вы можете выбрать между просьбой к ChatGPT описать вам то, что вы видите, и поиском в Google…
Реальные функции Apple Intelligence
Насколько мы можем судить, Apple Intelligence выполняет несколько функций напрямую:
- Суммирование текста, видимого на экране
- Получение информации о предприятиях из Apple Maps
- Распознавание дат и времени в тексте и открытие Календаря для этого слота
Но для распознавания объектов функция в настоящее время, похоже, использует исключительно ChatGPT и Google. По моему ограниченному опыту, Google намного впечатляет.
Распознавание изображений с помощью Google и ChatGPT
Я обычно тщательно исследую большинство своих нетривиальных покупок, прежде чем нажать кнопку. Я читаю отзывы, спрашиваю совета у друзей и в целом допрашиваю Google досконально.
Так что, если я вижу что-то в использовании где-то и хочу проверить это, мне нужны конкретные детали: сказать мне, что я смотрю на компактную кофемашину «зерно-в-чашку» или что-то подобное, было бы недостаточно.
Так как же справляется Visual Intelligence v0.1? Я протестировал его на нескольких вещах у себя дома.
Первой была моя комбинированная микроволновка, духовка и аэрогриль Sage Combi Wave 3-в-1. В США она продается под брендом Breville. Visual Intelligence немедленно опознала ее (первый результат, верхний правый угол). Она также показала конкурирующий продукт, но остальные верхние результаты были верными.

Далее — моя кофемашина Sage Barista Touch. Здесь VI была немного менее уверена, предполагая, что это может быть либо она, либо гораздо более дорогая модель Oracle Touch от того же бренда, но не требуется много усилий, чтобы определить, какая из двух ее предложений правильная. (Хотя кажется, что она включает третью модель в список, это рекламное объявление с сайта с неправильно маркированной фотографией.)

Газированная машина Aarke Carbonater II? Нет проблем.

С бокалом для вина Reidel O Wine Tumbler она справилась немного хуже, но это простительно, так как есть куча имитаторов. В основном показывались только оригинал и прямые копии.

Перейдя в гостиную, она определила это как кресло Eames Lounge Chair, и поскольку это реплика с точностью до миллиметра, я прощу ее за то, что она не смогла отличить его от настоящего.

Я пробовал использовать его для оригинальных произведений менее известных (но не неизвестных) художников, без особого успеха. Однако, когда дело дошло до печати, она без проблем ее опознала.

С моим Naim Mu-so она предположила, что это устройство второго поколения, а не первого, но, учитывая, что они визуально идентичны, и почти все веб-ссылки посвящены этой модели, это вполне понятно.

Я пробовал ее на других устройствах в моем доме:
- Оригинальный HomePod
- Echo Dot
- Philips Hue Switch
- Умный дверной звонок Netatmo
Со всеми этими устройствами она справилась правильно.
Это отличное начало, и впереди еще многое
Мой первый опыт работы с технологией распознавания изображений на базе ИИ был, когда я тестировал очки Ray-Ban Meta, хотя для получения максимальной пользы от них требовались некоторые точные формулировки и/или последующие вопросы.
Visual Intelligence уже кажется лучше этого, и именно темпы развития меня больше всего радуют. Поскольку несколько компаний конкурируют в этой области, я думаю, мы увидим огромный прогресс за очень короткое время.
Конечно, будут неловкие ошибки, как и со всеми ИИ-технологиями, но сама суть этой технологии заключается в том, что она учится на каждом взаимодействии.
Я не думаю, что пройдет много времени, прежде чем мы сможем делать такие вещи, как навести iPhone на случайный продукт, который мы видим в магазине или на улице, и мгновенно получить средний звездный рейтинг и приличный ИИ-обзор отзывов. Обычно Apple говорит нам, что компания не может дождаться, чтобы увидеть, что мы сделаем с их новой технологией, но в данном случае все обстоит наоборот.
Если у вас есть доступ (в моем случае это заняло пару недель), каковы ваши первые впечатления от Visual Intelligence? Пожалуйста, поделитесь своими мыслями в комментариях и посмотрите видео Фернандо ниже.
Фото: 9to5Mac