
Вслед за Microsoft Build и Google I/O компания Anthropic только что анонсировала Claude 4 Sonnet и Claude 4 Opus, которые сразу же доступны на веб-сайте Claude, а также через API. Вот что нового.
Лучше в кодировании и… Pokémon
По данным Anthropic, Claude Sonnet 4 (его модель среднего уровня, между Raiku и Opus) значительно улучшен в кодировании, рассуждении и следовании инструкциям по сравнению со своим предшественником Claude Sonnet 3.7.
Что касается Claude Opus 4, Anthropic заявляет, что он соответствует или превосходит o3 от OpenAI, GPT-4.1 и Gemini 2.5 Pro в тестах на многоязычные вопросы и ответы, использование инструментов агентом, кодирование в терминале агентом, кодирование агентом и рассуждение на уровне выпускника:

Это особенно важно, поскольку, хотя Claude провел большую часть прошлого года на вершине предпочтительных моделей разработчиков для задач кодирования, в последние недели он отставал после нескольких обновлений моделей от OpenAI и Google.
И говоря о Google, его модель Gemini 2.5 Pro недавно произвела фурор после того, как она прошла игру Pokémon Blue. Anthropic с радостью сообщила, что, хотя ей еще не удалось достичь того же подвига, Claude Opus 4 смог провести игру Pokémon в режиме агента в течение 24 часов, по сравнению с 45 минутами у предыдущей версии.

Новые возможности и Claude Code
Вместе с моделями Anthropic также анонсировала:
• Расширенное мышление с использованием инструментов (бета): Обе модели могут использовать инструменты, такие как веб-поиск, во время расширенного мышления, позволяя Claude чередовать рассуждение и использование инструментов для улучшения ответов.
• Новые возможности моделей: Обе модели могут использовать инструменты параллельно, точнее следовать инструкциям и, при доступе к локальным файлам от разработчиков, демонстрировать значительно улучшенные возможности памяти, извлекая и сохраняя ключевые факты для поддержания непрерывности и накопления неявных знаний с течением времени.
• Claude Code теперь общедоступен: После получения обширных положительных отзывов во время нашего предварительного исследования мы расширяем возможности разработчиков по сотрудничеству с Claude. Claude Code теперь поддерживает фоновые задачи через GitHub Actions и нативные интеграции с VS Code и JetBrains, отображая изменения непосредственно в ваших файлах для бесшовного парного программирования.
• Новые возможности API: Мы выпускаем четыре новые возможности в API Anthropic, которые позволяют разработчикам создавать более мощные ИИ-агенты: инструмент выполнения кода, MCP-коннектор, API файлов и возможность кэшировать запросы на срок до одного часа.
Новости о Claude Code особенно интересны разработчикам, поскольку упоминание Claude через @ и его запуск непосредственно из GitHub PR имеет потенциал для оптимизации процесса разработки.
Anthropic заявляет, что обе модели доступны через API Anthropic и у партнеров, таких как Amazon Bedrock и Google Cloud’s Vertex AI. Opus 4 стоит 15/75 долларов за миллион токенов (входные/выходные данные), а Sonnet 4 стоит 3/15 долларов за миллион токенов (входные/выходные данные).
Используете ли вы Claude или другие LLM на работе? Сообщите нам в комментариях.