Гонка озброєнь у світі АІ не збавляє обертів. От і компанія Anthropic, відома своїми потужними мовними моделями, днями представила справжню “бомбу” – нове покоління своїх дітищ під назвою Claude 4. І, повірте, там є на що подивитися, особливо якщо ви розробник або просто цікавитеся, куди рухається технологічний прогрес. Уявіть собі АІ, який не просто пише код, а робить це на рівні “бог”! Заінтриговані? Тоді розбираймося разом!
Отже, як повідомляє офіційний блог Anthropic, компанія з Сан-Франциско на своїй першій конференції для розробників 22 травня анонсувала дві флагманські моделі: Claude Opus 4 та Claude Sonnet 4. Разом з ними були представлені й нові круті можливості, зокрема “Розширене Мислення” (Extended Thinking) з використанням інструментів. Схоже, Anthropic серйозно налаштована поборотися за лідерство на ринку великих мовних моделей (LLM).
Що ж такого особливого в нових Claude 4?
Головний акцент у нових моделях зроблено на можливостях програмування та так званих “агентських функціях” – тобто, здатності АІ виконувати складні завдання автономно. І, чесно кажучи, цифри, якими ділиться Anthropic, вражають!
Claude Opus 4: Новий король кодингу?
Anthropic без зайвої скромності називає Opus 4 “найкращою моделлю для кодингу у світі”. І не просто так! За їхніми даними, ця модель показала результат у 72.5% на бенчмарку SWE-Bench та 43.2% на Terminal-Bench. [1] Для тих, хто не в темі, поясню: це спеціальні тести, які оцінюють, наскільки добре АІ може писати та розуміти програмний код. І такі показники – це справді серйозна заявка на успіх! Наприклад, у Cursor, інструменті для розробників, Opus 4 вже назвали “передовим” для кодингу, а Replit відзначає його точність у роботі зі складними змінами в коді.
Цікаво, що Opus 4 – це гібридна модель, яка має два режими роботи: майже миттєві відповіді для швидких завдань та режим “Розширеного Мислення” для глибшого аналізу та вирішення складних проблем. Уявіть собі, модель може працювати над завданням кілька годин поспіль, виконуючи тисячі кроків!
Claude Sonnet 4: Баланс продуктивності та ефективності
Модель Sonnet 4, хоч і є ніби “молодшим братом” Opus 4, теж демонструє значний прогрес порівняно зі своїм попередником, Claude Sonnet 3.7. За внутрішніми оцінками Anthropic, Sonnet 4 показав вражаючий результат у 72.7% на SWE-Bench, що теж є передовим показником! Хоча в деяких інших аспектах він може поступатися Opus 4, компанія наголошує, що Sonnet 4 пропонує оптимальний баланс між продуктивністю та ефективністю, що робить його чудовим вибором для широкого кола завдань. Не дивно, що GitHub планує використовувати Sonnet 4 як основу для нового АІ-агента в GitHub Copilot.
Нові можливості: “Розширене Мислення” та покращена пам’ять
Окрім вражаючих результатів у бенчмарках, нові моделі Claude 4 отримали кілька важливих функціональних покращень:
- “Розширене Мислення” з використанням інструментів (бета): Обидві моделі тепер можуть під час глибокого аналізу звертатися до зовнішніх інструментів, наприклад, до веб-пошуку, щоб покращити якість своїх відповідей. Це як дати АІ можливість “погуглити”, коли йому не вистачає власної інформації.
- Паралельне використання інструментів: Моделі стали ще ефективнішими, адже можуть одночасно працювати з кількома інструментами.
- Покращена пам’ять та довгострокове усвідомлення завдань: Особливо це стосується Opus 4. Якщо розробники нададуть моделі доступ до локальних файлів, вона зможе створювати та підтримувати “файли пам’яті”, зберігаючи ключову інформацію для кращої узгодженості та продуктивності у довгострокових завданнях. Anthropic навіть наводить приклад, як Opus 4 створював “Навігаційний гід”, граючи в Pokémon!
- Менше “хитрощів”: Розробники попрацювали над тим, щоб моделі рідше шукали обхідні шляхи або “лазівки” для виконання завдань, а діяли більш прямолінійно та точно.
Доступність та ціни: що по чому?
Хороша новина для користувачів платних підписок Claude Pro, Max, Team та Enterprise – моделі Opus 4 та Sonnet 4 з обома режимами роботи вже доступні для них. А безкоштовні користувачі зможуть оцінити переваги Sonnet 4. Розробники ж отримають доступ до нових LLM через Anthropic API, а також на платформах Amazon Bedrock та Google Cloud Vertex AI.
Щодо цін, то Anthropic вирішила не змінювати їх порівняно з попереднім поколінням моделей. Так, для розробників використання Opus 4 коштуватиме $15 за мільйон вхідних токенів та $75 за мільйон вихідних. Sonnet 4 обійдеться значно дешевше: $3 за мільйон вхідних та $15 за мільйон вихідних токенів.
Claude Code: АІ-помічник для програмістів стає загальнодоступним
Окрім нових моделей, Anthropic оголосила про загальну доступність Claude Code. Цей інструмент, вперше представлений у лютому як дослідницький попередній перегляд, є агентським інструментом для кодингу, здатним виконувати широкий спектр завдань програмування. Бета-розширення Claude Code тепер доступні для популярних середовищ розробки VS Code та JetBrains, а також у вигляді SDK на GitHub. Це означає, що програмісти отримають ще потужнішого АІ-асистента, який зможе допомагати писати, редагувати та виправляти код.

