От уявіть собі: OpenAI заявляє, що їхній новий штучний інтелект o3 показав результат, який можна порівняти з людиною! У тесті ARC-AGI (Abstract Reasoning Corpus – Artificial General Intelligence) ця модель набрала цілих 85%. Для порівняння, попередні моделі “застрягли” десь на рівні 55%. Звучить вражаюче, правда? Але чи це означає, що o3 вже мислить, як ми з вами? Давайте розберемося.
Що це за тест і чому всі про нього говорять
ARC-AGI — це такий собі інтелектуальний екзамен для ІІ, який перевіряє, як система справляється із задачами на логіку та просторове мислення. Уявіть, що вас запитують: “Що спільного між цими формами?” або “Яка закономірність у цьому ряді чисел?” Саме такі виклики проходить модель. І тут o3, без сумніву, видала крутий результат. Але важливо розуміти: цей тест охоплює лише вузьку сферу завдань, а не всеохопний інтелект.
Чим же особлива ця модель
Якщо коротко, o3 — це оновлена версія попередніх моделей OpenAI, і вона явно вміє більше. Хоча компанія поки що тримає в секреті деталі її архітектури, можна припустити, що вони не створювали все з нуля. Швидше за все, вони вдосконалили вже існуючі підходи, як це було з попередніми моделями.
Наприклад, у моделі o1 використовувалася цікава штука — “test-time compute”. Це коли штучний інтелект отримує більше часу та ресурсів, аби ретельно “подумати” над задачею. Можливо, з o3 вони пішли тим самим шляхом, просто додали кілька нових трюків.
А що з AGI
Отут вже починається найцікавіше. AGI, або ж штучний загальний інтелект, — це така собі мрія інженерів: машина, яка мислить і вчиться, як людина. І хоча o3 досягла значного прогресу, це ще не AGI. Навіть самі розробники OpenAI кажуть, що до цього ще далеко.
До речі, знаєте, що цікаво? У OpenAI є угода з Microsoft, за якою партнерство припиниться, якщо їхні моделі досягнуть рівня AGI. Тож якби це сталося, ми б точно вже знали. Але поки що все вказує на те, що o3 — це лише крок у цьому напрямку.
Що чекати далі
Ну, тут гадати можна довго. Зрозуміло одне: OpenAI знову показали, що вони на гребені хвилі, але поки що o3 — це лише інструмент для дуже специфічних завдань. А що ж далі? Можливо, вони готують щось грандіозне, наприклад, GPT-5. Кажуть, його реліз запланований на кінець цього року. Побачимо.

