Революція в штучному інтелекті?

Опінії
08.07.2025, 17:46
Революція в штучному інтелекті?

Grok 4 показує 45 % у «Останньому екзамені людства»

Генеральний директор компанії Innolytics Group

Маск каже, що завтра представлять Grok 4 — найкращу модель штучного інтелекту.
Випадково чи невипадково, фейк чи ні, але в мережі вже гуляють результати тестів Grok 4.

Якщо вони реальні, то ми говоримо про дуже великий крок уперед. Ну майже революцію. Складно сказати, доки не отримаєш доступ. З іншого боку, й чекати недовго.

Але якщо результати коректні, вони показують справжній прорив в одному з ключових тестів, який називається «Останній екзамен людства».

Я писав про нього, кину пост у коментар. Це один із найскладніших тестів, створений понад 1000 експертів із 50 країн, і він охоплює дуже широкий спектр передових наукових знань.

Коли я писав про це кілька тижнів тому, зазначав, що прогнозують: моделі будуть вирішувати 50 % задач у цьому тесті десь до кінця 2025 року. Нагадаю: станом на кінець 2024 року більшість моделей набирала 1–2 % у цьому тесті, а найкращий результат був у o1 — 8 %.
Найкращий результат станом на червень був у o3 (OpenAI) та Gemini 2.5 Pro — 20–21 %.

Так от, для Grok 4 із розмірковуванням результат гуляє на рівні 45 % вже зараз (!). А до кінця 2025 року ще дуже багато часу.

Тож подивимось. Ваші очікування?

Читайте також:
Світ
Claude від Anthropic вдався до шантажу, погрожуючи викрити позашлюбний зв’язок користувача, який нібито хотів його деактивувати.
11 травня, 06:09
Опінії
Цифровий Апокаліпсис: чи стане штучний інтелект кінцем цивілізації?
07 травня, 13:28
Політика
Розмови зі ШІ не мають захисту, як професійна таємниця лікаря, адвоката чи терапевта, тому поліція активно їх вивчає.
03 травня, 13:51
Політика
Зокрема, вона надаватиме Пентагону доступ до ШІ для «будь-яких законних урядових цілей».
29 квітня, 08:26
Політика
Штучний інтелект ускладнює працевлаштування молоді.
23 березня, 07:33
Політика
Компанія Meta, якій належать Facebook, Instagram та WhatsApp, планує масштабні звільнення, які можуть зачепити 20% працівників компанії.
14 березня, 14:25