Created with Sketch.

Революція в штучному інтелекті?

08 липня, 17:46

Grok 4 показує 45 % у «Останньому екзамені людства»

Маск каже, що завтра представлять Grok 4 — найкращу модель штучного інтелекту.
Випадково чи невипадково, фейк чи ні, але в мережі вже гуляють результати тестів Grok 4.

Якщо вони реальні, то ми говоримо про дуже великий крок уперед. Ну майже революцію. Складно сказати, доки не отримаєш доступ. З іншого боку, й чекати недовго.

Але якщо результати коректні, вони показують справжній прорив в одному з ключових тестів, який називається «Останній екзамен людства».

Я писав про нього, кину пост у коментар. Це один із найскладніших тестів, створений понад 1000 експертів із 50 країн, і він охоплює дуже широкий спектр передових наукових знань.

Коли я писав про це кілька тижнів тому, зазначав, що прогнозують: моделі будуть вирішувати 50 % задач у цьому тесті десь до кінця 2025 року. Нагадаю: станом на кінець 2024 року більшість моделей набирала 1–2 % у цьому тесті, а найкращий результат був у o1 — 8 %.
Найкращий результат станом на червень був у o3 (OpenAI) та Gemini 2.5 Pro — 20–21 %.

Так от, для Grok 4 із розмірковуванням результат гуляє на рівні 45 % вже зараз (!). А до кінця 2025 року ще дуже багато часу.

Тож подивимось. Ваші очікування?

Читайте також
Сем Альтман: OpenAI зобов’язана передавати діалоги з ChatGPT владі за запитом суду
Політика
Гендиректор OpenAI розповів про небезпеку, яку несе штучний інтелект
Світ
Штучний інтелект отримав «золоту медаль» на Міжнародній математичній олімпіаді
Світ
Кількість запитів до ChatGPT становить понад 2,5 млрд на день
Життя
OpenAI запустила функцію ШІ-агента в ChatGPT
Світ
Керівниця платформи X подала у відставку
Політика