Created with Sketch.

Революція в штучному інтелекті?

08.07.2025, 17:46

Grok 4 показує 45 % у «Останньому екзамені людства»

Маск каже, що завтра представлять Grok 4 — найкращу модель штучного інтелекту.
Випадково чи невипадково, фейк чи ні, але в мережі вже гуляють результати тестів Grok 4.

Якщо вони реальні, то ми говоримо про дуже великий крок уперед. Ну майже революцію. Складно сказати, доки не отримаєш доступ. З іншого боку, й чекати недовго.

Але якщо результати коректні, вони показують справжній прорив в одному з ключових тестів, який називається «Останній екзамен людства».

Я писав про нього, кину пост у коментар. Це один із найскладніших тестів, створений понад 1000 експертів із 50 країн, і він охоплює дуже широкий спектр передових наукових знань.

Коли я писав про це кілька тижнів тому, зазначав, що прогнозують: моделі будуть вирішувати 50 % задач у цьому тесті десь до кінця 2025 року. Нагадаю: станом на кінець 2024 року більшість моделей набирала 1–2 % у цьому тесті, а найкращий результат був у o1 — 8 %.
Найкращий результат станом на червень був у o3 (OpenAI) та Gemini 2.5 Pro — 20–21 %.

Так от, для Grok 4 із розмірковуванням результат гуляє на рівні 45 % вже зараз (!). А до кінця 2025 року ще дуже багато часу.

Тож подивимось. Ваші очікування?

Читайте також
Meta планує масштабні звільнення працівників на тлі зростання витрат на ШІ — Reuters
Політика
До 2030 року штучному інтелекту потрібні будуть мільярди літрів води на день
Спорт
Китай створить робочі місця за допомогою ШІ
Політика
Папа Римський закликав священників припинити писати проповіді за допомогою ШІ
Політика
Штучний інтелект посварився з розробником
Світ
Пентагон використав ШІ під час рейду у Венесуелі для захоплення Мадуро — WSJ
Світ