Революція в штучному інтелекті?

Опінії

08.07.2025, 17:46

Grok 4 показує 45 % у «Останньому екзамені людства»

Bandura Volodymyr

Генеральний директор компанії Innolytics Group

Маск каже, що завтра представлять Grok 4 — найкращу модель штучного інтелекту.
Випадково чи невипадково, фейк чи ні, але в мережі вже гуляють результати тестів Grok 4.

Якщо вони реальні, то ми говоримо про дуже великий крок уперед. Ну майже революцію. Складно сказати, доки не отримаєш доступ. З іншого боку, й чекати недовго.

Але якщо результати коректні, вони показують справжній прорив в одному з ключових тестів, який називається «Останній екзамен людства».

Я писав про нього, кину пост у коментар. Це один із найскладніших тестів, створений понад 1000 експертів із 50 країн, і він охоплює дуже широкий спектр передових наукових знань.

Коли я писав про це кілька тижнів тому, зазначав, що прогнозують: моделі будуть вирішувати 50 % задач у цьому тесті десь до кінця 2025 року. Нагадаю: станом на кінець 2024 року більшість моделей набирала 1–2 % у цьому тесті, а найкращий результат був у o1 — 8 %.
Найкращий результат станом на червень був у o3 (OpenAI) та Gemini 2.5 Pro — 20–21 %.

Так от, для Grok 4 із розмірковуванням результат гуляє на рівні 45 % вже зараз (!). А до кінця 2025 року ще дуже багато часу.

Тож подивимось. Ваші очікування?

Технології Ілон Маск Grok Штучний інтелект

Читайте також:

Світ

Meta витратить до $145 млрд на ШІ, але результати поки відстають від очікувань

Цукерберг заявив, що очікує більш помітної віддачі від інвестицій у штучний інтелект у найближчі три–шість місяців.

03 липня, 13:16

Світ

Штучний інтелект почав вигравати суди – FT

Клієнтка повернула понад $9 тис. боргу, витративши лише близько $500 на послуги юридичної фірми зі штучним інтелектом.

24 червня, 11:45

Світ

The Economist: Нова ШІ-модель Mythos від Anthropic за кілька годин зламала секретні бази даних АНБ

Модель ШІ Mythos від компанії Anthropic усього за кілька годин зламала бази даних американської розвідки АНБ.

22 червня, 17:01

Політика

Трамп наказав закрити доступ іноземцям до останніх моделей Claude

Компанія Anthropic обмежила доступ іноземцям до найновіших моделей штучного інтелекту Claude через указ президента США.

14 червня, 15:05

Війна

У Сінгапурі назвали штучний інтелект небезпечнішим за ядерну зброю

«Це величезний ризик ескалації війни».

31 травня, 07:05

Світ

ШІ почав погрожувати: Claude шантажував користувача, який хотів його відключити

Claude від Anthropic вдався до шантажу, погрожуючи викрити позашлюбний зв’язок користувача, який нібито хотів його деактивувати.

11 травня, 06:09