Created with Sketch.

Революція в штучному інтелекті?

08 липня, 17:46

Grok 4 показує 45 % у «Останньому екзамені людства»

Маск каже, що завтра представлять Grok 4 — найкращу модель штучного інтелекту.
Випадково чи невипадково, фейк чи ні, але в мережі вже гуляють результати тестів Grok 4.

Якщо вони реальні, то ми говоримо про дуже великий крок уперед. Ну майже революцію. Складно сказати, доки не отримаєш доступ. З іншого боку, й чекати недовго.

Але якщо результати коректні, вони показують справжній прорив в одному з ключових тестів, який називається «Останній екзамен людства».

Я писав про нього, кину пост у коментар. Це один із найскладніших тестів, створений понад 1000 експертів із 50 країн, і він охоплює дуже широкий спектр передових наукових знань.

Коли я писав про це кілька тижнів тому, зазначав, що прогнозують: моделі будуть вирішувати 50 % задач у цьому тесті десь до кінця 2025 року. Нагадаю: станом на кінець 2024 року більшість моделей набирала 1–2 % у цьому тесті, а найкращий результат був у o1 — 8 %.
Найкращий результат станом на червень був у o3 (OpenAI) та Gemini 2.5 Pro — 20–21 %.

Так от, для Grok 4 із розмірковуванням результат гуляє на рівні 45 % вже зараз (!). А до кінця 2025 року ще дуже багато часу.

Тож подивимось. Ваші очікування?

Читайте також
«Архітектори штучного інтелекту» стали «Людьми року 2025» за версією Time
Світ
росія опинилася на узбіччі глобальної гонки штучного інтелекту — The Wall Street Journal
Світ
ChatGPT дає небезпечні поради людям із психічними проблемами — дослідження
Світ
Сер Пол Маккартні проти ШІ: музикант записав оригінальний трек
Мистецтво
Google звинувачують у шпигунстві через Gemini AI
Світ
OpenAI закликає адміністрацію Трампа до «енергетичної революції» для лідерства США в ШІ
Світ