Компанії почали нормувати пропозиції та продукти.
«Золота лихоманка» штучного інтелекту швидко виснажує запас обчислювальної потужності, що призводить до проблем ШІ-компаній. Вони почали нормувати пропозиції та продукти, що дратує користувачів.
Про це пише Wall Street Journal.
За даними видання, з осені різко зросла погодинна оренда графічних процесорів, мікрочипів, що використовуються для навчання й запуску моделей штучного інтелекту.
Anthropic, розробник чат-бота Claude і програми для вірусного кодування Claude Code, віднедавна страждає від частих перебоїв у роботі. Компанія почала обмежувати обсяг обчислювальних ресурсів для користувачів у пікові години, але зіткнулася зі скаргами клієнтів, які казали, що занадто швидко досягають ліміту.
Компанія OpenAI, розробник Chat GPT, частково відмовилася від свого застосунку для генерації відео Sora, щоб звільнити обчислювальні ресурси для розробки коду й корпоративних продуктів, які працювали б на новій моделі штучного інтелекту, під кодовою назвою Spud.
Сара Фріар, фінансова директорка OpenAI, поділилися, що присвячує багато часу тому, аби знайти будь-які доступні обчислювальні ресурси: «Наразі ми робимо дуже складні угоди щодо речей, які ми не прагнемо реалізувати, бо у нас недостатньо обчислювальних ресурсів».
Використання токенів в API OpenAI — платформі, якою здебільшого користуються корпоративні користувачі, — зросло із шести мільярдів на хвилину в жовтні до 15 мільярдів на хвилину наприкінці березня.
За даними нью-йоркської платформи Ornn, спотові ціни на доступ до графічних процесорів Nvidia у хмарних центрах обробки даних різко зросли за останні місяці для всієї лінійки продуктів компанії.
Згідно з індексом цін Ornn Compute Price Index, оренда одного з найсучасніших чіпів Nvidia покоління Blackwell на одну годину коштує 4,08 долара — це на 48% більше, ніж 2,75 долара два місяці тому.
«Спостерігається величезний дефіцит потужностей, якого я не бачив за понад п’ять років, що керую цим бізнесом. Чому ми просто не розгорнемо більше обладнання? Терміни реалізації занадто довгі. Час будівництва центрів обробки даних великий, а потужність, доступна до 2026 року, вже повністю вичерпана», — сказав Джей Джей Кардвелл, головний виконавчий директор Vultr, компанії з хмарної інфраструктури.
Wall Street Journal порівнює нинішню ситуацію із проблемами під час попередніх технологічних бумів — від розширення залізниць у XIX столітті до буму телекомунікацій та інтернету на початку 2000-х років.