Із ChatGPT тепер можна розмовляти
В одному з найбільших оновлень ChatGPT, OpenAI запустила два нових способи взаємодії зі своїм застосунком
Перше оновлення, ChatGPT отримав голос. Варто обрати один з п’яти синтетичних голосів, і можна спілкуватися з чат-ботом ніби телефоном, отримуючи відповіді в режимі реального часу.
У ChatGPT також додана функція розпізнання зображень, це означає, що тепер можна завантажувати зображення в застосунок і запитувати його про те, що на них зображено.
Про це повідомляє передає MIT Technologie Review.
Ці оновлення доповнюють оголошення минулого тижня про те, що DALL-E 3, останню версію моделі створення зображень OpenAI, під’єднають до ChatGPT та навчать чат-бота генерувати зображення.
Голосове спілкування ChatGPT базується на двох окремих моделях.
- Whisper, нинішня модель перетворення мови в текст OpenAI, перетворює голос на текст, який потім передає чат-боту.
- А нова модель перетворення тексту в мову перетворює відповіді ChatGPT у вимовлені слова.
У демонстраційному ролику, який компанія надала обмеженому числу журналістів минулого тижня, Джоанна Джанг, продакт-менеджер, продемонструвала асортимент голосів ChatGPT. Вони були створені шляхом навчання моделі перетворення тексту в мову на голосах акторів, яких найняла OpenAI. У майбутньому це може навіть дати змогу користувачам створювати власні голоси.