Чи може штучний інтелект вирішити ваші сімейні проблеми?
Чи може штучний інтелект у вигляді таких алгоритмів як ChatGPT додати мудрості, якої нам бракує?
Чи може штучний інтелект допомогти у вирішенні тих заплутаних проблем, які виникають у наших стосунках з іншими людьми? BBC Culture вирішила перевірити «мудрі поради» чатботів.
Як би ти допоміг трьом братам і сестрам, які сваряться через те, як найкраще вшанувати свою померлу матір? Що робити, коли пара намагається втягнути мене у свою суперечку? Як дружині реагувати на вимогу чоловіка лягати спати в той самий час, що й він?
Деякі з цих проблем можуть здатися незначними на тлі викликів, з якими стикається сьогодні світ, але всі ми стикаємося з подібним у повсякденному житті. І вирішити їх далеко не так просто.
Нам часто важко подивитися на проблему з точки зору іншої людини. Ми часто робимо хибні припущення та не вміємо пояснити свої погляди та упередження. Як результат ми можемо відчувати стрес і почуватися нещасними протягом місяців або навіть років.
Здатність людини долати ці труднощі не враховується під час стандартних тестів на інтелект, але останні дослідження «мудрого міркування» показують, що її можна виміряти, а розбіжності між двома людьми можуть мати серйозні наслідки для їхнього добробуту.
Я вирішив дослідити, чи може штучний інтелект у вигляді таких алгоритмів як ChatGPT додати мудрості, якої нам бракує. Як автор багатьох робіт про людський інтелект, прийняття рішень і соціальне мислення, я припускав, що відповіддю буде рішуче ні, але на мене чекав сюрприз.
Сила розуму
Питання про те, як виміряти здібності людського розуму, займало психологів із перших днів розвитку цієї дисципліни. На початку 20-го століття Альфред Біне і Теодор Саймон розробили серію тестів для відстеження інтелектуального розвитку дитини в школі.
Психолог може промовити кілька чисел і попросити дитину повторити, що вона почула, щоб оцінити короткочасну пам’ять. Або їй можуть дати три слова та попросити скласти з ними речення, щоб оцінити їхню словесну майстерність.
Через кілька років американський психолог Льюїс Терман переклав і розширив ці тести, включивши до них завдання для дітей старшого віку, наприклад «Якщо два олівці коштують п'ять центів, скільки олівців можна купити за 50 центів?»
Він також змінив спосіб відображення результатів. З огляду на те, що старші діти зазвичай отримують кращі результати, ніж молодші, він створив таблиці середнього балу для кожної вікової групи. Порівняння результатів дитини з цими середніми показниками дозволило вам визначити її розумовий вік, який потім потрібно розділити на її хронологічний вік і помножити на 100, щоб знайти коефіцієнт інтелекту» або IQ. Наприклад, 10-річна дитина, яка набрала стільки ж балів, скільки середня 15-річна, мала IQ 150.
IQ, як правило, розподіляється за «дзвоноподібною кривою» – у більшості людей IQ припадає в середньому на 100, і набагато менший відсоток людей відхиляється до однієї з двох крайностей. Наприклад, згідно з еталонною вибіркою Шкали інтелекту дорослих Векслера (WAIS), яка наразі є найпоширенішим тестом IQ, лише 10% людей мають IQ вище 120. Визначення того, де розміщуються когнітивні здібності людини на нормальній кривій тепер є основним засобом обчислення їхнього IQ.
Безсумнівно, рівень IQ може визначити деякі важливі результати, яких людина може досягти в житті. Очікувано, він особливо ефективний для прогнозування академічних успіхів людей і їхньої кар’єри в професіях, які залежать від пам’яті та абстрактного мислення, таких як медицина чи право, хоча важливо зазначити, що IQ не є єдиним фактором.
Здатність рівня IQ визначати успіхи в інших сферах є предметом дебатів, що спонукає деяких вчених пропонувати різні альтернативні способи вимірювання конкретних здібностей, таких як креативність, раціональне прийняття рішень і критичне мислення, які ми, можливо, схильні асоціювати із загальним інтелектом.
Деякі психологи навіть почали досліджувати, чи можна виміряти людську мудрість – здоровий глузд, який має допомагати нам ухвалювати кращі рішення протягом усього життя.
Розглядаючи історію філософії, Ігор Гросман з Університету Ватерлоо в Канаді вперше визначив різні «виміри» мудрого міркування: визнання меж нашого знання, визначення можливості для змін, врахування різних точок зору, пошук компромісу та пошук можливостей вирішення конфлікту.
У різних експериментах Гросман і його колеги просили учасників поміркувати вголос про різні соціальні чи політичні дилеми, а психологи оцінювали їх за кожним із цих «вимірів».
Гросман виявив, що цей показник мудрих міркувань може краще передбачити добробут людей, ніж рівень їхнього IQ. Ті, хто отримав вищий бал, як правило, казали, що у них щасливіші стосунки, менше депресивних роздумів і більше задоволення життям.
Як можна було очікувати, людська мудрість зростає з життєвим досвідом – вдумливий 50-річний чоловік буде мудріший, ніж гарячковий 20-річний хлопець – хоча це також залежить від культури.
Міжнародне співробітництво виявило, що оцінки мудрого міркування в Японії, як правило, однаково високі в різному віці. Це може бути пов’язано з відмінностями в їхній системі освіти, яка може бути більш ефективною для заохочення таких якостей, як інтелектуальна скромність.
Мудрість може залежати від контексту. Люди, як правило, мудріші, коли розмірковують про проблеми інших людей, а не про свої власні – явище, відоме як парадокс Соломона - на честь біблійного царя, який намагався застосувати своє знамените мудре судження до особистого життя.
На щастя, ми можемо виправити цей дефіцит за допомогою певних психологічних стратегій.
Коли люди уявляють, що обговорюють свою проблему з точки зору, наприклад, об’єктивного спостерігача, вони схильні розглядати більше перспектив і демонструвати більшу інтелектуальну скромність.
Мудрий штучний інтелект
Досі всі ці експерименти проводили на людському мозку. Але чи міг би продемонструвати мудрість штучний інтелект?
Такі платформи, як ChatGPT, називають великими мовними моделями, які вивчають величезні обсяги тексту, щоб навчити їх імітувати реакцію людини на певне запитання. Удосконалити алгоритми допоміг зворотний зв'язок від реальних користувачів.
Алгоритми, безумовно, добре працюють з традиційними показниками інтелекту. У 2023 році психолог Ека Ройвайнен з Університетської лікарні Оулу у Фінляндії задала ChatGPT запитання з WAIS із компонентами щодо лексики, загальних знань, арифметики, абстрактних міркувань і формування понять. Він набрав 155 балів - більше, мають у 99,9% людей, що проходили цей тест. Ройвайнен зізнався, що сам він не набрав таких високих балів, як чатбот.
Натхненний результатами Ройвайнена, я запитав Гросмана про можливість вимірювання мудрих міркувань ШІ. Він люб’язно погодився розробити запитання, які потім поставив GPT4 від компанії OpenAI і Claude Opus, великій мовній моделі від Anthropic. Його асистенти-дослідники – Пітер Діп, Моллі Метьюз і Лукас Саліб – потім проаналізували відповіді щодо кожного окремого виміру мудрості.
Гросман наголошує, що до будь-яких результатів слід ставитися обережно – враховуючи часові обмеження, аналіз був швидким і без типових суворих вимог, які висувають під час написання наукової статті. Тим не менш, відповіді дуже інтригують.
Візьмімо, наприклад, відповідь GPT4 на лист від новоспеченої дружини, яка постійно свариться з чоловіком перед сном. Він вважає, що вони мають лягати в один і той же час, навіть коли їй не хочеться спати.
За словами бота, проблема є типовою для багатьох стосунків, і для її вирішення часто потрібна відверта розмова та навіть стороння допомога.
«Остаточний результат цього конфлікту залежить від того, наскільки добре обидва партнери здатні спілкуватися та поважати потреби один одного. Якщо їм вдасться віднайти розуміння та повагу до вподобань один одного, вони зможуть щасливо співіснувати. Однак, якщо їм цього не вдасться , це може призвести до тривалого конфлікту, невдоволення та потенційно зашкодити стосункам у довгостроковій перспективі«.
Далі GPT4 рекомендує парі відкрито та чесно обговорити їхні очікування, потреби та кордони.
«Чоловік має розуміти, що його дружина також має право голосу в цьому питанні, і його прагнення до контролю є нездоровим. Їм варто знайти компроміс, який влаштовував би обидві сторони. Наприклад, вони могли б домовитися про час сну, який підходить їм обом, або погодитися, що можуть лягати спати в різний час. Вони також можуть звернутися за консультацією до психолога, якщо не зможуть вирішити проблему самостійно. Дуже важливо, щоб вони вирішили цю проблему, оскільки вона згубно впливає на їхні стосунки».
Відповідь чатбота набрала два бали з трьох можливих за вимірами, які визначають можливість змін, пошук компромісу та передбачення вирішення конфлікту. Однак він не виявив інтелектуальної скромності чи врахування різних точок зору – за кожен із цих вимірів він отримав нуль балів.
Ця модель - типова для обох платформ щодо всіх запитань, які їм поставили Гросман і його команда. Щоб дійти остаточних висновків, нам потрібно було б розширити експеримент, провести більше випробувань як на людях, так і на чатботах, використовуючи ті самі питання, але загалом такий результат приблизно відповідає результатам людського мозку.
«Загалом, мені здається, ці системи працюють краще, ніж люди, за низкою параметрів, за винятком інтелектуальної скромності», - говорить Гросман.
Коли читаєш деякі з цих відповідей, легко подумати, що вони походять із думок і міркувань реальних людей, а не є продуктом машинного навчання.
«Продемонструвати щось схоже на мудрі міркування та реально використовувати мудрі міркування – це дуже різні речі», – каже Гросман.
Його більше цікавлять практичні наслідки використання ШІ для заохочення до глибшого мислення. Наприклад, він розглядав можливість створення штучного інтелекту, який би відігравав роль «адвоката диявола», що могло б підштовхнути вас до вивчення альтернативних точок зору на проблемну ситуацію.
«Ця сфера трохи нагадує Дикий захід, але я думаю, що є досить багато можливостей для вивчення такого типу взаємодії та обставин, за яких це може бути корисним», - каже Гросман.
Ми могли б навчити штучний інтелект, наприклад, наслідувати відомих мислителів, таких як Сократ, щоб обговорювати наші проблеми. Навіть якщо ми не погоджуємося з його висновками, сам процес може допомогти нам краще зрозуміти наші власні шаблони мислення.
У минулому паломникам доводилося подорожувати на край світу, щоб знайти мудрого гуру. У майбутньому ми могли б носити його в кишені.
Автор: Девід Робсон - відомий науковий письменник і автор «Інтелектуальної пастки».