Підписуйтеся на наш телеграм канал!
Науковці заявили, що штучний інтелект повністю осягнув людський розум
Нове дослідження науковців з Медичного центру Гамбург-Еппендорф у Німеччині показало, що великі мовні моделі можуть імітувати здатність розуміти психічний стан інших людей, відому як теорія розуму.
Вчені провели ретельні тестування кількох мовних моделей, включно з GPT-4 від OpenAI й Llama 2−70b від Meta, а також 1 907 людей. Тести включали п’ять типових завдань теорії розуму:
- Розуміння натяків: Учасникам пропонували ситуації, в яких потрібно було розпізнати приховані значення або недомовлені повідомлення.
- Іронія: Учасники повинні були визначити, коли сказане мало на увазі протилежне значення.
- Соціальні помилки: Завдання включали ситуації, де хтось випадково робив соціальну помилку, і потрібно було визначити, чи помітив він це.
- Помилкові переконання: Тести перевіряли, чи можуть учасники зрозуміти, що людина може мати хибне уявлення про ситуацію (наприклад, де хтось шукає предмет, переміщений за його відсутності).
- Складні історії: Учасники аналізували історії із заплутаними ситуаціями, де персонажі брехали, маніпулювали або не розуміли один одного.
GPT-4 показав результати, які можна порівняти з людськими у тестах на помилкові переконання, і навіть перевершив людей у завданнях на іронію, натяки та складні історії. Однак він поступився в тесті на соціальні помилки.
Модель Llama-2, навпаки, показала хороші результати в тестах на хибні переконання, але гірше впоралася із завданнями на іронію, натяки та складні історії, при цьому краще впоравшись із соціальними помилками.
Дослідники підкреслюють, що результати не доводять наявність теорії розуму у мовних моделей. Вони лише показують, що моделі можуть демонструвати поведінку, схожу на людську в таких завданнях. Деякі експерти закликають з обережністю сприймати результати дослідження, а також попереджають про можливі ризики та помилкові висновки.
Нагадаємо — співзасновник Ethereum Віталік Бутерін заявив, що GPT-4 успішно пройшов тест Тюрінга. За результатами дослідження, люди помилково вважали GPT-4 людиною в 56% випадків. Бутерін наголосив на значущості досягнення, зазначивши, що подолання етапу тесту Тюрінга є важливою віхою, що підтверджує серйозність досягнень у галузі ШІ.