Підписуйтеся на наш телеграм канал!

Штучний інтелект навчився видавати себе за людину: що з цим робити та як відрізнити ШІ

4:28 pm, 12 Травня, 2023

Колишній голова відділу розробки продуктів в Uber Кріс Саад розробив нову платформу для оцінки рівня інтелекту штучного інтелекту. Фреймворк заснований на теорії про те, що ШІ не є монолітною конструкцією. За словами Саада, платформа має замінити стандартний тест Тюрінга.

ШІ став популярною темою протягом останніх декількох місяців, після запуску чат-бота ChatGPT. Користувачі протестували його у багатьох різних галузях, від написання віршів до кодування і навіть комерційних пропозицій. Результати роботи штучного інтелекту не лише вражають, а й викликають побоювання — за словами аналітиків, ШІ вже давно навчився видавати себе за людину.

Розповідаємо детальніше про нову платформу від Кріса Саада, її відмінність від тесту Тюрінга та потенційні можливості ШІ.

Що таке тест Тюрінга?
Тест Тюрінга запропонував Алан Тюрінг у статті «Обчислювальні машини та розум», опублікованій у 1950 році у філософському журналі Mind. Вчений поставив за мету визначити, чи може машина мислити. Втім, системи ШІ пройшли довгий шлях модернізації з появи тесту понад 70 років тому.

Ідея перевірки передбачала спілкування людини з іншою, використовуючи комп’ютерну програму протягом п’яти хвилин лише у текстовому режимі. Якщо комп’ютер зможе обдурити щонайменше 30% співрозмовників, тест вважається пройденим. Експерти спілкуються одночасно з живою людиною та роботом, перебуваючи у різних кімнатах. Після закінчення тесту кожен із них має сказати, хто із двох його співрозмовників був людиною, а хто — ШІ.

Коли тест був пройдений вперше?
Тест Тюрінга намагалися пройти з 1960-х років, втім лише нещодавно це вдалося програмі Eugene Goostman, яка видавала себе за 13-річного хлопчика на ім'я Євген Густман з Одеси. Програма переконала людей, які спілкувалися з нею, що вона теж людина. ШІ Google LaMDA також успішно пройшов тест Тюрінга.

У чому проблема тесту?
Тест Тюрінга працює за спрощеною схемою «пройдено/не пройдено» та значною мірою фокусується на лінгвістичних можливостях, які є лише одним із аспектів людського інтелекту. Він ігнорує багато інших важливих показників, таких як вирішення проблем, творчість та соціальна поінформованість.

Що запропонували натомість і як це працює?
Кріс Саад назвав свою концепцію «ідеальною основою для фреймворку класифікації ШІ». Вона оцінює ШІ на декількох рівнях:

  • лінгвістично-вербальному,
  • логіко-математичному,
  • музичному,
  • візуально-просторовому,
  • тілесно-кінестетичному,
  • міжособистісному,
  • внутрішньоособистісному інтелекту.

Для кожного вимірювання інтелекту ШІ схема пропонує шкалу від 1 до 5, де 1 — No Capability («нездатний»), а 5 — Self-agency («самостійний»). П’ятий рівень еквівалентний «надрозуму», чий інтелект вищий за людські здібності.

Як впорався ChatGPT?
Відповідно до тесту Саада, ChatGPT отримав оцінку 3 з двох показників: лінгвістично-вербального та логіко-математичного.

Це означає, що чат-бот генерує та/або аналізує абсолютно нові математичні формули та докази експертного рівня. Також ШІ створює та/або аналізує абсолютно новий письмовий контент експертного рівня.

Щодо тесту Тюрінга, наприкінці березня оновлений GPT-4 зміг пройти тест, прикинувшись сліпим і найнявши людину, щоб обійти «капчу». Нагадаємо — нещодавно ChatGPT склав іспит на отримання лікарської ліцензії у США. Він також пройшов співбесіду в Google на посаду молодшого інженера-програміста і склав університетський іспит з управління бізнесом на середньому рівні. За допомогою ШІ судді вже приймають рішення по реальних справах, а медіакомпанії використовують чат-бот для написання матеріалів.

Підписуйтеся на наш телеграм канал!

BTC

$62,958.04

-4.89%

ETH

$3,077.56

-5.14%

BNB

$541.71

-6.67%

XRP

$0.49

-4.81%

SOL

$134.74

-11.28%

Всі курси
Підписуйтеся на наш
телеграм канал!
Свіжі новини та огляди
ринків криптовалют останньої
доби прямо у вашому мессенджері. Чекаємо на вас!
ПЕРЕЙТИ
Показати більше